二四六玄机文字图成功举办第二十一期研究生学术论坛

来源: 作者:汤光裕编辑人:宣传部发稿时间:2022-11-21浏览次数:

为了促进研究生之间的学术交流,探讨前沿科学问题,11月17日下午2:00,二四六玄机文字图第二十一期研究生论坛在崇真楼南楼A1017举办。本次论坛由2021级研究生吕一凡、李熙洋、赵熠和盛鐾主讲,学院研究生会学术部主办。学院欧阳君博士出席了报告会。

吕一凡的报告题目是“Temos:language guided for 3D human motion synthesis with Transformer”。她提到,生成逼真,多样化,可控性的3D人体动作一直是研究的目标。以往的方法只能根据固定标签生成相应的3D骨骼数据,并且仅能处理简单文本生成相应的3D骨骼数据。报告提出了一种基于VAE的跨模态Transformer生成模型,输入句子,生成多样的,合理的3D骨骼数据。从定性定量的角度出发,各项指标都优于之前的方法。

李熙洋的报告题目是“Graphormer-based Contextual Reasoning Network for Small Object Detection”。报告提到小目标检测任务是目标检测领域的一个难点,其旨在精准检测出图像中可视化特征极少的小目标。小目标检测在自动驾驶、智慧医疗、缺陷检测和航拍图像分析等诸多领域发挥着重要作用。为解决上述难题,她以两阶段检测器为基础模型,利用生成的region proposals来构建图结构模型。并通过上下文关系构建模块,提取图结构中的语义和空间布局信息,计算每个节点的权重,从而更新全局特征信息。

赵熠的报告题目是“基于跨模态融合的时尚流行趋势预测方法研究”。针对时尚流行趋势的预测,他们提出了ufashuon跨模态注意力,并基于提出的注意力计算方法设计出了一种跨模态融合模型。对时尚趋势数据和大量用户信息两种模态数据进行不同预处理后并融合,之后通过transformer进行预测,最终得到预测结果。

盛鐾的报告题目是“MultiR-Net: A Novel Joint Learning Network for COVID-19 segmentation and classification”。她讲到在医学图像领域,有注释的、准确的数据集十分稀缺,这为计算机辅助临床医生诊断带来了阻力。如何在最大化模型精度同时最小化所需注释工作量是一项有难度的挑战。为了解决这个问题,以及克服不同标注程度、标注类型的数据为模型训练带来的难度,充分利用有限的、精确的标注数据,他们提出在multi-table deep supervision系统的基础上引入一种灵活的semi-weakly supervision路径来集成未标记或弱标记的图像,并使用deep supervision增强模型的健壮性。同等场景下,与使用高于其近18倍强标签数据的完全监督模型相比,达到了十分接近的效果。

欧阳君博士对每位同学的报告内容进行了点评与指导,同学们就有关问题展开了热烈的讨论,本期研究生学术论坛取得了圆满成功!