2023年9月26日下午16点,二四六玄机文字图第三十四期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2021级研究生章志鑫、秦忠正、杨启航、文吾琦主讲,学院研究生会主办,学院阮晓莉老师出席了该论坛。
章志鑫同学分享主题是“基于最优运输的表格检索方法”,以给定用户查询对结构化表格对象列表进行排序为目的,解决以往一些方法在较复杂和困难的查询任务中欠佳的检索性能,他提出了基于最优运输的表格检索方法。先将表格序列化为文本,然后利用最优运输对文本进行主题摘要提取,最后通过查询和提取的表格主题摘要对表格对象进行排序。此外,通过改进最优运输的两种搜索策略,进而将其适用于表格检索任务。在多个数据集上进行了实验,并表现出了良好的性能。
秦忠正同学分享的主题是“生成式标签对抗的文本分类模型”,以将文本数据分配到预先定义的类别中为切入点。利用图卷积神经网络与大规模的预训练模型相结合在分类任务中取得了良好的效果。针对GCN在大规模异构图中无向的信息传递产生信息噪声影响模型的判断这一问题,生成式标签对抗模型模型能降低分类时无关信息的干扰,提升模型的分类性能。最后,在多个广泛使用的数据集中进行了实验,实验结果表明在泛用的分类数据集20NG、R8、R52、Ohsumed、MR上,CAGCN模型的分类准确率比BertGCN模型有所提高。
杨启航同学分享的主题是“CREAM: Named Entity Recognition with Concise query and REgion-Aware Minimization”,他基于命名实体识别(NER)领域的兴趣,为了缓解高计算成本,对实体内容信息的有限考虑,以及产生明显边界的倾向等基于mrc的模型所面临的问题,引入了CREAM,一种利用简明查询和区域感知最小化的增强模型。基于实体类别生成简洁的查询,通过有效的连续交叉熵损失来识别整个实体。进一步提供了深入的分析来揭示它们的好处。该方法在六个著名的NER基准上进行了评估。实验结果证明了它的显著有效性,超越了目前最先进的模型。
文吾琦同学分享的主题是“基于多模态嵌入对齐的共语手势生成”,他注意到手势中丰富的多模态信息。在研究中提出了一种用于协同语音手势生成的新型框架,名为"多模态联合嵌入手势生成"(Multimodal Joint Embedding for Gesture,MJEG)。在MJEG中,分层手势编码器提取多模态的手势表征。为了创建逼真生动的协同语音手势,该模型为手势-音频和手势-文本学习了两个联合嵌入。提出了一种嵌入对齐四元对比学习策略,以改进联合嵌入空间的对齐。使用WGAN-GP进行对抗训练,并采用一种新颖的非对称训练方法来加速和平衡GAN学习。广泛的实验表明,所提出的方法能产生逼真的协同语音手势,其性能明显优于以前的方法。