二四六玄机文字图成功举办第三十二期研究生学术论坛

来源: 作者:杨珍编辑人:宣传部发稿时间:2023-07-04浏览次数:

6月29日下午2点,二四六玄机文字图第三十二期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2022级研究生李幸阜,2021级研究生印伟、魏超、龚明康和王魁主讲,学院研究生会主办,学院王兆静博士出席了该论坛。

李幸阜的报告题目是“Applications of Machine Learning in Requirements Traceability: A Systematic Mapping Study”。他主要报告关于机器学习(ML)在需求跟踪(RT)中应用的系统文献综述。他指出,需求跟踪对于软件维护、需求管理和需求变更影响分析等至关重要,机器学习技术在RT中的应用受到了广泛的关注。研究结果表明有32种ML技术和7种用于建立跟踪链接的增强策略。在研究论文使用的众多的数据集中开源数据集是最受欢迎的,这大大提高了研究的可复现性。并且这些原始研究的总体质量处于良好水平。

印伟的报告题目是“基于网络流量的安卓广告软件检测研究”。他指出,近年来安卓设备的使用十分广泛,有大量的APP可供下载使用,同时也存在大量广告软件给用户带来麻烦和不便的现象,并且该种现象对用户隐私也构成了一定威胁。为提高检测的准确性,他设计出一套数据处理方法并设计出一套机器学习算法用于移动设备上检测,并提出一种基于预训练模型的检测系统,通过捕获软件产生的网络流量来动态检测广告软件。该系统具有高精度、高速度和良好的泛化能力,在设计的四个检测任务中实现了最先进的性能。

魏超的报告题目是“基于访问控制日志的ABAC访问控制策略生成方法”,他指出,数据的共享与利用一直以来面临着安全风险,数据被秘密爬取类似事件日益严重。访问控制是保护数据安全的重要手段之一。针对该种现象,基于属性的访问控制(ABAC)具有更高的灵活性,不仅支持大规模信息化系统的细粒度访问控制,还可以支持动态的访问控制。他主要介绍了一种基于访问控制日志的ABAC访问控制策略生成方法,这种基于无监督机器学习算法从日志数据预处理、候选规则挖掘、候选规则筛选、规则优化步骤提取出准确率高、过度授权风险较低的规则。报告结束后,师生们进行了现场提问,魏超对相关专业问题进行了详细的解答。

龚明康的报告题目是“MIRS:[MASK] Insertion based Retrieval Stabilizer for Query Variations”。他指出,预训练语言模型(PLM)极大地推动了文档检索任务的发展。然而最近的研究表明,PLM很容易受到查询变化的影响,即包含拼写错误或单词重新排序等。为了有效解决该问题,他重新审视了掩码语言模型(MLM),并提出了一种鲁棒的微调算法。该算法与现有方法的不同之处在于,将[MASK]标记插入到查询变体中,并进一步鼓励原始查询对其变体之间的向量相似性。通过所提出此方法在检索精度方面平均表现出相对1.8MRR@10绝对点增强。

王魁的报告题目是“一种基于隐式反馈的自学习去噪鲁棒模型”。他指出,隐式反馈数据能有效地缓解推荐系统训练数据稀疏性的问题,但是这类数据因为无法反馈真实的用户-项目偏好,其中包含很多噪声数据,这类噪声数据会严重影响推荐模型的性能。虽然近年来的一些研究在一定程度上增强了推荐模型的鲁棒性,但是这些方法基本都从数据的特性着手。他从推荐模型出发,提出了一种基于样本选择的自学习依赖值评估器模型框架对隐式反馈数据去噪。该模型利用推荐系统性能对隐式反馈数据的依赖性,用一种策略梯度算法以实现依赖值评估器的自主更新。该评估器能有效的筛选依赖样本,利用依赖样本来训练推荐系统。该模型在多个具有代表性的推荐数据集和2个推荐模型上进行了大量实验,实验结果显示推荐性能得到有效提升。