软件工程领域世界顶级学术会议ASE 2020The 35th IEEE/ACM International Conference on Automated Software Engineering, CCF A类会议)原定于921-925日在澳大利亚墨尔本召开,受疫情影响改为在线举行。浙江大学计算机科学与技术学院软件工程团队的论文Automating Just-In-Time Comment Updating获得ACM SIGSOFT杰出论文奖软件工程团队已连续三年获得ASE会议的杰出论文奖。

ASE会议是软件工程领域公认的国际顶级会议,每年都有来自世界各地的众多科研人员投稿和参会。据主办方介绍,本次会议共接收到全球414篇论文投稿,经过严格筛选,录用93篇,并从中遴选出7篇杰出论文。软件工程团队的论文成功入选,并且是国内唯一第一单位获得杰出论文奖的团队


浙江大学计算机科学与技术学院软件工程团队在软件分析、软件仓库挖掘、经验软件工程和人工智能测试与分析等方向取得了世界一流的研究成果。近五年在软件工程领域CCF A类期刊和会议发表论文四十余篇。近三年来,五次获得CCF A类会议的杰出论文奖(ICSE 20182020 ASE 2018,20192020)软件工程团队通过20年的产学研合作基础,建立了一支优秀的软件相关科研与技术研发团队,取得了众多国际领先成果,建立了高效的人才培养、科研合作和产业孵化机制,其中与新加坡管理大学、澳大利亚莫纳什大学、澳大利亚国立大学、加拿大不列颠哥伦比亚大学等高校科研合作成绩显著,与美国道富银行、网新恒天、邦盛科技、趣链科技、谐云科技等企业的产业合作和创业孵化也取得丰硕成果,对我国的软件产业以及全球开源社区产生了较大影响。

该获奖论文的第一作者是软件工程团队的博士生刘忠鑫。论文的其他作者包括其导师李善平教授,澳大利亚蒙纳士大学夏鑫老师和重庆大学鄢萌研究员。这是继ASE 2018ASE 2019之后,刘忠鑫同学第三次作为第一作者获得ASE会议的杰出论文奖

在本次会议中,软件工程团队共有4篇长文被录用,以下是相关成果的简介:

Automating Just-In-Time Comment Updating

作者:刘忠鑫,夏鑫,鄢萌,李善平

在软件系统中,注释和代码间的不一致会误导开发者、引入软件缺陷。为应对这一问题,论文提出了即时注释更新(Just-In-Time Comment Updating)任务,即随代码变更即时地更新注释,为该任务构建了第一个大规模数据集,并提出了一种新颖的基于序列到序列模型的方法来自动进行即时注释更新。评估结果显示,该方法正确更新的注释数量是基线方法的8倍,能够减少开发者用于即时注释更新的编辑次数。


API-Misuse Detection Driven by Fine-Grained API-Constraint Knowledge Graph

作者:任晓雪,叶昕源,邢振昌,夏鑫,徐熙炜,祝立明,孙建伶

论文提出了一种新颖的检测API滥用的方法,即利用知识图谱直接针对API使用注意事项来检测API滥用。现有的传统方法往往会根据从代码库中提取的频繁使用API使用模式来检测API滥用。但是,在全面性可解释性实践性而言,API使用模式和API使用注意事项之间存在很大的知识鸿沟。我们开发了开放的信息提取方法,以根据API参考文档构建一个新颖的API约束知识图谱。该知识图谱显式地对两种类型的API约束关系(调用顺序和条件检查)进行建模,并使用返回条件和异常触发器返回和抛出关系。此论文也通过一系列实验证实了提取的API约束关系知识在检测API滥用中有较高的精确度。


Predicting Code Context Models for Software Development Tasks

作者:万志远Gail C. Murphy,夏鑫

代码上下文包含一个编程任务相关的代码元素及元素间的关系。论文提出一种代码上下文预测方法,从程序员与集成开发环境历史交互数据中,挖掘基于代码元素角色的抽象拓扑模式,随后利用模式对不同编程任务进行代码上下文预测。在Mylyn开源项目中,方法预测性能指标F-measure平均为0.57,为Suede方法的2.5倍。


Towards Interpreting Recurrent Neural Networks through Probabilistic Abstraction

作者:董国良王竟亦,孙军,张洋王新宇Ting DaiJin Song Dong王新根

论文基于概率抽象,提出了一种从递归神经网络中提取概率有限自动机的方法。相比于已有工作,该方法显著提高了现有模型提取算法的可扩展性,从而为将各种软件/系统分析技术应用于现实世界的神经网络提供了一个桥梁。