软件工程领域国际顶级学术会议ASE 2019(The 34rd IEEE/ACM International Conference on Automated Software Engineering)于11月10日——11月15日在美国圣迭戈召开。浙江大学计算机学院软件工程团队的论文《Automatic Generation of Pull Request Descriptions》获得ACM SIGSOFT杰出论文奖。ASE 2019共接收到445篇论文投稿,经过严格筛选,录用长文85篇,并从中遴选出6篇杰出论文。

在社交编程平台(比如GitHub)上,高质量的拉取请求(Pull Request,简称PR)描述可以降低PR被忽视或拒绝的概率,也能帮助后续的软件维护工作。但是开发者有时会忽视PR描述的撰写。为了缓解这一问题,本获奖论文首次提出PR描述的自动生成问题。并创造性提出将PR描述的自动生成问题看作一个文本总结问题,即,将一个PR中的代码提交日志和开发者添加的注释整合成一篇 “文章”,将这个PR的描述看成这篇“文章”的“摘要”,尝试根据“文章”自动生成“摘要”。

为了解决这一特别的文本总结问题,论文采用了一个新的seq2seq模型,通过指针生成器(pointer generator)和基于强化学习的损失函数分别缓解了软工文档中非常普遍的词库外单词(out-of-vocabulary words)问题和seq2seq模型的最大似然损失跟人工评价不一致的问题。论文还构建了第一个PR描述自动生成问题的数据集,并在该数据集上验证了模型的效果。实验结果显示,论文提出的方法显著优于两个基线方法。


本获奖论文的第一作者是浙江大学计算机学院博士生刘忠鑫,主要合作作者包括其导师李善平教授澳大利亚蒙纳士大学夏鑫等。本论文也是刘忠鑫同学获得的第二篇ACM SIGSOFT杰出论文奖

浙江大学计算机学院软件工程学科团队在软件工程理论,特别是软件解析学、软件仓库挖掘和经验软件工程等方向取得了世界一流的研究成果。近年来在软件工程领域CCF A类的期刊和会议发表论文四十余篇。这是浙大软件工程团队继ICSE 2018和ASE 2018后,第三次获得ACM SIGSOFT杰出论文奖。