浙江大学软件工程团队在软件工程顶级国际学术会议ICSE 2020上共有11篇长文以浙大为第一单位录用并作宣讲,第一作者单位论文数名列全球第一,在软件工程领域研究继续取得重大进展。ICSE是软件工程领域的顶级会议,中国计算机学会推荐的A类国际学术会议,2020年为止已举办42届,一直致力于为软件工程领域的研究者、教育者和从业者们提供最新最重要的研究成果、经验及方向。今年ICSE共有272篇长文宣讲。会议将于7月7日到11日在线举行,欢迎大家线上交流讨论。


以下是浙江大学软件工程团队11篇长文宣讲的信息:

论文:White-box Fairness Testing through Adversarial Sampling

Track:Technical Track

作者:张培歆,王竟亦,孙军,董国良,王新宇,王新根,董劲松,戴挺

简介: 近年来,公众对于深度神经网络的公平性深感担忧。本论文提出了一种基于梯度计算和聚类的轻量级算法来搜索模型输入空间中的歧视实例。与现有方法相比,其能更快速有效地发现歧视实例。

论文:Demystify Official API Usage Directives with Crowdsourced API Misuse Scenarios, Erroneous Code Examples and Patches

Track:Technical track

作者:任晓雪,孙嘉谋,邢振昌,夏鑫,孙建伶

简介:论文提出了一种文本挖掘方法从Stack Overflow发现众包API滥用场景。从这些场景中提取错误的代码示例和补丁,以及相关的API和令人困惑的API来,构造“去神秘化”报告,以帮助开发人员了解文档中用自然语言描述的API使用说明。

论文:Is Using Deep Learning Frameworks Free? Characterizing Technical Debt in Deep Learning Frameworks

Track:Software Engineering In Society

作者:刘佳琨, 黄乔,夏鑫,Emad Shihab,David Lo,李善平

简介:该论文通过对7个流行的深度学习框架软件源代码文件中的234,260 个注释进行挖掘,发现了多种被深度学习框架软件中的技术债。

论文:Neural Network-based Detection of Self-Admitted Technical Debt: From Performance to Explainability

Track:Journal First Track (ACM Transactions on Software Engineering and Methodology)

作者:任晓雪,邢振昌,夏鑫,David Lo,王新宇,John Grundy

简介: 论文提出了一种基于卷积神经网络的方法,以识别代码中自承认技术债(SATD)。为了提高模型预测结果可解释性,论文还利用卷积神经网络计算结构抽取用于在代码注释中识别SATD的关键短语。

论文:A Large Scale Study of Long-Time Contributor Prediction for GitHub Projects

Track:Journal First Track (IEEE Transactions on Software Engineering)

作者:鲍凌峰,夏鑫,David Lo,Gail Murphy

简介: 论文提出一个基于程序员Github活动数据的多维度预测模型以自动预测一个开源项目中新加入的开发人员是否会成为项目长期贡献者,以及研究影响新加入开发人员成为长期贡献者的重要因素,为开源社区留存开发人员提供重要帮助和指导。

论文:How does Machine Learning Change Software Development Practices?

Track:Journal First Track (IEEE Transactions on Software Engineering)

作者:万志远,夏鑫,David Lo, Gail Murphy

简介:论文采用定性与定量分析结合的方法,系统探讨机器学习技术引入后,软件工程实践产生的差异。与传统软件开发相比,机器学习系统开发在需求、设计、测试、流程、技能多样性、工作复杂度与任务完整性上存在显著差异。

论文:What Do Programmers Discuss about Blockchain? A Case Study on the Use of Balanced LDA and the Reference Architecture of a Domain to Capture Online Discussions about Blockchain Platforms across Stack Exchange Communities

Track:Journal First Track (IEEE Transactions on Software Engineering)

作者:万志远,夏鑫,Ahmed E. Hassan

简介:为理解区块链系统开发挑战,本文采用平衡LDA算法,结合区块链领域参考架构,针对程序员问答网站Stack Exchange上区块链相关讨论,分析并比较不同参考架构层和不同区块链平台间的话题热度、分布和演化趋势。

论文:Which Variables Should I Log?

Track:Journal First Track (IEEE Transactions on Software Engineering)

作者:刘忠鑫,夏鑫,David Lo,邢振昌,Ahmed E. Hassan,李善平

简介: 论文提出了一个新颖的基于自注意力机制的神经网络模型来自动为开发者推荐需要打印在日志中的重要变量,以协助日志决策。在多个大型Java项目上,模型平均MAP超过0.84。

论文:The Impact of Mislabled Changes by SZZ on Just-in-Time Defect Prediction

Track: Journal First Track (IEEE Transactions on Software Engineering)

作者:范元瑞, 夏鑫, Daniel Alencar da Costa, David Lo, Ahmed E. Hassan, 李善平

简介:基于软件变更级别的缺陷预测依赖于SZZ算法识别引入缺陷的变更,研究者发现SZZ算法会产生噪音,基于对10万余变更的经验分析,论文发现这些噪音对缺陷预测技术存在影响。

论文:Characterizing and Identifying Reverted Commits

Track:Journal First Track (Empirical Software Engineering)

作者:鄢萌,夏鑫,David Lo,Ahmed E. Hassan,李善平

简介: 该论文主要研究了被还原软件变更的形成机制和预测方法,基于27维软件变更级特征和机器学习技术,首次提出了一个自动化预测被还原软件变更的方法,在10个大型开源项目上验证了方法有效性。

论文:What do Programmers Discuss about Deep Learning Frameworks

Track:Journal First Track (Empirical Software Engineering)

作者:韩俊晓,Emad Shihab,万志远,邓水光,夏鑫

简介:为了解用户在开发深度学习系统过程中遇到的问题,论文采用LDA技术对3个流行深度学习框架在2个平台上的话题及发展趋势进行了探讨,并比较不同深度学习框架以及不同平台之间在主题分布、演化上的异同点。