汪亮教授

汪亮

开云足球俱乐部计算机学院副教授

wl@nju.edu.cn
开云足球俱乐部计算机学院,江苏省南京市
Ph.D., 计算机科学

个人简介

汪亮,开云足球俱乐部计算机学院、计算机软件研究所、计算机软件新技术全国重点实验室副教授,博士生导师。长期从事群体智能、软件方法学、开源软件生态研究。发表学术论文50余篇。主持和参与国家自然科学基金项目、国家重点研发计划、华为公司合作研究等科研项目10余项。作为团队成员获得江苏省教学成果奖二等奖、开云足球俱乐部魅力导师、本科生心目中的好课程、南京市中青年拔尖人才、华为优秀合作项目、微软学者等荣誉。担任中国计算机学会系统软件和开源发展专业委员会执行委员、江苏省计算机学会软件工程专委会委员、OSS Compass开源度量平台技术委员会联席主席等。

我们团队一直在寻找有自驱力的学生。如果你有兴趣加入我们,请发送邮件联系。

研究方向

软件方法学&开源软件

研究开源软件和生态的生长与演化机理、基于信息理论等工具的开源群智建模分析方法、基于人工智能的开源生态治理与优化方法等。

群体智能

研究大规模人类协作(开源社群等)和机器群体(无人机群等)智能系统的理论模型、演化机制、优化技术和应用方法。

普适计算

研究行为、情感等心智状态的识别、度量等普适计算技术,以及其在智能环境中的应用。

研究项目

南京市中青年拔尖人才项目
南京市
2024年度

围绕群体智能的度量、协同、优化开展系统性的理论和方法研究

负责人
开源软件生长与群智开发行为度量分析研究
国家自然科学基金面上项目(62172203)
2022年1月-2025年12月

基于信息理论和熵等度量开源软件及其生态并提供智能化支撑

负责人
面向群体行为的群智激发汇聚研究(课题二:群智涌现行为的识别、训练和解释)
科技创新2030—“新一代人工智能”重大项目(2018AAA0102302)
2019年12月- 2022年12月

面向开源社群和无人机群的群体智能机理与方法研究

骨干参与
仿真技术研究
国家重点研发计划项目(子课题:2023YFC3107100)
2023年12月- 2026年11月

仿真技术研究

骨干参与/子课题负责人
开源生态评估 2.0
华为技术有限公司(TC20240829027)
2024年9月-2025年9月

开源三方库和贡献者画像、评估与智能推荐

负责人
开源生态评估技术合作项目
华为技术有限公司(TC20221008046)
2022年11月-2023年11月

建设面向国内外开源生态的健康度量指标体系

负责人
基于日常移动平台的用户状态感知与软件协同技术研究
国家自然科学基金青年项目(61502225)
2016年01月-2018年12月

基于可穿戴传感器的自然状态下用户行为和状态感知识别

负责人

教育背景与工作经历

2021年至今
开云足球俱乐部计算机学院
副教授

同时任职于前沿交叉中心(CIC)、计算机软件研究所(ICS)和计算机软件新技术全国重点实验室。

2014年-2020年
开云足球俱乐部计算机科学与技术系
助理研究员

同时任职于前沿交叉中心(CIC)、计算机软件研究所(ICS)和计算机软件新技术国家重点实验室。

2009年-2014年
开云足球俱乐部计算机科学与技术系
博士研究生,导师:吕建教授(院士)

专业:计算机软件与理论,获得博士学位。

2007年-2009年
开云足球俱乐部计算机科学与技术系
硕士研究生,导师:陶先平教授

专业:计算机科学与技术,2009年提前攻博。

2003年-2007年
开云足球俱乐部计算机科学与技术系
本科

专业:计算机科学与技术,获得学士学位。

学术论文

Solving the Min-Max Multiple Traveling Salesmen Problem via Learning-Based Path Generation and Optimal Splitting
Wen Wang, Xiangchen Wu, Liang Wang, Hao Hu, Xianping Tao and Linghao Zhang
The 28th European Conference on Artificial Intelligence (ECAI 2025) . Bologna, Italy. October 25-30, 2025. pp. 4889-4896.
摘要:本研究针对最小 - 最大多旅行商问题(Min-Max Multiple Traveling Salesmen Problem, m3-TSP)展开研究,该问题旨在协调多个旅行商的行程,使最长行程的长度最小化。由于其 NP 难特性,在 P不等于NP 的假设下,精确求解器已不再实用。因此,基于学习的方法因其能快速生成高质量近似解而受到关注。其中,两阶段方法将基于学习的组件与经典求解器相结合,简化了学习目标。然而,这种解耦往往会破坏优化的一致性,可能导致解的质量下降。为解决这一问题,我们提出一种名为生成 - 分割(GaS)的新型两阶段框架,该框架在联合训练过程中将强化学习(RL)与最优分割算法相结合。该分割算法相对于城市数量具有近线性的可扩展性,并能保证在欧氏空间中对任意给定路径进行最优分割。为实现强化学习组件与该算法的联合优化,我们采用长短期记忆网络(LSTM)增强的模型架构来解决部分可观测性问题。大量实验表明,所提出的 GaS 框架在解的质量和迁移性方面均显著优于现有的基于学习的方法。
Attributed Multiplex Learning for Analogical Third-Party Library Recommendation and Retrieval
Baihui Sang, Liang Wang, Jierui Zhang, Xianping Tao
The 33rd IEEE/ACM International Conference on Program Comprehension (ICPC 2025). Ottawa, ON, Canada. April 27-28, 2025. pp. 1-11.
摘要:第三方库(TPLs)在现代软件开发中扮演着关键角色,其提供的可复用代码能够加速项目开发进程。然而,可用的第三方库数量庞大,这使得为特定任务选择合适的库或为废弃库寻找替代方案成为一项具有挑战性的任务。现有方法存在局限性,仅依赖于基于挖掘的方法或基于特征的解决方案。本研究提出一种创新的属性多重网络学习方法,该方法融合多个层面的文本数据和关系数据,以实现有效的库类比推荐与检索。通过将库表示为带属性的节点,并将库间关系建模为图中的边,我们的方法构建了一个属性多重网络用于第三方库的表示嵌入。该方法采用统一简洁的模型整合不同维度的信息,所提出的归纳式模型还能够解决冷启动问题。此外,我们的模型具有可扩展性,能够适配大量的库。为验证该方法的有效性,我们在 NPM 生态系统中进行了包括消融实验在内的多项实验。基于包含 8308 个库的真实数据集,实验结果表明,在 Hit@10 指标下推荐准确率达到 89.8%。同时,我们贡献了一个新的数据集,该数据集包含了从废弃(deprecated)信息中提取的4070条迁移规则,丰富了 NPM 生态系统中相对匮乏的现有数据集。总之,我们的方法高效且具有应用前景,能够支持现实场景中的大规模第三方库推荐与检索任务。
EarlyPR: Early Prediction of Potential Pull-Requests from Forks
Xiangchen Wu, Liang Wang, Xianping Tao
IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER 2025). Montréal, Québec, Canada. Tue 4 - Fri 7 March 2025. pp. 1-12.
摘要:本研究提出 EarlyPR 框架,用于识别和预测开源软件(OSS)项目分支(fork)中潜在的拉取请求(PR)贡献。该框架通过提供重复贡献、被拒绝贡献的预警以及遗漏贡献的检测,有望提升 OSS 项目中基于分支 - 拉取(fork-and-pull)开发模式的效率。与传统基于拉取请求(PR)的研究不同,后者依赖于贡献者提供的 PR 描述和内容(这些信息仅在 PR 创建后才可用),而 EarlyPR 通过挖掘分支的提交(commit)历史,在 PR 创建前进行预测。
真实开源软件仓库开发者交流网络的社区检测基准研究
张洁芮, 汪亮, 常正超, 李梓荣, 桑百惠, 陶先平
软件学报. . 2025年9月(录用). .
摘要:群体智能是新一代人工智能的重要组成部分,研究如何激发和汇聚开源社区“人”的力量能够极大的提升开发效率。社区检测作为研究开源项目中开发者关系的技术手段,在社交网络的探索和理解中起着至关重要的作用。然而,目前的研究主要集中在 Facebook等大规模社交网络上,系统性地研究项目级开源软件开发者社交网络(OSS-DSNs)中的社区检测仍然较为缺乏。在本文中,我们首先收集真实世界的数据,并分析 OSS-DSNs 的特征。然后,我们在这些真实数据集上,对多种重叠和非重叠的社区检测算法进行基准测试,比较它们在多个度量和维度上的性能。最后,基于合成的 OSS-DSNs,我们高效地生成了一系列合成网络,并使用带有真实标签的数据进行算法评估,以进行对比分析。我们识别了小规模和中等规模社交网络与大规模网络之间的特征差异,并探讨了这些差异如何影响社区检测的度量标准及算法性能。我们的研究提供了一个新的基准,并为更好地理解开源软件社区中的沟通与协作提供了重要的见解。
Measuring and Mining Community Evolution in Developer Social Networks with Entropy-Based Indices
Jierui Zhang, Liang Wang, Ying Li, Jing Jiang, Tao Wang, Xianping Tao
ACM Transactions on Software Engineering and Methodology (TOSEM), Volume 34, Issue 1. Article No.: 12. . 2024年12月30日. Pages 1 – 43.
摘要:本研究提出四种基于熵的新型指标,用于衡量开源软件(OSS)项目中开发者社交网络(DSNs)的社区演化特征。这些指标为社区分裂、收缩、合并及扩张等事件提供了定量化度量方法,且具备单调性等已验证特性,其定义的最大值与最小值对应具有实际意义的场景。通过组合使用这些指标,可描述社区涌现、消亡等复杂演化事件。基于上述指标,本研究进一步提出一种融合shapelet mining的新型机器学习方法,用于挖掘社区演化的代表性模式。真实开源软件项目的验证结果表明:与现有研究相比,这些指标能有效捕捉各类社区演化行为,准确率达94.1%;同时,其预测开源软件团队生产力的准确率为0.718。借助shapelet mining与学习框架,这些指标可识别社区演化模式,并能在项目最后一次提交前 3 个月,以 93% 的准确率预测开源软件项目的存续状态。研究结果凸显了此类基于熵的指标在理解开源软件项目状态、预测未来趋势方面的潜力,为开发者社交网络与开源软件社区的后续研究提供了重要支撑。

教学工作与人才培养

计算机系统基础(PA部分)

课程核心目标是实现一台简化的x86模拟器和相应的操作系统kernel。通过动手实践的方式,进一步深入掌握理科课程中的知识点。课程的目标群体是二年级本科生,具备基本的汇编和C语言编程基础,修习《计算机系统基础》理论课。通过学习本课程,能够通过模拟计算机的运算、指令的译码与执行、存储管理和I/O功能的实现,充分掌握计算机的组成原理,学习其中的关键技术内容。同时初步培养软件项目的管理、开发和测试技能。

本科二年级(春/秋季学期开课)
基于强化学习的无人机群体智能导论

通过本课程的教学,使学生深入理解强化学习的基本理论;面向无人机群任务,熟练掌握基于强化学习的机群策略训练和虚实结合验证;同时掌握仿真任务环境的设计和搭建。在此基础上,发展学生的针对实际问题的建模和求解能力,培养学生分析和解决一般性多智能体控制任务的能力,提高学生对于深度学习编程框架的掌握程度,为学生以后分析并解决实际问题打好坚实的基础。

专业选修课(春季学期开课)

荣誉奖励

开云足球俱乐部师德先进团队
2023年9月

计算机系统能力培养教学研究与团队建设(团队负责人:袁春风,本人排名6/10). 开云足球俱乐部

华为优秀合作项目
2025年8月

开源生态评估技术合作项目(负责人). 华为

学生社团优秀指导教师
2024年1月

MC社团指导教师. 开云足球俱乐部

Baidu
map