分享好友 最新动态首页 最新动态分类 切换频道
蓝谷院校动态丨山东大学(青岛)计算机学院体系结构研究中心团队成果获国际顶级会议ISSTA 2025录用
2025-09-24 09:48

近日,山东大学(青岛)计算机学院体系结构与嵌入式系统研究中心提交的研究论文ClassEval-T: Evaluating Large Language Models in Class-Level Code Translation被国际软件工程测试与分析领域顶级会议ACM SIGSOFT International Symposium on Software Testing and Analysis(ISSTA 2025)正式录用。山东大学计算机科学与技术学院本科生薛鹏宇、吴林昊为论文第一作者,山东大学助理教授杨振为通讯作者。该论文的第一作者及通讯作者单位均为山东大学,该论文亦是山东大学在ISSTA会议上的首篇录用论文。

论文针对当前主流大模型代码翻译研究普遍停留在函数级、片段级别、难以反映真实软件开发任务的局限,首次提出了面向类级别的代码翻译评测集ClassEval-T。该评测集在构建过程中共投入360人时,支持Python、Java、C++三种主流语言和94项实际开发任务,并配备完备的高覆盖率测试用例(语句覆盖率达99.7%,分支覆盖率达98.2%)。在此基础上,论文进一步设计了三种具备工程实践意义的翻译策略(整体式、最小依赖式、独立式),系统评估了八个当前主流大模型(涵盖GPT 4o、Claude 3.5、DeepSeek V3等)在类级翻译中的表现差异,并对1243个失败样本进行了人工错误分类与机制分析。

nerror="javascript:this.style.opacity = 0;" src="https://nimg.ws.126.net/?url=http%3A%2F%2Fcms-bucket.ws.126.net%2F2025%2F0409%2Fc8426d23j00sufhgg002nc000u000fuc.jpg&thumbnail=660x2147483647&quality=80&type=jpg" />

实验结果显示,大模型在类级代码翻译中普遍面临准确率大幅下降、依赖项识别困难、语法/语义错误频发等挑战。相关研究不仅揭示了现有大模型在实用软件迁移中的瓶颈,也为后续模型设计与评测基准建设提供了新的视角与方法。

研究不仅填补了当前类级别代码翻译评测标准缺失的空白,也为推动代码翻译研究向工程化、仓库级任务演进提供了理论支撑与实验基础,具有重要的学术价值和工程实践意义。目前项目代码已开源(h ttps://github.com/wLinHoo/ClassEval-T),为该领域的研究和实践提供助力。

nerror="javascript:this.style.opacity = 0;" src="https://nimg.ws.126.net/?url=http%3A%2F%2Fcms-bucket.ws.126.net%2F2025%2F0409%2Fe84ff1b9j00sufhgg002sc000os00btc.jpg&thumbnail=660x2147483647&quality=80&type=jpg" />

ACM SIGSOFT International Symposium on Software Testing and Analysis是软件工程测试与分析领域最具影响力的国际会议,为中国计算机学会(CCF)推荐的软件工程四大A类会议之一。该会议关注自动测试、程序分析、软件质量保障等关键技术,本届ISSTA共收到550篇高水平投稿,最终录用107篇,录用率仅为19.4%。会议将于2025年6月在挪威特隆赫姆举行。

最新文章
联想意外曝光英伟达N1芯片!AI PC要迎来“质变”时刻了?
CES 2025上,英伟达用全新的Project DIGITS重新定义了桌面AI超算,也让外界看到了Blackwell CPU和Grace CPU组成的GB10超级芯片的无尽潜力。毕竟在英特尔NUC的成功案例下,不少品牌都开始将桌面迷你电脑打造成高性能移动工作站。而且英伟达
农银人寿金融保险安全守护指南:心系投资者 携手共行动
为进一步倡导理性投资文化,切实维护广大投资者合法权益,中国证监会决定将每年5月15日设立为“全国投资者保护宣传日”,在全国组织动员各方上下联动,积极开展形式多样的投资者保护活动,让投资者保护理念深入人心,成为大家的自觉行动。
3岁进入娱乐圈,23岁就开始大火,颜值演技均在线的帅哥演技派!
陈星旭出生于1996年的3月份,年仅三岁的他在1999年进入到娱乐圈,4岁时为大家带来了第1部电视剧。2014年考上中央戏剧学院,2019年东宫这部网剧播出之后,他马上就获得了奖项,也被无数的人都熟悉。可以说在这一部作品中,他的表现真的特别
西安此区域实行静态管理;长安区紧急寻找同轨迹人员【早新闻,有易思】5月22日态度新闻早报
2022年5月22日周日 农历四月廿二本地新闻长安区一部分区域实行静态管理5月21日,西安市长安区疫情防控指挥部发布通告,为全面做好长安区疫情防控工作,严控疫情风险扩散,切实保障人民群众生命安全和身体健康,依据疫情防控有关规定,经长
9处提“平等”对待民营经济,这部法律草案如何解决民企痛点
“民营经济促进法(草案征求意见稿)公开征求意见以来,司法部已经收到了一千多条意见和建议。”10月14日,司法部副部长胡卫列在国新办发布会上透露了上述数据,也显示出社会各界对这部立法的高度关注。作为我国第一部专门关于民营经济发展
华熙LIVE·五棵松成潮流圣地,赵燕女士丰富年轻人娱乐生活
在小红书或美团输入关键词“京西不夜城”“北京逛吃一体”等词条,华熙LIVE·五棵松的相关信息映入眼帘。华熙LIVE·五棵松俨然已成为越来越多年轻人的潮流圣地。自2019年5月1日起,华熙LIVE·五棵松街区整体营业时间从原有的10:00-22:00延长
央视曝光互联网保险暗礁,便捷投保藏系统性理赔难陷阱
来源:赛博AI实验室本文基于以下话题的智搜结果生成央视近期深度曝光互联网保险行业潜藏的“暗礁”,揭露了投保便捷背后“理赔难”的系统性陷阱。综合调查案例和监管测评,核心问题及应对策略如下:⚠️ 四大核心陷阱与典型案例名不副实的
胶州市阜安中学举办青春期心理健康教育、法制安全教育讲座
青春如火,燃烧着激情与活力;青春如花,绽放着智慧和希望。在青春期,学生们的身心快速发育,不断发生新变化,同时也会迎来新的问题与挑战。为了进一步加强学生们的生理与心理健康教育,帮助他们健康安全地度过青春期,我校邀请了市公安局
北京新朝阳:迈向“万亿GDP城区”的三大源动力!
2025年6月3日,田老师受邀出席“2025北京CBD论坛”并在“中外车企圆桌对话会”上做专题发言,三个观点抛砖引玉:1)创新商业模式:北京第三产业产值占比已超过85%,智能车商业模式创新窗口已来,为智驾等“领先技术”付费,为汽车融媒体等
安平县委书记曹向东带队到北京对接洽谈项目
招引高科技项目,助力安平创新发展。9月13日,安平县委书记曹向东、副县长赵靖带队就高端装备产业园项目到北京对接洽谈,县发改局、教育局、文广旅局,建投集团、农发集团等部门主要负责同志参加活动。在北京市顺义区天竺空港工业园北京三
相关文章
推荐文章
发表评论
0评