当前位置:首页 > 热点 > 用魔法打败魔法,南开大学最新成果让AI“识破”AI—新闻—科学网

用魔法打败魔法,南开大学最新成果让AI“识破”AI—新闻—科学网

2025-08-28 17:55:06 [时尚] 来源:念念有词网
作者:孙玲玲 来源:中国新闻网 发布时间:2025/8/14 13:10:20 选择字号:小 中 大
用魔法打败魔法,识破南开大学最新成果让AI“识破”AI

 

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,用魔近日,法打法南南开大学计算机学院媒体计算实验室取得最新研究成果,败魔不仅从评估的开大科学角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,学最新成新闻DDL)优化策略,果让教会AI用“火眼金睛”辨别人机不同,识破实现AI检测性能的用魔巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。法打法南

图为南开大学研究团队提出的败魔DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?开大科学

近日,OpenAI发布新一代人工智能模型GPT-5,学最新成新闻再次引发全球关注。果让随着DeepSeek、识破ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。

图为AI生成内容检测示意图。(南开大学 供图)

  ?

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)

 特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

(责任编辑:娱乐)

推荐文章
  • 关于召开“2019(第22届)全国玻璃窑炉 技术研讨交流会”的通知,行业会议

    关于召开“2019(第22届)全国玻璃窑炉 技术研讨交流会”的通知,行业会议 各有关单位:中国日用玻璃协会技术咨询委员会和中国硅酸盐学会玻璃分会窑炉有经验委员会定于2019年9月6日至9日在山东省日照市天德全部大酒店共同筹备召开“2019第22届)全国玻璃窑炉技术研讨交流会”; ...[详细]
  • 婴童家具市场扩张 品牌是制胜关键-

    婴童家具市场扩张 品牌是制胜关键- 近年来,我国的婴童用品市场发展迅猛,零售商更是充分享受到了市场成长所带来的狂欢。据统计,全国从事婴童用品零售业务的门店数量已从2006年的大约2万家猛增至去年的3万余家,其中婴童家具市场也在持续容扩。 ...[详细]
  • 基于紫外可见分光光度法检测烟碱公式的探讨(一)

    基于紫外可见分光光度法检测烟碱公式的探讨(一) 烟碱作为烟叶的特征成分不仅具有调节吸食者情绪的作用,而且是广谱杀菌剂和杀虫剂。随着检测技术的进步,烟碱的检测方法已从最初的硅钨酸重量法,发展到后来的紫外分光光度法、连续流动分析法、气相色谱法(GC、G ...[详细]
  • 壁挂电视掉落 消保委调解换新机

    壁挂电视掉落 消保委调解换新机 中国消费者报南京讯记者薛庆元)为了节省空间,越来越多的消费者选择将电视机挂在墙上,但如果电视机掉落致损,又该如何维护自身合法权益呢?近日,江苏省江阴市消保委就接到了这样一起纠纷,帮助消费者更换了新的电 ...[详细]
  • 猛玛品牌战略全新升级 发布四大新品助力创作者即刻精彩

    猛玛品牌战略全新升级 发布四大新品助力创作者即刻精彩 全球无线音视频领域的领军品牌 HOLLYLAND 猛玛宣布,“MOMA猛玛”与“HOLLYLAND”统一为“HOLLYLAND猛玛”,实现全球品牌形象一体化。2025年8月26日,全球无线音视频领域的 ...[详细]
  • 天下晨間新聞 跟普篩不一樣?什麼是基隆「類普篩」?|天下雜誌

    天下晨間新聞 跟普篩不一樣?什麼是基隆「類普篩」?|天下雜誌 指揮中心表示將對基隆36萬人進行「類普篩」,跟普篩什麼不一樣?盧布暴力反彈,俄羅斯怎麼辦到的?中國有錢人現在都跑去新加坡了。您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀 ...[详细]
  • 孩子在托管中心受伤 消保委助力解纠纷

    孩子在托管中心受伤 消保委助力解纠纷 中国消费者报南京讯记者薛庆元)幼儿园放假,将孩子放在托管中心成为越来越多职业父母的选择。但家长选择的托管班真的安全吗?如果孩子在托管机构发生了事故怎么办?家长又该如何维护孩子的权益?近日,江苏省江阴消 ...[详细]
  • 面对通胀压力 家居家具产品涨价了吗?-

    面对通胀压力 家居家具产品涨价了吗?- 物价上涨,家居行业自然而然地也面临通胀压力,家居产品涨价了吗?最近,记者用近一个月时间对广州多个家居卖场的多种类别产品进行了巡查和比较,对产品价格作了深入调查。 部分产品价格为五年最低 近日,记 ...[详细]
  • 米家首款「超远外扩贴边」扫地机官宣 目前已开启预约

    米家首款「超远外扩贴边」扫地机官宣 目前已开启预约 米家首款「超远外扩贴边」扫地机——米家扫拖机器人5C来了,能深入缝隙擦地,提高清洁覆盖力,目前在小米官方各渠道预约中。8月27号消息,小米智能生态官宣米家首款「超远外扩贴边」扫地机——米家扫拖机器人5 ...[详细]
  • 文博会提升友联文化附加值

    文博会提升友联文化附加值 对于红木家具而言,尽管它也叫家具,但仍然是有别于一般民用家具的,虽然近年来实木家具之风盛行,但无论是材质的稀缺性、工艺的复杂和优越性、以及其高于普通家具几倍甚至几十倍的价格,都是消费者将其区别于一般家 ...[详细]
热点阅读