欢迎访问黑料吃瓜网

10年专注吃瓜

吃瓜质量有保 售后7×24小时服务

24小时咨询热线:4006666666
您的位置:首页>>998吃瓜>>正文

998吃瓜

OpenAI自研反AI神器,憋了两年啥也不是?

发布时间:2025-05-22 点此:884次

ChatGPT刚发布时,一度成为学生党写论文时的神助攻。

细腻的OpenAI自研反AI神器,憋了两年啥也不是?的视图

而现在,恐怕要变成学生党的噩梦了。

据内部消息泄漏,OpenAI现已悄然研制出了一种“反抄袭神器”,能够精准检测是否有人在论文或研讨陈述中动用了ChatGPT。尽管学生们运用AI做弊的行为让教育界焦头烂额,但OpenAI却迟迟按兵不动,没有揭露这项技能。

图片来历:视觉我国

知情人士和内部文件提醒,这个项目在OpenAI内部现已上演了长达两年的拉锯战,而实际上它早在一年前就现已箭在弦上,蓄势待发。

“就差按下那个按钮了,”一位知情人士如是说。

OpenAI为何对这个功用如此纠结?更重要的是,这个所谓的水印真的能百分百破解GPT生成的文本吗?

给GPT打“码”

幻想一下,ChatGPT就像一个超级聪明的文字接龙高手。它总是能猜到下一个最合适的词,这些词在AI界被称为「词元」(Token)。

比如说,当你抛出“我最喜欢的生果是__”这样一个最初,ChatGPT的大脑就会开端张狂作业,依据上下文语境,它会在“苹果”、“香蕉”、“草莓”、“榴莲”等选项中随机挑选一个。这个进程,便是大言语模型(LLM)的日常作业。

但是,OpenAI正在酝酿的这个反做弊神器,计划给这个选词进程来个暗度陈仓。它会悄然地调整词语的挑选概率,在「词元」的挑选上埋下了一些特定的概率形式。

这种水印尽管对人类读者来说毫无发觉,但在OpenAI内部的检测下却无所遁形。知情人士泄漏,只需ChatGPT产出足够多的文本,这种水印的有效率能高达99.9%。

那么,这个水印到底是怎么运作的呢?

PConline依据已有材料了解到,或许是经过改动一个语句中词元呈现的频率完成。

让咱们来玩个文字游戏:

仍是那句“我最喜欢的生果是__”。

在联络前文的语境下,一切生果呈现的概率或许相同。但有了水印技能,这个概率散布就会被略微改动一下。苹果和橙子一同呈现的概率最高。这种奇妙的概率改动,便是GPT所埋下的水印,像是给整片文章埋下了一串看不见的暗号。

OpenAI打水印简易示意图(制图:高海晏)

这种打暗号的高超之处在于,即使不是最佳选词,对一般读者来说也不会感到突兀。但在OpenAI的解码器下,这些文字就会露出其AI生成的真身。

Reddit网友弥补解释道,这是在限制语境下,词元概率从随机到故意的进程。幻想AI在写作时偷偷地抛了一枚看不见的硬币。对咱们人类来说,这枚硬币的正反面彻底随机。但对OpenAI来说,这枚硬币每次的回转都代表一种规则,组成了一种只要它才干破译的暗码。

Reddit网友解读

不过,这个水印终究是否可信,咱们还得打个问号。究竟OpenAI至今仍在藏着掖着,没有揭露详细的技能细节。仅仅仅仅在8月7号悄然于官网发布了一篇博客,供认内部团队在研讨给GPT打水印这回事。

OpenAI还在为是否揭露这个水印而犹豫不定,其实市面上现已涌现出各式各样的AI文本检测东西了。

生动的OpenAI自研反AI神器,憋了两年啥也不是?的照片

AI与反AI的“猫鼠游戏”现已悄然开端

AI文本届福尔摩斯

2024年5月,谷歌推出了一款名为SynthID的“文字水印”东西,它给Gemini AI生成的每一段文字都打上了一个看不见的符号。

处于Beta版其他SynthID原理与猜测的OpenAI水印技能千篇一律。它给每个词元都赋予了一个奥秘的概率分数。当AI在选词时,SynthID就会悄然地调整这些分数。这种做法既不影响文章的质量,又能留下AI的“数字指纹”。

谷歌 SynthID演示更为杂乱的打水印作用(Src.谷歌官网)

谷歌信誓旦旦地表明,SynthID特别适用于长篇幅、多样化的文本,如文章、戏曲剧本或电子邮件。

幻想一下,在一篇AI生成的文章中,每个语句或许藏有十多个这样的记号,而整个页面或许隐藏数百个。这些记号与AI的选词形式交错在一同,形成了一个共同的水印。而且,至少要有三个语句,这个水印才干真实发挥作用。文字越长,这种水印就越简单被发现。

在欧美学术界和新闻圈,AI文本检测现已成了学生、教师和记者等必学技能。其间,最炙手可热的莫过于GPT Zero了。

GPT Zero官网截图

这个由普林斯顿大学学霸爱德华·田(Edward·Tian)开发的AI模型,好像数字国际的福尔摩斯,专门破解AI生成的文字之谜。它的侦破理念根据深度学习算法和计算特征,就像是给每段文字做了一次CT扫描。

作为市面上老练且商业化的产品,GPT Zero的付费形式从10~23美元(约人民币71~163元)/每月收费,供给多字数的AI检测筛查、多言语检测、语法主张等功用。能够让用户经过给出的AI检测陈述,逐字逐句人工修正,削减AI感。

GPT Zero收费规范

不过,GPT Zero也不是全能的。面临杂乱或混合的文本时,它也或许会犯模糊。而且,它关于其他言语的检测并不精确。尽管GPT Zero自称精确率高达99%,但仍有1%的时机看走眼。

这不,就有小红书网友吐槽说,自己随手写的东西居然被校园判定为AI著作。这位网友无法地表明:“我写的东西便是没有逻辑算了。”

小红书网友吐槽自己的原创被识别为AI

箭在弦上,为何不发?

那么问题来了,为什么OpenAI迟迟不发布这款文字水印功用呢?

一是给文字打上AI水印并没有那么简单。

文字更为散装,而图画愈加全体。同一个主意能够用无数种方法表达,就像一个故事能够有千百种讲法。每个词既独立又多义,这让计算分析的难度大大添加。相比之下,图片尽管也构成杂乱,但在数字(Digital)国际里,它们就像是由积木建立的城堡,每个像素都是一块积木,在“积木”上打符号反而更简单被AI和人眼捕捉到。

图片无限扩大后能够看到一个个像素(拍摄/制图:高海晏)

而且,聪明的网友发现,只需经过来回翻译不同言语即可破解所谓的GPT文字水印。Reddit网友共享教程:把AI生成的文字先翻译成其他言语,再翻译回来,就能奇妙地避开生成式AI文本的套路感。

OpenAI自己也供认,运用翻译软件很简单绕开它们的水印。

OpenAI自研反AI神器,憋了两年啥也不是?的视图

Reddit网友发帖回应怎么逃避AI生成文本的为难

第二,是否有必要给文字打上水印也存在争议。

MIT科技谈论泼了盆冷水:许多人用ChatGPT仅仅给电子邮件润饰或拼写查看。要是给一切AI生成的文本都打上水印,岂不是要给这些无辜路人扣上“做弊”的大锅?

OpenAI内部也是一片争辩声。假如这个“火眼金睛”把握在少数人手中,那还有什么含义?但假如人人都能运用,那些心怀不轨的人岂不是很快就能破解水印技能?

更让人头疼的是,一项针对ChatGPT忠诚用户的查询显现,近三分之一的人表明,假如知道有反做弊技能,他们就会失掉爱好。这就像是给自己的得力助手戴上了桎梏。

不过市面上层出不穷的AI检测东西确实反映了用户对版权问题日益增长的忧虑。

本年7月,艺术家们乃至开端求助于Glaze这样的东西,试图用AI来对立AI,在图画中添加人眼难以发觉的数字噪声,以阻挠图画生成器仿制他们的共同风格。

Glaze官网截图

现在,创造者们正在寻求各种维护措施来躲避AI带来的危险,科技巨子们也在不断更新其产品条款。

上一年12月,两件关乎版权的大事引发了轩然大波:Meta忽然宣告要在10亿Facebook和Instagram用户的相片上练习AI;《纽约时报》对OpenAI和微软提起诉讼,指控他们未经授权运用其数百万篇受版权维护的文章来练习生成式AI模型。

面临AI这头数据贪吃,创造者们不得不与时俱进,学会用AI当作自己的兵器,玩起了“以毒攻毒”的花招。

究竟,大人,年代变了。

这一幕,不由让人想起本雅明在《机械仿制年代的艺术著作》中的预言。旧日,机械仿制技能推翻了艺术的“灵光”(Aura),现在,AI又将创造面向了何方?

在这个算法与代码操纵的新年代,创造的绝无仅有性好像正在被AI无限仿制和生成的才能所替代。但或许,正如本雅明所言,这种革新也带来了新的或许性 ——AI让创造从高深典雅变为通俗易懂。

那么你以为AI会是创造的要挟吗?

参阅文章

[1] There’s a Tool to Catch Students Cheating With ChatGPT. OpenAI Hasn’t Released It. ChatGPT

[2] Why detecting AI-generated text is so difficult (and what to do about it). MIT Technology Review.

[3] Tool preventing AI mimicry cracked; artists wonder what’s next. Ars. Technica

[4] OpenAI won’t watermark ChatGPT text because its users could get caught OpenAI. The Verge.

[5] Understanding the source of what we see and hear online. OpenAI.

[6] 机械仿制年代的艺术著作. 瓦尔特·本雅明.

告发/反应

相关推荐

在线客服
服务热线

24小时咨询热线:

4006666666

微信咨询
群众吃瓜网
返回顶部