AI,正在纵容传染中文互联网

 人参与 | 时间:2024-11-05 21:54:05

滥用AI,AI也毁了AI

编者案:本文来自微信公共号 量子位 (ID:QbitAI),正纵作者:金磊 尚恩,容传染中守业邦经授权转载,文互头图来自摄图网

传染中文互联网 ,联网AI成为了“罪魁罪魁”之一。AI

使命是正纵这样的。

最近巨匠不是容传染中都热衷于向AI咨询嘛,有位网友就问了Bing这么一个下场:

Bing也是文互有问必答 ,给出了看似挺靠谱的联网谜底:

在给出确定的回覆之后,Bing还知心地附带上了票价 、AI歇业光阴等细节信息。正纵

不外这位网友并无直接接管谜底,容传染中而是文互顺藤摸瓜点开了下方的“参考链接” 。

此时网友觉察到了一丝丝的联网不同过错劲——这人的回覆奈何样“机里机气”的 。

于是他点开了这位叫“百变人生”的用户主页 ,蓦然觉察,介是个AI啊!

由于这位用户回覆下场速率可能说是极快 ,差未多少每一、2分钟就能搞定一个下场。

致使能在1分钟之内回覆2个下场 。

在这位网友加倍子细的审核之下  ,发现这些回覆的内容都是没经由核实的那种……

而且他以为 ,这便是导致Bing输入过错谜底的原因:

那末被网友发现的这位AI用户,如今奈何样样了?

从当初服从来看,他已经被被知乎“判处”为禁言形态 。

但尽管如斯,也有其余网友闪灼其辞地展现:

若是点开知乎的“等你回覆”这个栏目 ,随机找一个下场 ,往下拉一拉  ,简直是能碰着良多“机言机语”的回覆 。

好比咱们在“AI在生涯中的运用途景有哪些?”的回覆中便找到了一个 :

不光是回覆的语言“机言机语”,致使回覆直接打上了“搜罗AI辅助创作”的标签。

而后假如咱们把下场丢给ChatGPT,那末患上到回覆……嗯,挺换汤不换药的 。

事实上,诸如斯类的“AI传染源”不止是在这一个平台上有 。

就连重大的科普配图这事上,AI也是一再侵蚀 。

网友们看完这事也是蚌埠住了:“好家伙  ,不一个配图是河蚌”。

致使种种AI天生的假往事也是不够为奇。

好比前一段光阴,便有一则危言耸听的新闻在网上疯传 ,问题是《郑州鸡排店惊现血案  ,女子用砖头砸去世女子!》。

但事实上,这则往事是江西女子陈某为吸粉引流 ,运用ChatGPT天生的 。

不够为奇 ,广东深圳的洪某弟也是经由AI技术  ,宣告过《今晨,甘肃一火车撞上修路工人, 致9人降生》假往事 。

详细而言 ,他在全网搜查近多少年的社会热门往事,并运用AI软件对于往事光阴 、地址等妨碍更正编纂后,在某些平台赚取关注以及流量妨碍正当牟利 。

警方均已经对于他们接管了刑事欺压措施。

但着实这种“AI传染源”的天气不光仅是在国内存在 ,在外洋亦是如斯。

挨次员问答社区Stack Overflow即是一个例子。

早在去年年尾ChatGPT刚火起来的时候,Stack Overflow便猛然宣告“临时禁用”。

当时民间给进去的理由是这样的:

Stack Overflow进一步论述了这种天气 。

他们以为从前用户回覆的下场 ,都是会有业余知识布景的其余用户浏览,并给出精确与否,至关于是核实过。

但自打ChatGPT泛起之后,泛起了大批让人感应“很对于”的谜底;而有业余知识布景的用户数目是有限,无奈把这些天生的谜底都看个遍。

加之ChatGPT回覆这些个业余性下场 ,它的过错率是实着真实摆在那边的;因此Stack Overflow才抉择了禁用。

一言蔽之 ,AI传染了社区情景 。

而且像在美版贴吧Reddit上 ,也是充斥着较多的ChatGPT板块、话题 :

良多用户在这种栏目之下会提出林林总总的下场 ,ChatGPT bot也是有问必答 。

不外,仍是老下场,谜底的精确性若何 ,就不患上而知了。

但这种天气眼前,着实还潜在着更大的隐患 。

AI模子取良大批互联网数据  ,却无奈很好地分说信息的着实性以及可信度。

服从便是,咱们不患上不面临一大堆快捷天生的低品质内容 ,让人眼花凌乱 ,头晕眼花 。

很难想象ChatGPT这些大模子假如用这种数据磨炼 ,服从会是啥样……

而如斯滥用AI,反以前也是一种自噬 。

最近 ,英国以及加拿大的钻研职员在arXiv上宣告了一篇问题为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文  。

品评辩说了如今AI天生内容传染互联网的现状,而后宣告了一项使人耽忧的发现 ,运用模子天生的内容磨炼其余模子,会导致服从模子泛起不可逆的缺陷 。

这种AI天生数据的“传染”会导致模子对于事实的认知发生扭曲,未来经由抓取互联网数据来磨炼模子会变患上愈加难题。

论文作者,剑桥大学以及爱丁堡大学清静工程教授Ross Anderson绝不避忌的直言 :

对于虚伪信息满天飞的情景,Google Brain的低级钻研迷信家达芙妮 · 伊波利托(Daphne Ippolito)展现:想在未来找到高品质且未被AI磨炼的数据 ,将难上加难。

假如满屏都是这种无营养的劣质信息,如斯周而复始 ,那之后AI就不数据磨炼 ,输入的服从尚有啥意思呢。

基于这种情景 ,斗果敢胆想象一下  。一个成长于剩余 、虚伪数据情景中的AI,在进化成人前 ,可能就先被拟分解一个“智障机械人” 、一个神思扭曲的神思智障。

就像1996年的科幻笑剧片子《丈夫一箩筐》 ,影片陈说了一个艰深人克隆自己 ,而后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数着落 ,蠢笨水平添添。

那个时候 ,咱们可能将不患上不面临一个荒唐顺境:人类缔造了具备惊强人干的AI  ,而它却塞满了无聊蠢笨的信息 。

假如AI被喂进的只是虚伪的剩余数据 ,咱们又能期待它们缔造出甚么样的内容呢 ?

假守光阴到那个时候 ,咱们约莫都市思念以前 ,向那些真正的人类智慧致敬吧。

话虽如斯,但也不全坏新闻  。好比部份外容平台已经开始关注AI天生详尽内容的下场  ,并推出相关纪律加以限度。

一些个AI公司也开始搞能分说AI天生内容的技术,以削减AI虚伪、剩余信息的爆炸。

参考链接 :

[1]https://www.v2ex.com/t/948487

[2]https://twitter.com/oran_ge/status/1669160826186633219

[3]https://www.qbitai.com/2022/12/40167.html

[4]https://arxiv.org/abs/2305.17493v2

[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250

[6]https://futurism.com/ai-generates-fake-news

本文为专栏作者授权守业邦宣告,版权归原作者所有。文章系作者总体意见,不代表守业邦态度,转载请分割原作者 。若有任何疑难 ,请分割[email protected]。

顶: 925踩: 9