AI，正在纵容传染中文互联网

人参与 | 时间：2024-11-05 21:54:05

滥用AI，AI也毁了AI

编者案：本文来自微信公共号量子位（ID：QbitAI），正纵作者：金磊尚恩，容传染中守业邦经授权转载，文互头图来自摄图网

传染中文互联网，联网AI成为了“罪魁罪魁”之一。AI

使命是正纵这样的。

最近巨匠不是容传染中都热衷于向AI咨询嘛，有位网友就问了Bing这么一个下场：

Bing也是文互有问必答，给出了看似挺靠谱的联网谜底：

在给出确定的回覆之后，Bing还知心地附带上了票价、AI歇业光阴等细节信息。正纵

不外这位网友并无直接接管谜底，容传染中而是文互顺藤摸瓜点开了下方的“参考链接”。

此时网友觉察到了一丝丝的联网不同过错劲——这人的回覆奈何样“机里机气”的。

于是他点开了这位叫“百变人生”的用户主页，蓦然觉察，介是个AI啊！

由于这位用户回覆下场速率可能说是极快，差未多少每一、2分钟就能搞定一个下场。

致使能在1分钟之内回覆2个下场。

在这位网友加倍子细的审核之下，发现这些回覆的内容都是没经由核实的那种……

而且他以为，这便是导致Bing输入过错谜底的原因：

那末被网友发现的这位AI用户，如今奈何样样了？

从当初服从来看，他已经被被知乎“判处”为禁言形态。

但尽管如斯，也有其余网友闪灼其辞地展现：

若是点开知乎的“等你回覆”这个栏目，随机找一个下场，往下拉一拉，简直是能碰着良多“机言机语”的回覆。

好比咱们在“AI在生涯中的运用途景有哪些？”的回覆中便找到了一个：

不光是回覆的语言“机言机语”，致使回覆直接打上了“搜罗AI辅助创作”的标签。

而后假如咱们把下场丢给ChatGPT，那末患上到回覆……嗯，挺换汤不换药的。

事实上，诸如斯类的“AI传染源”不止是在这一个平台上有。

就连重大的科普配图这事上，AI也是一再侵蚀。

网友们看完这事也是蚌埠住了：“好家伙，不一个配图是河蚌”。

致使种种AI天生的假往事也是不够为奇。

好比前一段光阴，便有一则危言耸听的新闻在网上疯传，问题是《郑州鸡排店惊现血案，女子用砖头砸去世女子！》。

但事实上，这则往事是江西女子陈某为吸粉引流，运用ChatGPT天生的。

不够为奇，广东深圳的洪某弟也是经由AI技术，宣告过《今晨，甘肃一火车撞上修路工人，致9人降生》假往事。

详细而言，他在全网搜查近多少年的社会热门往事，并运用AI软件对于往事光阴、地址等妨碍更正编纂后，在某些平台赚取关注以及流量妨碍正当牟利。

警方均已经对于他们接管了刑事欺压措施。

但着实这种“AI传染源”的天气不光仅是在国内存在，在外洋亦是如斯。

挨次员问答社区Stack Overflow即是一个例子。

早在去年年尾ChatGPT刚火起来的时候，Stack Overflow便猛然宣告“临时禁用”。

当时民间给进去的理由是这样的：

Stack Overflow进一步论述了这种天气。

他们以为从前用户回覆的下场，都是会有业余知识布景的其余用户浏览，并给出精确与否，至关于是核实过。

但自打ChatGPT泛起之后，泛起了大批让人感应“很对于”的谜底；而有业余知识布景的用户数目是有限，无奈把这些天生的谜底都看个遍。

加之ChatGPT回覆这些个业余性下场，它的过错率是实着真实摆在那边的；因此Stack Overflow才抉择了禁用。

一言蔽之，AI传染了社区情景。

而且像在美版贴吧Reddit上，也是充斥着较多的ChatGPT板块、话题：

良多用户在这种栏目之下会提出林林总总的下场，ChatGPT bot也是有问必答。

不外，仍是老下场，谜底的精确性若何，就不患上而知了。

但这种天气眼前，着实还潜在着更大的隐患。

AI模子取良大批互联网数据，却无奈很好地分说信息的着实性以及可信度。

服从便是，咱们不患上不面临一大堆快捷天生的低品质内容，让人眼花凌乱，头晕眼花。

很难想象ChatGPT这些大模子假如用这种数据磨炼，服从会是啥样……

而如斯滥用AI，反以前也是一种自噬。

最近，英国以及加拿大的钻研职员在arXiv上宣告了一篇问题为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。

品评辩说了如今AI天生内容传染互联网的现状，而后宣告了一项使人耽忧的发现，运用模子天生的内容磨炼其余模子，会导致服从模子泛起不可逆的缺陷。

这种AI天生数据的“传染”会导致模子对于事实的认知发生扭曲，未来经由抓取互联网数据来磨炼模子会变患上愈加难题。

论文作者，剑桥大学以及爱丁堡大学清静工程教授Ross Anderson绝不避忌的直言：

对于虚伪信息满天飞的情景，Google Brain的低级钻研迷信家达芙妮 · 伊波利托(Daphne Ippolito)展现：想在未来找到高品质且未被AI磨炼的数据，将难上加难。

假如满屏都是这种无营养的劣质信息，如斯周而复始，那之后AI就不数据磨炼，输入的服从尚有啥意思呢。

基于这种情景，斗果敢胆想象一下。一个成长于剩余、虚伪数据情景中的AI，在进化成人前，可能就先被拟分解一个“智障机械人” 、一个神思扭曲的神思智障。

就像1996年的科幻笑剧片子《丈夫一箩筐》，影片陈说了一个艰深人克隆自己，而后又克隆克隆人，每一次克隆都导致克隆人的智力水平呈指数着落，蠢笨水平添添。

那个时候，咱们可能将不患上不面临一个荒唐顺境：人类缔造了具备惊强人干的AI ，而它却塞满了无聊蠢笨的信息。

假如AI被喂进的只是虚伪的剩余数据，咱们又能期待它们缔造出甚么样的内容呢？

假守光阴到那个时候，咱们约莫都市思念以前，向那些真正的人类智慧致敬吧。

话虽如斯，但也不全坏新闻。好比部份外容平台已经开始关注AI天生详尽内容的下场，并推出相关纪律加以限度。

一些个AI公司也开始搞能分说AI天生内容的技术，以削减AI虚伪、剩余信息的爆炸。

参考链接：

[1]https://www.v2ex.com/t/948487

[2]https://twitter.com/oran_ge/status/1669160826186633219

[3]https://www.qbitai.com/2022/12/40167.html

[4]https://arxiv.org/abs/2305.17493v2

[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250

[6]https://futurism.com/ai-generates-fake-news

本文为专栏作者授权守业邦宣告，版权归原作者所有。文章系作者总体意见，不代表守业邦态度，转载请分割原作者。若有任何疑难，请分割[email protected]。

顶: 925踩: 9

六合小青网

AI，正在纵容传染中文互联网

人参与 | 时间：2024-11-05 21:54:05

评论专区

相关文章