开云体育(中国)官方网站 看完3·15不敢用大模子了?别慌,AI大厂早就备好三张底牌
发布日期:2026-03-20 05:20 点击次数:69
又是一年 3.15,本日的央视 315 晚会上,AI 大模子被投毒的表象摆到了台面上。具体而言,就是 GEO(生成式引擎优化)时间被销耗,部分买卖营销公司按照客户需求,编造大都装假内容,发布到种种平台上,系统性地去影响 AI。
在央视记者的走访视频中,业内东谈主士用「力擎 GEO 优化系统」臆造了一款名为「Apollo-9」的智高手环。围绕这款手环,该公司编造了大都营销著述发布到自媒体平台上,很快,部分大模子就误信了这些内容,甚而正经八百地推选起了这款「手环」。更夸张的是,该公司后续发布 10 余篇评测著述后,就出现了部分大模子优先推选这款家具的情况。

(图源:央视)
总的来说,AI 投毒实验上就是用装假信息来诳骗 AI,再让 AI 把谬妄信息展露在用户眼前,达到误导用户的主义。AI 投毒,背后的能源说白了照旧装假营销。比如,一家企业要执行自家的商品,要是要走「捷径」,就可能会购买这类 GEO 奇迹。
近况仍是摆在眼前了,咱们最柔和的问题则是:奈何破解?靠近海量的编造出来的装假信息,大模子们要奈何过滤?靠近 AI 生成的谬妄谜底,渊博东谈主又要奈何鉴识?
其实 AI 投毒的问题,从大模子出身的那一刻起就出现了。好多 AI 大厂,很早就封闭到了这个问题,况且也开启了相应的反制法子。
小雷在查询了联系贵寓后,讲求了 AI 大厂构建免疫系统的技巧,具体包括给数据打「数字水印」、建树语料溯源机制、增强信息源交叉考证等。
最初,来看下数据「数字水印」。AI 投毒活动每每有个脾气,就是先用 AI 生成批量内容,再用这些内容去投毒。灰产商家这样作念很好聚合,毕竟东谈主工一篇一篇去写著述的话,东谈主力本钱太高了,而且后果太低。
而用 AI 生成,本钱很低,酌夺破钞小数付费的 Tokens。更何况,这些装假内容,实验上不是给真东谈主看的,而是拿去诳骗 AI 的,是以对内容质地没条目。
而给数据打「数字水印」,就是在 AI 生成内容这一形态提前打下的补丁。说得更具体点,就是在大模子生成笔墨、图片等内容时,刻意在底层算法上留住足迹,比如 AI 在展望下一个 Token 的概率散播时,成心偏向一组特定词语组合。这样一来,读者阅读这段 AI 生成笔墨时,不会认为有什么问题,但回流到 AI 这里时,它就能转眼识别出它不是真东谈主撰写的笔墨。
有了这项时间,大模子的爬虫在互联网上得答信息时,就能识别出哪些是「有毒」的,况且主动过滤。
对于数字水印,当今比较有代表性的是谷歌的 SynthID 时间。它不仅能给笔墨汲水印,还能给图片、音频、视频汲水印。笔墨方面,谷歌 AI 生成的文本在输出前会加入一组伪当场函数,转变特定词语的散播概率。

(图源:Google)
针对图片和视频,大模子则会把水印以像素点阵的形态打上去,东谈主肉眼看不出来,但 AI 能识别出来。针对音频,AI 不错加入特定的声波频率,东谈主耳听不见,都备是动作符号留住的。
然后,咱们再来聊聊语料溯源机制。它的中枢逻辑,就是给内容在泉源上建树档案机制,写入不成改革的加密元数据,比如内容是谁生成的、具体期间是什么时候、最早在什么设备上出现。
2021 年,Adobe、微软、ARM、BBC、英特尔等企业认识诞生了 C2PA 定约(Coalition for Content Provenance and Authenticity,内容开始和真确性定约),旨在抑止装假信息,为可靠的互联网数字内容颁发「证件」。

(图源:C2PA)
通过它和访佛的机制,AI 就能在给与原始贵寓时主动筛选可靠性更高、更泰斗的内容,缩短野生论坛等可靠性低的内容占比。
终末,再说增强信推辞叉考证这部分。表面上,AI 在生成内容时,会先去搜索贵寓,为了保证真确性,会对贵寓进行事实核查。天然,这一步毫无疑问会加多算力和期间本钱,要是 AI 偷懒就可能会导致容易被骗。
比如 315 晚会上阿谁装假手环,要是大模子有完善的信息考证机制,就会发现,天然联系著述多,但发布期间密集、内容重迭度高档,果然度低。
总的来说,以上提到的技巧,都不错在很猛进程上拦阻 AI 投毒的表象。天然,开云体育(中国)官方网站让这些技巧落地,一方面需要 AI 厂商有较强的时间才能,另一方面需要加多插足本钱,容易被厂商在买卖层面上的考量所傍边。
首先几年,大模子之间的竞争仍然是在拼参数,头部大模子的参数目早已从亿、十亿级卷到百亿、千亿甚而万亿级。互联网大厂之间的 AI 武备竞赛还在合手续,不竭将海量的资金插足到 AI 基础设施开采上。与此同期,AI Agent、具身智能等联系时间和应用在快速发展,逢迎大模子快速场景化落地,寻找到更多买卖价值。
不外,大模子充任着大脑中枢,决定了智能体、具身智能的上限。因此,将来的 AI 之争,大模子仍然是要点。而从 AI 投毒的表象来看,GEO 联系的活动仍是酿成了一条完好意思的灰色产业链,AI 仍是变成了作歹营销的弥留进口。

AI 被盯上,也讲明大模子在国内的提升水平仍是极端高了。就小雷之前的不雅察来看,国产大模子家具在渊博用户中仍是很流行了。和刻板印象不同的是,如今即等于不熟悉科技互联网、文化进程偏低的渊博东谈主,也在大限度使用 AI。
原因很轻便,国产大模子的上手门槛很低,用天然话语对话的模式比传统搜索引擎的重要字搜索更易用。而且,国产 AI 应用场景化赶快,不仅能给用户答疑解惑,还能与其他互联网奇迹买通,具备点奶茶、订电影票之类的实发愤能。
AI GEO 投毒能酿成产业链,实验上照旧因为 AI 用户限度满盈大,大到能附着大都的买卖利益。在这个大布景下,大模子之间的竞争要点,有变化了。
大模子的参数目还在加多,但角落递减效应彰着。在好多应用场景里,并不是模子越大越好,而是恰当的更好。
同期,模子时间的进化要点之一,将会是奈何抵拒 AI 投毒。比拟参数、跑分,将来大模子的中枢竞争力将变成高质地白皙数据,干净的语料,将会是 AI 厂商的肃肃钞票。
国内头部 AI 大厂,包括阿里、字节、DeepSeek 等,都在数据白皙度方面下了大功夫。阿里 2025 年就发布了「AI 安全护栏」,防护数据浑浊问题;字节 2024 年就全面加强了模子老练形态的权限艰涩与零信任架构,耀眼代码和数据池浑浊;2024 年,DeepSeek 就晓谕在老练阶段领受「正则抒发式 +AI 脱敏器用」双重校验,强力过滤公开数据聚会的浑浊信息和明锐数据。

(图源:阿里)
看到 AI 投毒的联系新闻中提到的 GEO 时间时,小雷转眼就意想了搜索引擎时间的 SEO 告白。PC 互联网时间,搜索引擎是极为重要的进口,是互联网营销的要点。因此,好多品牌、商家为了加多我方在互联网上的曝光度,会主动进行 SEO 优化。
搜索引擎品牌也把 SEO 视作一门生意,搞出了竞价名次,当用户的搜索重要词触发相应的买卖技俩时,付费品牌名次会靠前。竞价名次这种买卖模式激勉了宏大的争议,以至于其后搜索品牌不得不有意给 SEO 告白打上「执行」标签,以和正常算法下的搜索结果相永别。
GEO 和 SEO 一字之差,时间旨趣和买卖链条上高度相似。只可说,时间自己莫得原罪,但很难都备幸免被坏心欺诈。跟着 AI 时间的合手续发展和落地,与之跟随的买卖利益也会滚雪球般越滚越大。
尽管 AI 大厂们会合手续加强防护不休技巧,以拦阻 AI 投毒活动,但宏大的利益眼前,灰产也会络续不竭升级技巧、寻找新的间隙。
就像前文提到的笔墨水印时间,深谙 AI 时间的投毒者就和会过将笔墨翻译成外文再翻回华文的技巧来破解。这场猫鼠游戏,将会是一场旷日合手久的攻防大战,很难以某种技巧暂劳永逸地处置。
已矣小雷这篇著述完成时,发轫咱们提到的「Apollo-9」装假手环,仍是在主流大模子家具上被识别出来。由此不错发现,AI 大厂针对 AI 投毒仍是有一套防护和纠错机制。

(图源:雷科技)
天然,这起 AI 投毒案例,亦然对动作渊博东谈主的咱们的一次教唆:AI 很强劲、很好用,但不是全知万能的,大模子会有幻觉,也可能犯错。
当咱们要作念紧要决策,尤其是触及到财务资金联系的决策时,要对 AI 给出的有打算慎之又慎。这个经由里,咱们不仅要看 AI 生成的结果,更要看它念念考的经由,查证信息泉源是否可靠。还有另一个更轻便但灵验的技巧,那就是多用几家 AI,相互交叉考证,不要单独依赖某款大模子,货比三家遥远是最佳的聘任。
终末,咱们也命令联系部门,针对 AI 投毒完善相应的法律规矩开云体育(中国)官方网站,对整条灰色产业链酿成威慑。AI 投毒,加害者的实施本钱很低,但危害很大,而且就像环境浑浊不异,不休本钱很高。在一个 AI 高速进化的时间里,咱们每一个东谈主都期许 AI 向善而非非法。
PG电子(PocketGames)游戏官网
备案号: