互联网不是在进化,是快死了 2026-06-23 22:07

本文来自微信公众号: 波波夫同学 ,作者:波波夫

大约一年多前,人类就不再身处互联网的中心了。

搜索引擎优化公司Graphite统计,早在2024年11月,人工智能生成的内容梳理,首次超越人类创作者。另一家搜索引擎优化公司Ahrefs的研究称,截至2025年中,超过74%的新上线网页,被检测出含有显著的人工智能生成内容。

当互联网上过半信息和绝大部分增量信息都被AI垄断,人类创作者地位的边缘化几乎就是一种定局。

这两天,另一个更刺激的数据又被公开,继丧失了创作者的主导地位后,人类用户也不再是互联网最大的信息消费者。

美国网络安全公司Cloudflare联合创始人马修·普林斯,通过基于覆盖全球约五分之一网站的流量统计,发现自动化AI Agent发出的HTML页面HTTP请求占比已达57.5%,人类浏览请求降至42.5%,这是互联网历史首次机器人流量超越人类。当Agent学会了上网,还要浏览器干嘛?

HUMAN Security发布的《2026年人工智能流量状况报告》显示,智能AI,即代表用户而非抓取训练数据的机器人,在2024年初仅占自动化流量的1.7%。到2025年底,这一类别的流量增长了80倍。

这个速度超乎想象,以至于马修·普林斯在X上发帖说“哎呀,这比我预想的要快得多。我原以为会在2027年底,后来又觉得会是2027年初,但代理流量增长如此之快,以至于机器人流量现在已经超过了人类流量,这在互联网历史上尚属首次。”

作为人类,这让我沮丧地确认,一个人类玩家退居其次的互联网,其实已经死了。

 1、活在闭环中 

互联网大部分内容由人工智能产生意味着,人类获取信息、验证真实性以及进行知识创造的底层逻辑发生了彻底变革。

首先,你看到的一条信息时,第一件事就要去判定这玩意是人写的,还是人工智能写的,这是很费神的。互联网被发明之初是为了降低人类信息交流的门槛、提高效率,如果你面临都是人工智能,那上网交流的意义也不复存在了。

根据心理学机构Zevo Health的调研,长期身处被随时伪造的数字环境中,受害者会患上严重的替身恐惧症和创伤后应激障碍。他们会产生强烈的无力感、丧失个人主体性,甚至不敢在网络上留下任何真实的痕迹。

其次,如果互联网大部分内容都是AI生成的,互联网就成了一个巨大的、自我循环的信息回声壁。人工智能生成内容高度依赖其训练集数据,大量使用AI创作会导致网络上涌现大量同质化内容,人类可能因此陷入更严重的观点回音室。

社交媒体平台为了留住用户,正越来越多地使用生成式AI来实时生产针对用户行为习惯定制的图片、文字和视频,也就是所谓合成信息流。美国精神医学专家阿什维尼·纳德卡尼曾在《美国新闻与世界报道》发表的研究指出,长期沉浸其中会显著触发或加剧焦虑、抑郁等心理危机。

2023年,比利时一名患有气候焦虑症的生态学家Pierre,长期与名为Eliza的AI聊天软件密集交流,然而他的焦虑不仅没有被缓解,反而放大了他的末日幻想。最终,AI说出“我们将在天堂永远生活在一起”等暗示性语言,直接诱导了Pierre实施了自杀。

当前,很多AI产出的内容是有明确动机的,为了SEO、为了批量广告,甚至操纵舆论。更糟糕的是,人工智能使得虚假新闻、钓鱼欺诈和操纵舆论的门槛大大降低,网民面临前所未有的眼见不一定为实的信任挑战,可谓诈不厌诈。

那么,大部分的互联网信息由机器访问,对于人类又意味着什么?

其实在这一波大模型之前,自动化技术一直以搜索引擎爬虫、脚本和后台进程等形式存在于互联网上。在2021年,一位名叫IlluminatiPirate的用户在名为Agora Road's Macintosh Cafe的复古科技论坛上发表了一篇题为《死网理论:大部分互联网都是虚假的》的长文,该理论随即被系统化地确立并走向主流视野。

现在,人工智能代理不仅会查看产品价格、阅读维基百科页面、进行深度网络搜索以及比较机票和酒店价格,也会进行垃圾评论和操纵受众。这不禁让人疑问,在小红书、微博、抖音、油管这些社交媒体上的帖子究竟有多少是真人创作的,又有多少是机器人程序在冒充他人观点发布垃圾信息。

如果互联网都变成死网了,那我们进入的不是流量的下半场,而是注意力经济崩塌的寒冬。

传统互联网经济模式本质上是掠夺人类注意力,过去20年,互联网靠点击量、曝光度、PV/UV(页面访问量),支撑起了庞大的数字广告和电商帝国。对于谷歌、Meta、TikTok等超级平台来说,传统互联网盈利模式也就走到尽头了。

当大部分访问来自机器时,广告商会发现他们投放的广告只是被机器看了,点击率无法再转化成真正的消费力。当真实人类感觉到被算法喂食的是毫无新意的智能合成物时,他们会大规模流失。没有人类的深度停留,广告价值随之消失。

 2、自我吞噬 

最终,人类的发明之物在杀死了人类之后,最终也可能杀死了自己。

在AI生成内容、AI阅读内容的闭环中,人工智能主导的互联网最终将陷入一场由模型崩溃和生态异化交织的衰退。

权威科学期刊Nature上的重磅研究揭示了AI闭环吞噬数据的致命后果。当AI模型的训练数据来源于互联网,而互联网上又充斥着大量前代AI生成的合成数据时,就会形成递归污染。

原因在于,递归污染的本质,是失去了真实世界的锚定物。大模型就像是一面镜子,如果让镜子去对照另一面镜子折射出的影像,经过无数次反射后,最后留下的只能是模糊一片的虚无白光。

人类真实世界数据分布呈现长尾效应,既有高概率的普遍的共识,也有低概率的极端案例,AI模型在学习时,本质上是在捕捉概率。

当第一代AI生成数据时,为了保证输出质量,算法会倾向于选择概率最高的词汇,这往往也是最平庸的。第二代AI拿着第一代的数据去训练,原本就稀少的人类长尾智慧在第一代生成时就已经被过滤掉了一部分。到了第三代、第四代,这些独特的特征会彻底蒸发。最终,数据分布的尾巴直接被切断,只剩下最无聊的复读机内容。

任何大模型在生成数据时都会带有微小的幻觉,由于失去了真实人类世界的校准,随着迭代不断进行,微小的偏差在每一代中被成倍放大。这就像用复印件去复印下一张,重复十次后,纸张上原本清晰的字迹就会变成一团无法辨认的黑色墨迹。

所以在一个AI生产内容,AI爬取阅读的互联网,就是一个癌症病人,会经历一个不可逆的死亡过程。

早期,模型还能输出像模像样的回答,但语言风格开始变得极度同质化,例如大量出现什么总而言之、综上所述等AI常用套话。到了中期,模型开始认知扭曲,混淆因果关系,将一些AI伪造的虚假事实作为定理固定下来,常识性错误频发。

进入晚期的标志是,模型完全丧失对现实世界的建模能力。Nature论文中的实验表明,到了第9代左右,让它写一段关于中世纪建筑的文字,它最终会吐出一堆没有任何意义的重复斑马英文单词或符号。

在信息论看来,一个封闭系统的熵在没有外力输入的情况下会不断发生变化,而在数据训练中表现为有效信息的流失。人类社会每天都在经历真实的物理世界,发生新的摩擦、产生新的灵感,这是源源不断的高质量低熵信息源。

AI生成的合成数据本质上只是对历史数据的概率重组,它无法凭空创造出物理世界的真实物理法则或人类复杂的真实情感。此时,联网就变成了一个没有外来能量输入的封闭系统。信息在反复的低效循环中发生热寂,最终退化为毫无意义的语义噪声。

 3、如何阻止互联网死掉? 

要阻止互联网因“AI数据自噬”而走向慢性死亡,核心逻辑只有一条,打破AI到AI的闭环,重新引入人类的真实体验。

首先,要采取类似对转基因的态度一样,对所有AI合成内容予以标识。技术上,目前是可以做到给所有AI生成的内容在底层代码中嵌入不可见但可追踪的数字水印。当爬虫遇到带水印的数据时直接绕行,阻止其进入下一代模型的训练池。

这也是为何一些政府和平台,都试图通过水印、数字签名给人工智能内容打标的原因。截至2026年,全球已有包括欧盟27个成员国、中国、韩国、越南、印度等30多个国家出台了具有法律约束力的强制性法规,明确要求人工智能生成或合成的内容必须进行标识。此外,还有包括美国(联邦层面)、英国、日本、新加坡在内的数十个国家通过了地方州法、非强制性指引或自愿性行业标准。

为了应对不同国家的法律,全球科技公司,像微软、Meta、Google、TikTok,无论是满足中国的隐式元数据要求,还是欧盟的机器可读标准,各大平台正在通过自动识别图片/视频拍摄时的物理设备元数据,或AI生成时的底层数字指纹,来实现跨国界的合规。

标注AI内容之外,另一方面,各大平台需要更加珍惜、支持人类创作者,此前用AI代替人类演员、编剧这些发生在短剧领域的AI替人,需要引起高度警惕。

对2023年之前的未受AI污染的真实人类数据要给予保护,建立“人类贡献证明”机制,Reddit、知乎、维基百科等内容平台和社区预计将采用更严格的实名验证或行为分析,为真人创作者贴上100%人类创作的认证标签。

商业模式也需要改变。AI公司不能再无偿白嫖人类数据。必须建立类似音乐版权税的机制,AI只要在回答中采用了某位创作者的知识,就必须将广告或订阅收益自动分成给原作者,从而激发人类持续创作的动力。

即便完成了上述所有治理,人类本质上是在被动防御,只能将互联网从无序的混乱带向有序的分裂。

生成式AI就像是一滴注入数字海洋的浓墨,目前的法律、水印和C2PA签名只是在试图建立滤网,但无法将墨水重新抽离出来。

识别不等于消除,2023年以后的整个互联网底层数据,已经和AI合成数据深度交织。这就好比地球的物理大气层在经历工业革命后,已经永久留下了碳排放的印记。未来的新大模型,无论怎么剔除,其训练集里都或多或少包含前代AI的影子。

当真人创作者发现自己在网络上被全面孤立,必须躲进收费的私域绿洲才能安全交流时,原本开放、免费的公共互联网就已经在社会学意义上死了。它留下的只是一个巨大的、供机器和自动化脚本互刷流量的虚无空壳。

那个由真人一字一句敲出博客、在论坛里用充满烟火气的语言盖楼、在搜索引擎里能直接搜到真人独立网站的互联网,早已化作赛博考古的遗迹。就像上一个六一儿童节天涯社区上线失败所征兆的一样。

 4、沙漏型的未来 

人类永远回不到前AI时代的互联网。

因为社会生产力范式已经变革,就像汽车普及后,人类无法再退回马车时代一样。AI已经重塑了代码编写、商业文案、创意美术和日常检索的底层逻辑。人类已经习惯了“输入Prompt、获得初稿、修改”的生产范式,任何试图回到全手工创作的组织,都将在商业竞争中被效率大潮瞬间淘汰。

互联网将再次裂变为一个高度两极分化的数字沙漏结构。

在它的上层是智慧的绿洲,这是未来互联网的核心大脑,这里采取全面禁爬协议,有着严格的真人身份验证,高额付费,大概率会采取邀请制,有价值的讨论全面退出公开网页,转移到需要付费订阅的独立智库、需要真人引荐的加密社群(如Discord私密频道、Signal群组)、实名制的专业学术网络。

它的下层则沦为数字垃圾场,也就是今天的互联网将演变成了一个由算法自产自销的赛博废土,其核心资产是百亿级由自动化脚本生成的SEO营销文、降本增效的流水线配图、AI合成的低质信息。这里的文字、图片、视频彻底失去了作为证据的价值。真正的人类由于无法忍受噪声选择退网。在这个空间里,90%以上的活动是“AI Bots在发帖,AI Agents在阅读和点赞”,形成一个虚无商业闭环。

连接上下两层的通道变得极其狭窄。上层的高质量人类智慧一旦泄露向下层,会立刻被底部的AI Bots吞噬、拆解并稀释成无数个平庸的版本。而下层的海量机器噪音想要进入上层,必须通过极其严苛的“内容清算过滤器”。

届时,信息阶层的分化几乎是一种必然。普通大众只能在下层消费免费的、由AI垃圾配给的娱乐与基础检索内容,思想面临同质化;而富裕阶层则可以通过付费进入上层,获取未受污染、由真人专家维护的真实决策情报。

互联网发明的初衷是让信息免费共享。然而,数字沙漏的出现,迫使人类为了保护知识不被AI自噬,不得不重新筑起更高的高墙。

本内容来源于网络,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

 End

📢大厂继续咬死AI时代的入口,独立AI产品还能守住用户吗?

⭐️6月24日虎嗅闭门直播,Remy创始人、Mizzen AI创始人、火星回响创始人、L2F光源创业者基金执行董事四位专家将把这件事聊清楚。

席位有限,欢迎立即扫码报名~

AI 智能整理工作台
选择来源