来源:MIT Technology Review / Will Douglas Heaven | 翻译整理:Maple
【一】2026斯坦福AI指数报告说了什么
今年的斯坦福AI指数报告里有几个惊人数据。
美国目前有5427个数据中心,且还在增加——是其他所有国家加起来总数的10倍以上。
全球AI硬件供应链依赖一家公司:台积电(TSMC),它生产几乎所有最先进的AI芯片。一家 foundry 支撑整个行业,想想都疯狂。
但报告最核心的结论是:AI的现状充满了矛盾与不一致。用作者Michelle Kim的话说就是:
“如果你在关注AI新闻,你可能已经晕头转向了——AI是淘金热、AI是泡沫、AI要抢你工作、AI连时钟都读不懂。”
讽刺的例子:Google DeepMind最顶级的推理模型Gemini Deep Think在国际数学奥赛中拿了金牌,但有一半时间读不懂指针时钟。
【二】专家 vs 普通人:50个百分点的鸿沟
斯坦福报告最值得关注的数据:
评估AI对就业的影响,73%的美国AI专家持乐观态度,公众只有23%——差距整整50个百分点。
经济、医疗领域也存在类似分裂。这里的”专家”指2023-2024年参加美国AI学术会议的研究者。
【三】为什么会这样?三个原因
原因1:使用体验完全不同
一名软件工程师在X上的帖子说出了关键:
“你对AI的敬畏程度,和你用AI写代码的频率高度相关。”
这话可能有点夸张,但确实戳中了要害。
技术工作者用AI写代码、做数学、研究文献,体验到的是AI最强的一面。而普通人用免费版AI来策划婚礼、写邮件、聊天,体验参差不齐。
原因2:”锯齿型前沿”现象
AI在某些任务上极强,在另一些任务上极弱。写代码有明确对错,容易训练;策划婚礼这种开放式任务,AI经常翻车。这就是所谓的”jagged frontier”(锯齿型前沿)。
更关键的是:能写代码的AI很赚钱,所以各大模型公司都在砸资源优化它。这意味着写代码的人体验到的AI,和策划婚礼的人体验到的AI,差距只会越来越大。
原因3:Andrej Karpathy的观察
AI界影响力巨大的Karpathy(OpenAI创始成员、前特斯拉AI总监)指出:AI重度用户(用LLM写代码/做数学/做研究的人)不仅紧跟最新模型,还愿意花每月200美元订阅最强版本。
“今年以来这些领域的进步,令人震惊。”
也就是说:花钱用Claude Code的人,和半年前用免费版Claude策划婚礼的人,用的根本不是同一个AI。这两群人互相辩论,聊的却是两个东西。
【四】结论:两个平行现实
文章作者Will Douglas Heaven的最终判断:AI同时存在两个现实——
• AI远比很多人以为的更强,尤其是在编程、数学、科研等任务上;
• AI在很多普通人真正关心的事情上仍然很糟糕,而且可能长期如此。
所以现在网上关于AI的争论,绝大多数都是鸡同鸭讲——乐观者和悲观者各自的体验都是真实的,但他们看到的根本不是同一个AI。
要判断AI的未来,与其听人争辩,不如先问清楚:对方用的是哪个AI、做什么任务?
如果觉得有用,点个赞
转发给朋友看看
关注我,每天更新热点资讯
本文由 Maple 整理,参考MIT Technology Review报道
未经授权禁止转载