机构看衰专家批评项目艰难，大语言模型会不会成为即将破碎的AI泡沫？-王吉伟的专栏

机构看衰专家批评项目艰难，大语言模型会不会成为即将破碎的AI泡沫？

2024-10-15 14:22:37栏目：默认栏目 IP属地：IP未知

大语言模型不再被视作通往AGI的桥梁，生成式AI未来的发展方向在哪里？

已经烧掉5000亿美元还要继续耗费资源的大语言模型，后面的路还走得动吗？

烧钱、耗费资源、难以盈利，被持续唱衰的大语言模型前路艰难但商业价值明显

被砸重金的Transformer架构却不是AGI的钥匙，大语言模型的前路是否光明？

机构看衰专家批评项目艰难，大语言模型会不会成为即将破碎的AI泡沫？

全球看衰大语言模型，“AI六小虎”传闻迭起，生成式AI的价值空间已经触顶？

文/王吉伟

国庆节过后，人工智能领域似乎多了几分冷色调。不知道是因为大语言模型（Large Language Model，LLM）的幻觉，还是因为寒露时节的到来。

或许人工智能还无法感受到时下的寒意，即便是带有气象传感器的具身智能和端侧Agent。因为这份寒意更多来自于经济圈层和精神层面，现实世界的复杂程度远不是一个采用Transformer及其变体架构的大语言模型所能体会的。

技术上，这一轮人工智能的热潮源自于Transformer架构。而这个让OpenAI最新融资额度达到1570亿美元估值的技术架构，在一些人看来却并不咋地。

不看好并质疑Transformer架构的种种观点，大体可以总结为：

Transformer缺点和优点一样明显；大语言模型并不是通往AGI的桥梁；

连带着，生成式AI（Generative AI，GenAI）也开始被批判。当然这些批判之声并非只因Transformer架构的技术缺陷，更在于生成式AI爆发以来出现的各种版权、安全等问题与当前经济、社会乃至政治层面的各种冲突。

唱衰大语言模型的声音，也得到了一些投资机构的支持。在国外，高盛就认为生成式AI投入很高而收益太少。Mighty Capital过去两年没有进行AI领域的投资，认为当前的创业项目都被高估了。Next Round Capital Partners的言论更加偏激，预测85%的AI初创公司将在三年内因资金耗尽或者被收购而倒闭。

最近甚至有声音认为OpenAI或者Anthropic最终会以被收购收场，即便OpenAI有很大的可能性能够实现主导上市。

国外关于AI泡沫的声音，从去年开始就没有间断过。

在国内，曾主导滴滴与快的合并的传奇投资人朱啸虎也认为，五年以后可能不会再有独立的大模型公司存在。言外之意明显，大模型公司可能都会被收购，毕竟二、三线大模型创业项目已经在卖身了。

而最近的几个似是而非的传闻，似乎也透露了一些问题。传闻中的国产大模型“六小虎”目前的情况好像都不是很好，在裁员、静默、迷茫中惶惶度日。

国外的大语言模型公司也没有好多少。作为大语言模型领域的风向标，虽然OpenAI估值正在向2000亿美元狂奔，却难掩其骨干离职、持续烧钱、难于赢利、越发向虚的尴尬境地，人们对OpenAI的关注度正在逐渐下降。而Anthropic也越发表现平平，何时赢利仍是个问题。

现在来看，从技术到资本再到商业，没有彰显出大语言模型应有的奋勇直上的姿态，反而是透露了一种难以为继的疲态，要知道LLM的爆发至今仅有短短的2年。为什么很多人都在说LLM不是通往AGI的桥梁？资本市场和应用市场如何看待生成式AI？如何看待“AI六小虎”传闻？LLM真的不能长久吗？

本文，王吉伟频道结合近期的行业动向，跟大家聊聊这些。

注：文章相关研报、论文资源已打包上传，后台回复LLMpaomo获取。

LLM是不是通往AGI的桥梁？

2023年3月下旬，ChatGPT如日中天LLM Based AI Agent崭露头角之时，未来生命研究所（Future of Life Institute，FLI）发布了一则公开信，呼吁所有人工智能实验室立即暂停训练比GPT-4更强大的人工智能系统至少6个月。

信中写道，广泛的研究表明，具有与人类智能竞争的人工智能系统可能对社会和人类构成深远的风险这封信得到了包括马斯克等在内的1000多科技领袖和研究人员的签名。

有意思的是，这封信发出后或许没让多少人重视AI的安全，反而坚定了更多人相信LLM能够实现AGI的信心。

但一些人也认为，LLM与AGI的距离就像人类在火星上定居一样遥远。甚至有人认为，OpenAI将AGI的进展倒退了5到10年。因为现在所有人都在做LLM，使得其他研究和出版越发缓慢。

Meta首席人工智能科学家杨立昆（Yann LeCun）认为，在某种程度上，AI 模型的“智能”程度取决于它所训练的数据，像 ChatGPT、Google的Gemini或Meta的 Llama这样的LLM永远不会达到人类的智能水平。

在通往人类水平智能的道路上，LLM基本上是一种"off-ramp"（岔路）、"distraction"（干扰）和"dead end"（死胡同）。这意味着LLM并不能有效推动我们实现人类水平的人工智能，反而可能会分散我们的注意力，让我们误入歧途。

甚至连OpenAI的CEO Sam Altman也曾表示，他不认为仅仅通过扩大LLM的规模就能实现AGI，对当前LLM在实现AGI方面的潜力持保留态度。所以也有观点认为，未来GPT-5会不会继续采用Transformer架构尚未可知。

目前主流的AI模型和产品，比如ChatGPT、Sora、Bard、Claude、Midjourney、ChatGLM、Baichuan、Kimi 等都基于Transformer架构。

在RWKV（Receptance Weighted Key Value，一种结合了递归神经网络和Transformer模型优点的新型架构）论文作者彭博看来，现实世界不是基于Transformer逻辑去做推理来运转的其运转规律是基于类似RNN 结构的。这个世界的下一秒，不会跟你过去所有的时间、所有的信息相关联，只会跟你的上一秒相关联。但Transformer 要辨认所有的 token，这是不合理的。

RWKV架构图

之所以说基于Transformer架构的LLM不是通往AGI的桥梁，综合各路大神的观点与看法，主要原因归结于LLM的技术局限性，表现为以下几点：

局限一：预训练不能实时学习

人类智能的核心在于持续的实时学习，这得益于大脑的可塑性和神经连接的动态形成。相比之下，LLM在训练后被冻结，以批处理方式进行学习，缺乏实时反馈和动态适应的能力。

数学上，这种限制源于它们在固定向量空间中的映射关系，无法随着新数据的发展而调整。为实现实时学习，需要将Sobolev空间中的动态映射引入。

局限二：记忆缺乏动态整合能力

大脑的记忆系统是复杂而动态的，能够根据上下文和情感不断调整。然而，LLM的记忆是静态的，仅以固定权重存储知识，缺乏动态整合能力。

虽然有一些内存增强技术（如RAG和神经图灵机）试图引入外部记忆，但它们的计算成本高，且无法实现实时学习和适应性召回。这种离散的记忆机制，使得LLM无法实现真正的上下文感知和联想学习。

局限三：无法进行实时动态调整

尽管思维链（CoT）推理、上下文学习和元学习（如MAML）被认为是改善LLM性能的潜在解决方案，但它们仍未达到真正的通用智能（AGI）所需的流动智能。

这些方法提高了特定任务的表现，但模型依然依赖于固定的训练模式，无法进行实时动态调整。大脑能够通过每次体验重构其突触网络，而LLM则需要繁琐的微调过程。

局限四：能源效率与可持续性差

人脑以极高的能源效率运作，能在仅20瓦的功耗下执行1 exaflop的计算。相比之下，LLM的训练和推理过程能源密集，消耗数兆瓦的能量。

尽管有可能通过事件驱动架构和脉冲神经网络（SNN）来提高能效，但当前的LLM仍未能达到大脑的能效水平。

局限五：缺乏可塑性与动态适应

大脑的可塑性使其能够根据新信息和环境变化重组神经连接，支持持续学习。相对而言，LLM的参数在训练后固定，缺乏根据新信息自我重组的能力。

这种可塑性的缺失限制了LLM在新挑战下的适应能力，真正的AGI需要具备动态重新配置内部结构的能力，以降低运营成本并提高效率。

这些局限性，也就是不看好LLM者常说的：Transformer 效率不高，天花板易窥见，计算成本高昂且占用内存，资源浪费严重。

并且LLM的这些局限性，很难或者无法从根本上改变，这也决定了LLM不会把人工智能带向AGI。从局限性角度解读LLM不能带来AGI的文章，大家还可以参考下面几篇：

Why LLMs Will Never Lead to AGI：https://medium.com/autonomous-agents/why-llms-will-never-lead-to-agi-aa7bcff9805d

Why Large Language Models are not the route to AGI：https://www.linkedin.com/pulse/why-large-language-models-route-agi-sandeep-reddy/

Why LLMs Will Never Be AGI：https://chrisfrewin.medium.com/why-llms-will-never-be-agi-70335d452bd7

鉴于Transformer的局限性，便出现了许多非Transformer架构，其中比较有影响力的包括中国的RWKV、Meta 的Mega、微软亚研的Retnet和Mamba、DeepMind团队的Hawk和Griffin等，这些架构都是在Transformer大模型火爆之后提出的。

可以看到，在这个名单里除了RWKV架构是创业项目，其他架构都是科技巨头推出的，其中似乎也映射了他们对Transformer无法实现AGI的看法。

需要说明的是，作为国产开源的首个非Transformer架构大语言模型，目前RWKV已经迭代至第六代RWKV-6。

有意思的是，跟OpenAI深度绑定的微软已在Windows系统集成了RWKV，数据显示在9月份win10+win11的装机量已经达到15亿，验证了该架构的实用性。

出现问题，就要解决问题。为了克服LLM的限制性，研究者们也正在探索新的数学框架和AI架构，以模拟大脑的自适应、上下文感知和节能特性。一些比较有发展潜力的（初步）方向，如下图：

从各种研究方向以及LLM当前面临的问题来看，未来AGI的实现定然不会只依赖于一种模型，而是需要多种模型的组合和协作。LLM只是诸多模型中率先实现突破并且卓有成效的，使得今天的技术、生态、商业乃至资本都在重度往这个领域倾斜。

Transformer已经形成垄断地位，无论资源还是生态，非Transformer研究都差了很多。目前研究非Transformer新架构的团队要么在学术界，要么是体量很小的创业团队，很少有大公司投入一个大的团队来研究新架构。

目前行业的整体方向，如同在一个不太正确的方向上压重注，导致更多的资源投放到Transformer技术的研究上而忽略其他方向，压缩了非Transformer的生存空间，这也是一些人斥责LLM会把AGI的实现时间缩短5-10年的主要原因。

资本市场眼中的GenAI

除了技术领域频频吐槽基于Transformer的LLM，一些投资机构也对生成式AI颇有看法，乃至于非常看衰GenAI，认为这波炒作所带来的AI泡沫即将破裂。

以OpenAI为例，在今年早些时间募资时，很多投资机构都认为其1000亿美元的估值太高。其新一轮融资最终以1570亿美元的估值，但苹果放弃了这一轮融资，于2021年投资OpenAI的红杉资本没有跟投。

还有一些投资机构对投资AI非常慎重，比如风险投资机构Mighty Capital过去两年都没有进行AI领域投资，认为价格被高估了。专注AI领域的投资机构Thrive Capital在与一些LP、主权财富基金和大型机构投资者沟通中发现，一些机构面临收入回报压力，已拒绝让VC投资风险高的项目。

高盛在《GEN AI: TOO MUCH SPEND, TOO LITTLE BENEFIT?》报告中对于AI的投资回报做出了质疑：尽管预计未来几年科技巨头和各类企业将在AI相关领域投入约1万亿美元，但截至目前这些投资似乎并未带来显著成果。

报告见本文资源包。

在报告中，麻省理工学院教授Daron Acemoglu也对AI的前景持保留态度，预测未来十年内，只有大约四分之一的AI任务能够实现成本效益的自动化，AI可能只会使美国的生产力增加0.5%，GDP增长累计增加0.9%

高盛策略师Ryan Hammond团队报告称，科技巨头在AI领域的大量投资尚未产生相应的收入和利润，可能导致估值贬值。高盛全球股票研究主管Jim Covello更为谨慎，认为AI必须解决复杂问题才能实现合理回报。

当然，高盛内部目前对AI的看法并不一致。一些分析师认为，即使AI技术的基本叙事最终无法在资本市场站住脚跟，AI泡沫也可能需要更长时间才会破裂。另一些分析师则持怀疑态度，认为AI自动化任务不到5%，且AI技术的成本高昂，且并非为解决复杂问题而生

红杉资本合伙人认为，按照当前的投资成本，要保证50%的利润，需要赚到6000亿美元。这个数字是基于当前GPU和云服务投资的预测。福布斯则认为红杉的估算是乐观的，实际回报可能更低，除非生成式AI出现杀手级应用。

但越来越多的华尔街分析师对AI的热情也在减退，认为AI技术尚未达到实用水平，投资过度可能导致不良后果。

在国内市场，金沙江创投合伙人朱啸虎在“创投十年”高峰论坛上的分享中，关于大模型创业提到了两点：

一是如果到年底不能推出GPT-5，OpenAI和英伟达的股价可能都要狂跌；二是五年以后可能不会再有独立的大模型公司存在，要么只有AI应用公司，要么就是云服务。

虽然他不看好大模型创业但看好生成式AI应用，这一点我们在后文还会提及。

应用市场这样看GenAI

除了资本市场，在应用市场一些研究机构对GenAI的看法也不是很乐观。

根据Gartner 7月发布的最新炒作周期报告，用于采购的GenAI已经达到了“高估期望的峰值”。这个阶段之后是“幻灭的低谷”，一个“由于实验和实施未能实现”的兴趣减弱的时期。

▲ 2024 采购和寻源解决方案技术成熟度曲线，点击看大图

虽然GenAI可能会从现在开始迅速成熟，在2到5年内达到“生产力平台”，但达到这一点的道路可能不会一帆风顺。Gartner估计，到2025年底，至少有30%的GenAI项目将在概念验证后被放弃。

参考链接：https://www.gartner.com/en/newsroom/press-releases/2024-07-29-gartner-predicts-30-percent-of-generative-ai-projects-will-be-abandoned-after-proof-of-concept-by-end-of-2025

市场研究开始证实这一点。软件公司Asana对1200多名IT专业人士进行了调查，发现四分之一的受访者后悔如此迅速地投资了AI。Boston Consulting Group发现，三分之二的高管对其组织在AI方面的进展持矛盾态度或不满意。

以上两份调查报告，见本文资源包。

SaaS公司WalkMe 表示，自从开始使用这些技术以来，一半的美国办公室工作人员的工作没有得到改善。

参考链接：
https://ir.walkme.com/news-releases/news-release-details/walkme-discovers-workplace-ai-sos-we-need-help-along-way

今年4月，麻省理工学院经济学家Daron Acemoglu的一篇论文引起了轰动，该论文预测了AI“非平凡但适度”的经济利益。与高盛和麦肯锡相反，阿西莫格鲁预计未来10年的GDP增长不会超过1.16%，而生产率增长仅略高于半个百分点。

《经济学人》7月份的一篇文章则更为犀利，指出“到现在为止这项技术几乎没有对经济产生任何影响”。

Daron Acemoglu论文：https://economics.mit.edu/sites/default/files/2024-04/The%20Simple%20Macroeconomics%20of%20AI.pdf

在Daron Acemoglu看来，每个人都在疯狂地冲刺，想用AI做一些事情，却不知道自己在做什么。这些技术还不够成熟，将导致大量中断和不必要的自动化，并且可能会降低公司提供的产品和服务的有效性。

在具体应用层面，Gartner研究主管Pieter J. den Hamer表示，市场内部对GenAI的失望感正在加大。特别是对于在ChatGPT病毒式传播后开始投资GenAI的公司来说，他们越发意识到GenAI并不是灵丹妙药。GenAI是一项非常强大的技术，但像任何其他技术一样，它需要仔细分析研究后才能有效使用。

他指出，许多CIO投资于AI是为了提高生产力。当他们努力量化这些收益时，挑战就会进一步出现。在Gartner 最近的一项调查中，近一半的IT领导者表示，他们在确定AI的商业价值时遇到了问题。

参考链接：https://www.gartner.com/en/newsroom/press-releases/2024-05-07-gartner-survey-finds-generative-ai-is-now-the-most-frequently-deployed-ai-solution-in-organizations

den Hamer表示其看到的目前最成功的应用是将AI 应用于客户服务。以呼叫中心座席可以处理的电话数量来衡量，平均生产力大概提高10%，但前提是员工技能得到提升并能够有效使用AI。在营销领域也是一样，需要适当培训员工并让他们适应新的工作方式，否则成效就会小很多。

事实上，Gartner调查发现，目前只有9%的企业被归类为“AI成熟”。他们与众不同的是可扩展的AI运营模型、对AI工程的关注、对提高员工技能的投资以及更好的风险管理能力。

网络安全咨询公司SkySiege的首席工程师Andrew Southall认为，风险管理能力很关键。他与许多客户合作，这些客户对他们的GenAI投资感到后悔，不仅因为商业价值被误解和高拥有成本，还因为“数据中毒”等安全问题。

从技术供应而言，目前像微软这样的生产力和商业软件领域的领头羊，也没有真正找到愿意为此付费的客户。

The Information 称，微软365套件的客户对 AI 驱动的“Copilot”产品几乎没有太多兴趣。在 4.4 亿个用户中，只有 0.1% 到 1% 的用户愿意为这些 AI 功能付费。

一家测试了这些 AI 功能的公司表示，“大多数人目前并不认为它具有太大价值”，还有人说，“许多企业没有看到在生产力和其他方面的显著改进”，他们“不确定何时才能看到”。

要体验这些功能，需要每人每月额外收取 30 美元。对于所谓的“Copilots for Sales”，则每月额外收取 50 美元。如果按年支付，这也将是一笔不小的费用，因此很多企业对此并不太感冒。

对于这种技术与市场脱节的情况，公共关系公司EZPR首席执行官Edward Zitron在名为《The Subprime AI Crisis》的博文中写道：

整个行业对生成式 AI 的大规模投入，结果却只是出现了四、五个几乎相同的大语言模型、世界上最不盈利的初创企业，还有数千个价格昂贵且令人失望的集成产品。

他认为目前我们正在面对一种共同的幻觉：一种死胡同一样的技术，它依赖版权盗窃、需要持续的资本注入，同时它所提供的服务在最好的情况下也是非必需的，它被包装成一种尚未实现的自动化，耗费了数十亿美元，而且可能会永远如此。生成式AI不单单靠金钱在运行，还有信仰，问题是信仰是一种有限的资源。

参考链接：https://www.wheresyoured.at/subprimeai/

这么犀利的笔锋，透露了Edward对AI行业的极度担心。

关于近期“AI六小虎”的传闻

9月初，几则关于大模型公司现状的传闻，似乎在印证资本市场及应用市场目前不太认可大语言模型的情况。

一则来自于橘子汽水铺，整体提到了大模型创业公司的现状。

一则来自于AI暴躁吐槽君，介绍了几个创业公司的运营情况。

经过一个多月的发酵，已经有更多人看到了这些传闻。而在36氪最新的报道中，“AI六小虎”（智谱、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰）中已经有两家逐步放弃预训练模型，缩减了预训练算法团队人数，业务重心转向AI应用。

参考链接：https://36kr.com/p/2985143610892032

在王吉伟频道看来，重点发力AI应用也没什么不好，光守着大模型不能变现没啥用，毕竟更好地活着才更有希望。

但这则报道，也让之前的传闻越发真实起来。

针对传闻及报道中“某些公司放弃预训练”的说法，李开复已经发朋友圈辟谣，称零一万物一直在做预训练。

其实传闻就是如此，你不管它别人也就是猜猜罢了。但若是认真，则有可能坚定别人的看法。

既然是传闻，大多可能会是捕风捉影。但无风不起浪，真实情况可能不会像传闻中说的那么严重，但还是为国内AI圈披上了一层悲观色彩。

即便没有这些传闻，还有朱啸虎的预测。其“未来5年不会有独立大模型公司”的说法，几乎是预判了大模型创业公司的命运，比这些传闻还要严重的多。

假设这些大模型创业项目的生命周期只有五年，现在出现这样的情况也就再正常不过了。

即使没有朱啸虎的预测，也还有最近兰德公司（RAND Corporation）的研报。其所发布的报告《The Root Causes of Failure for Artificial Intelligence Projects and How They Can Succeed Avoiding the Anti-Patterns of AI》超过80%的AI项目失败了，是不涉及AI的信息技术项目的失败率的两倍，浪费了数十亿美元的资本和资源。