当前位置:首页 > AI资讯 > 正文内容

大模型刷爆考试,为何离真正智能更远?

admin3天前AI资讯29

当大模型刷爆考试,我们却离真正的智能更远了

2025年,AI领域最吊诡的一幕正在上演:大模型在各类标准化测试中屡破纪录,从SAT到律师资格考试,几乎“刷爆”所有人类基准。然而,当被问及“9.11和9.9哪个大”时,它仍可能自信地回答“9.11更大”——因为“11比9大”。这看似荒诞的答案,恰恰撕开了当前AI发展路径的深层裂痕:我们正用规模堆砌出“伪智能”,却离真正的通用人工智能(AGI)越来越远。

AGI的“罗夏墨迹测试”:谁在定义终点?

黄仁勋说五年内实现AGI,马斯克宣称明年就能达成。这些豪言壮语背后,隐藏着一个令人不安的事实:AGI至今没有一把公认的“尺子”。OpenAI与微软的秘密协议中,AGI被定义为“能创造千亿美元利润的系统”;而在公众讨论中,它又常被简化为“像人一样思考的机器”。这种定义的混乱,正如罗夏墨迹测试——每个人看到的,只是自己心中的投影。

澳大利亚国立大学研究员Michael Timothy Bennett在近期论文中指出,当前AGI研究陷入了一种“人类中心主义”的陷阱:我们总在问“它像不像人”,却忘了智能的本质是在有限资源下适应新环境的能力。他提出,真正的AGI不应是“超级人类”,而应是一个“人工科学家”——能主动探索、理解因果、权衡探索与利用,并在现实约束下持续进化。

为什么大模型“高分低能”?

当前主流大模型的训练逻辑,本质上是“规模最大化的近似”:用海量数据和算力,把尽可能多的任务答案“预存”在神经网络权重中。这种模式在训练分布内表现惊艳,但一旦遇到分布外问题(如数字比较、逻辑推理),便立刻暴露其“知其然不知其所以然”的缺陷。

更关键的是,大模型缺乏主动能力。它无法像科学家一样设计实验、验证假设,也无法在“继续探索新知识”与“利用已有知识解决问题”之间做出权衡。它只是一个被动的模式匹配器,而非主动的认知主体。当环境变化时,它既不能自主获取新信息,也无法构建因果链条来解释异常现象。

Bennett强调,真正的智能必须包含三个核心维度:
1. 主动实验:能自主规划行动以获取关键信息;
2. 因果理解:能区分相关性与因果性,建立可解释的推理链条;
3. 资源权衡:在计算、记忆与能量限制下,动态分配资源以平衡探索与利用。

告别Scaling Law:通往AGI的新路径

基于上述框架,Bennett将当前AI发展路径拆解为三类元方法:
- Scale-maxing(规模最大化):依赖参数、数据与算力的无限堆叠,效率低下且不可持续;
- Simp-maxing(简单性最大化):追求极简模型,但牺牲了适应复杂任务的能力;
- Adapt-maxing(适应最大化):以“人工科学家”为目标,强调在约束条件下的主动适应能力。

显然,第三条路径才是通向AGI的正道。它不追求“全能”,而是聚焦于智能的本质功能——在不确定环境中持续学习与进化。这意味着未来的AI系统需要具备更强的因果推理模块、主动交互机制,以及资源感知的决策能力。

更重要的是,Bennett将“能量限制”写入AGI定义,划清了智能与算力的界限:一个需要消耗一座核电站才能解决新问题的系统,不过是昂贵的计算器,而非真正的智能体。

重绘起跑线:从模仿到创造

2025年,我们正站在AGI定义的十字路口。旧的标准——图灵测试、人类基准测试——已被大模型“刷爆”,却无法衡量真正的通用智能。Bennett提出的“人工科学家”框架,为行业提供了一把更具科学性和可操作性的新尺子。

它提醒我们:AGI不是更聪明的鹦鹉,而是能提出新问题、设计新实验、发现新规律的认知伙伴。未来的突破,或许不在于更大的模型,而在于更聪明的架构——那些能主动探索世界、理解因果关系,并在资源约束下优雅适应的系统。

当大模型仍在背诵答案时,真正的智能,已经开始思考“为什么”。

标签: AGI 人工智能 因果推理 主动学习 智能定义

相关文章

AI算力引爆产业变革:芯片到机器人的连锁反应

科技浪潮下的产业变局:从AI算力到智能终端的连锁反应 近期科技产业动态频出,从芯片制造到机器人落地,从仓储智能化到车企战略调整,一系列动作背后,折射出全球科技巨头在AI驱动下的战略布局与产业重构。在这...

生成式AI ROI达49%,智能体如何落地变现

从试验田到生产线:生成式 AI 与智能体的 ROI 兑现之路 过去几年,生成式 AI 的风潮席卷全球,企业纷纷投入资源进行试点探索。然而,随着技术逐渐成熟,讨论的焦点已从“AI 能做什么”转向“AI...

Cursor 3重塑开发范式:智能体成代码主力

从“写代码”到“管智能体”:Cursor 3 如何重塑开发范式 当开发者还在适应 AI 辅助编程的“副驾驶”模式时,Anysphere 已经将 Cursor 推向了一个更激进的阶段——智能体优先。最新...

DeepSeek融资破戒:理想主义遭遇资本现实

资本入场,理想退场:DeepSeek 的“破戒”时刻 在 AI 大模型的竞技场中,DeepSeek 一直以“技术理想主义”的姿态特立独行。创始人梁文锋曾立下铁律:不接受外部融资,不稀释股权,不被商业时...

从RAG到CAG:企业级AI系统的上下文进化

从 RAG 到 CAG:企业级 AI 系统的上下文进化 检索增强生成(RAG)作为当前企业集成大语言模型的主流范式,已在知识问答、智能客服等场景中展现出强大的实用性。它通过将外部知识库的检索结果注入模...

AI顶尖人才回流大厂背后的战略逻辑

从独立研究到平台赋能:顶尖AI人才的“回流”逻辑 在AI大模型竞争白热化的当下,人才流动往往被视为行业风向标。近期,前DeepSeek核心研究员、V3与R1模型的核心作者郭达雅确认加入字节跳动Seed...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。