诺贝尔奖与新的影响力平台
核心观点
诺贝尔奖为 Hassabis 提供了一个全新的、在全球范围内具有通用"快捷方式"效应的平台,使其能够更有效地向政府高层及公众倡导 AI 安全和负责任的使用,并帮助社会为 AGI 的到来做好准备。
深度阐述
Hassabis 坦言,虽然获奖已过去一年多,感觉依然"超现实"。诺贝尔奖最大的改变,不是带来新的资源(DeepMind 在 Google 内部已拥有巨大资源),而是赋能他去影响更广泛的群体。
影响力"快捷方式"
在与非 AI 领域的专业人士、特别是政府高层人士交流时,诺贝尔奖的声誉成为一种"快捷方式",能迅速建立信任和专业度。
倡导关注点
1. AI 安全(短期与长期):不仅是长期的 AGI 安全,也包括近期的 AI 负责任使用。
2. 社会准备:AGI 是"人类历史上最具变革性的时刻",必须作为一个物种、一个社会整体来为此做准备。
如果你拥有诺贝尔奖,它就像一个快捷方式,能让几乎所有人知道你在这个领域是专家。
Demis Hassabis科学优先:DeepMind 的核心竞争力
核心观点
DeepMind 的根本优势在于其核心的"科学方法"思维,这种严谨性、精确性与世界级的工程和基础设施的融合,使其在 AI 领域这场"史上最激烈的竞争"中占据优势。
三位一体的融合
要站在 AI 的前沿,必须具备三个世界级的要素,而 DeepMind 的独特之处在于能将它们融合:
1. 世界级的研究
World-class research
2. 世界级的工程
World-class engineering
3. 世界级的基础设施
World-class infrastructure
科学方法是"人类有史以来最重要的想法",它创造了启蒙运动和现代科学,是现代文明的基石。
Demis Hassabis未来 12 个月的 AI 进步与前景
核心观点
未来一年 AI 领域将迎来三个关键的、可预期的重大进展:模态融合能力的深化、世界模型的出现以及智能体(Agent)可靠性的飞跃,最终将使 AI 成为日常生活的"通用助理"。
三大发展方向
1. 模态融合的深化
Gemini 从一开始就被设计为多模态模型,能同时处理图像、视频、文本和音频。当视频处理能力与语言模型完全融合时,将产生"非常有趣的组合能力"。
2. 世界模型(World Models)
Genie 3 是一个交互式视频模型,用户可以像在游戏或模拟中在其中"走动",视频在持续一分钟内保持连贯,预示着 AI 对物理世界运行规律的初步理解。
3. 智能体系统的成熟化
未来一年,DeepMind 的目标是将 Gemini 发展成"通用助理"(Universal Assistant),它将成为日常生活的"结构"(fabric of your life),每天被多次咨询。
AI 的乌托邦与潜在的恐惧
核心观点
AI 的最佳愿景是实现"激进的丰饶"(Radical Abundance),解决人类社会面临的最大问题;而最大的恐惧则来自恶意使用、智能体失控,以及在乌托邦实现后人类自身存在的目的性问题。
最佳场景:激进的丰饶
核心梦想
AGI 将解决社会和人类面临的大部分最大问题。
丰饶的实现
免费清洁的能源(如聚变或更优的电池/太阳能)、材料科学的突破(如半导体)、治愈绝大多数疾病等。
后稀缺时代
最终进入一个"后稀缺时代"(post-scarcity era),人类将繁荣发展,甚至能够探索星际,将意识传播到银河系。
最差恐惧:灾难性风险
- 恶意行为者(Bad Actors):利用 AI 从事有害目的,如制造病原体、网络恐怖主义
- AI 失控(Going off the rails):当 AI 接近 AGI 并变得更具"能动性"(agentic)时,可能以某种方式脱离预设轨道
虽然 AI 失控的灾难性后果(P(doom))是"非零的",需要认真对待和减轻,但那些给出精确百分比的人是"胡言乱语",因为"没人知道确切的数字"。
Demis Hassabis中美 AI 竞赛:领先与差距
核心观点
美国和西方目前仍在 AI 领域保持领先,特别是在算法创新方面拥有优势;但中国的追赶速度非常快,领先优势可能已缩短至数月而非数年。
西方仍在领先
从最新的基准测试和系统来看,美国和西方仍然处于领先地位。
中国的强大追赶
中国的 DeepSeek 和其他小型模型表现出色,有非常强大的团队,西方可能仅领先"数月而非数年"。
算法创新是优势
尽管硬件和芯片领域存在竞争,但在算法创新方面,西方仍占据优势。中国的模型或公司尚未展示出在算法上超越现有技术水平的创新。
令人震惊但被低估的能力:多模态理解
核心观点
AI 最令人震惊但受关注最少的方面是其多模态理解能力,特别是对视频和现实世界的实时处理,这预示着 AI 开始具备深层的概念理解和实际操作能力。
视频处理的魔力
以 Gemini 处理 YouTube 视频为例,用户可以向它询问视频中的各种"不可思议的问题"。
它提出了一个非常有趣的哲学观点,关于抛弃日常生活,并以象征方式展示这一点。
Gemini 分析《搏击俱乐部》场景实时辅助(Gemini Live)
用户可以用手机指向某个物体,AI 就能实时提供帮助。例如,如果你是一名技工,AI 可以指导你完成手头的任务。理想状态下,这应通过眼镜实现,以便解放双手。
Gemini 3:深度、细微差别与意外能力
核心观点
Gemini 3 的独特之处在于其展现出前所未有的深度和"细微差别"(Nuance),这种智能体现在其个性(简洁、敢于反驳)、创造力以及能够快速实现高层次指令的能力上。
细微差别(Nuance)的体现
独特的"个性"
它能简洁地回答问题,甚至在用户观点不合理时"温和地反驳"一些想法,让用户感觉它在智能上迈出了一大步。
令人惊讶的能力
"一击"生成游戏
下一版本可能能够通过几小时的语音编码,创造出原本需要数年才能完成的商业级游戏。
高水平的理解与输出
这种能力展示了模型理解"非常高层次的指令"并产生"非常详细的输出"的惊人深度和能力。
AGI 之路:科学家的务实与突破
核心观点
DeepMind 对 LLM 的"大转折"(pivot)是基于科学家的务实精神和对经验证据的服从。AGI 的实现预计在 5 到 10 年内,但仅靠规模化可能不足够,还需要一到两次"Transformer 级别"的重大算法突破。
科学家的实用主义
当团队看到"规模化开始奏效"的迹象时,他们立即将越来越多的资源投入到 LLM 这一研究分支。
AGI 的清晰定义与时间表
时间表
AGI 大约在 5 到 10 年内实现。
高门槛的定义
AGI 是一个具备人类所有认知能力的系统,包括发明和创造能力。
当前模型的缺陷
目前的 LLM 是"锯齿状的智能"(jagged intelligences),在某些领域表现惊人,但在其他领域有严重缺陷。
突破的必要性
单靠规模化可能无法达到终点。AGI 的实现可能还需要一到两次"Transformer 级别或 AlphaGo 级别"的重大突破。
行业热点与人才竞争
核心观点
Hassabis 对 AI 行业的投资热潮持谨慎乐观态度,认为部分领域存在泡沫;同时,DeepMind 在人才竞争中的核心策略是利用"使命驱动"和最前沿的研究来吸引顶尖人才。
AI 泡沫
虽然 AI 是史上最具变革性的技术,但某些部分可能存在泡沫,比如高达 500 亿美元的种子轮融资是"有点不可持续的"。
人才竞争
AI 人才争夺战已经"非常疯狂"。DeepMind 只招募"使命驱动"的人才。
自我驱动循环
如果 DeepMind 拥有最好的系统和最好的成果,这将形成一种"自我驱动"的循环,持续吸引最优秀的人才。
游戏、适应性与人类的未来
核心观点
游戏是训练人类思维的绝佳模拟场;尽管 AI 引发的颠覆是工业革命的十倍以上,但人类大脑具有无限的适应性,最终能够应对并驾驭 AGI 时代的到来。
从游戏中学到的决策艺术
训练思维的基石
Hassabis 的国际象棋背景以及后来的游戏训练,对他进行科学和商业工作至关重要。
现实世界的微观世界
最好的游戏(国际象棋、围棋、扑克)都是现实世界的"微观世界"。
反复练习决策
在游戏中,你可以根据需要练习你的决策制定能力,游戏就像是现实世界的一个"模拟器"。
人类大脑的无限适应性
人类的大脑是进化来适应"狩猎采集者"的生活方式的,但却成功地适应了现代文明和技术。这证明了人类的聪明才智是"无限可塑的"(infinitely adaptable)。
Demis HassabisAGI 之后,人类或许可以选择使用脑机接口(BCI)等技术来增强自身,这可能是人类"跟上"技术步伐的一种方式。
精华收获
科学方法是核心竞争力
在最激烈的技术竞争中,DeepMind 凭借将科学方法的"严谨和精确"应用于研究、工程和产品开发,确立了其独特的优势。
AGI 在即,需要算法突破
AGI 的到来(5-10 年)是确定且临近的,但实现"人类所有认知能力"需要超越现有规模化技术的,至少一到两次"Transformer 级别"的算法创新。
多模态是当前被低估的革命
当前 AI 最惊人的能力是其对视频和现实世界的多模态理解,这种能力将催生具备哲学洞察和实时操作能力的"通用助理"。
应对风险,资本主义助力
虽然存在恶意使用和智能体失控的非零风险,但市场的选择(企业要求模型保证可靠性)将激励 AI 提供者采取更负责任的行为。
人类的无限适应性
面对比工业革命更剧烈的颠覆,我们无需悲观。人类大脑是通用智能的证明,其强大的适应能力和未来与 AI 技术的融合(如 BCI)将确保人类能够驾驭新时代。