scripod.com

146: Gemini 3翻盘背后、Agent需要什么大模型、RL创业机会|与前 Google 创业者、硅谷投资人聊湾区动向

Overview

Shownote

Highlights

Transcript

Chapters

Pins

146: Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会|与前 Google 创业者、硅谷投资人聊湾区动向

晚点聊 LateTalk

2025/12/26

146: Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会|与前 Google 创业者、硅谷投资人聊湾区动向

146: Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会|与前 Google 创业者、硅谷投资人聊湾区动向

晚点聊 LateTalk

晚点聊 LateTalk

2025/12/26

Overview Shownote Highlights Transcript Chapters Pins

在 AI 技术快速演进的当下，一线开发者和投资人正从模型能力、工具链创新与生态协同等多个维度，重新定义智能体（Agent）的边界与可能性。本期节目汇聚了来自硅谷核心团队的实践洞察，深入探讨技术趋势背后的驱动力。

随着大模型进入实用化阶段，Gemini 3、GPT-5.2 和 Claude 等模型在办公自动化、多模态生成等场景中表现突出，但长尾问题与真实工作流适配仍是挑战。谷歌通过 TPU 与模型垂直整合建立优势，而 OpenAI 和 Anthropic 则在工具调用范式上引领创新，如 PTC 提升 Agent 稳定性。创业方向聚焦垂类应用与中间层工具，强化学习环境和服务化（RLaaS）成为新热点。企业选型更看重云生态兼容性而非单纯性能，开源模型如 Qwen 和 DeepSeek 也获得广泛认可。未来优化将集中在长程任务、多模态理解与基于真实使用轨迹的自我演化能力上。

10:08

10:08

GPT-5.2 在相同成本下完成任务的能力显著提升

18:17

18:17

ChatGPT 本身可视为 Agent，连接工具后更是如此。

20:56

20:56

Gemini 3 Pro 在生成网页和交互体验上的突破使其具备强传播性

24:21

24:21

Nano Banana 的名字来自美甲上的香蕉图案，命名过程十分随意。

24:55

24:55

Google 的 Orio 在 Gemini 3 发布后表示其在 Pretraining 上有诸多突破，且未来还有改进空间。

26:34

26:34

谷歌 TPU 与模型基础设施协同设计打通整个生态系统，如今迎来爆发点

36:29

36:29

英伟达曾视 Google TPU 为劲敌，老黄要求谷歌云采购 NVIDIA GPU 以换取放缓 TPU 推广

42:10

42:10

纯粹的研究员更注重研究过程的自我突破，在谷歌内部仍可分享成果。

49:48

49:48

小厂在 AGI 实现前有机会在特定领域超越大模型

50:23

50:23

持续学习能让模型在应用场景中越用越好，Cursor 号称已实现在线强化学习。

57:43

57:43

盲测中比现有工具好 12%，显著提升 Agent 性能

1:01:49

1:01:49

RL 环境正从 AI 玩游戏转向具有实际经济价值的应用场景

1:08:47

1:08:47

企业不会轻易让数据离开当前云平台，迁移成本高且 CTO 态度保守

1:12:24

1:12:24

Claude 模型在 Agent 场景中具备显著的编程与生态集成优势

1:20:55

1:20:55

NeurIPS 航班上约三分之一人在看 DeepSeek V3.2 论文

1:27:00

1:27:00

“墨西哥卷饼测试” 是检验多模态生成能力的有趣基准

1:35:26

1:35:26

Agent 框架带动下游生态，下游生态反哺模型训练，形成正向强化循环。