146: Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向
晚点聊 LateTalk
2025/12/26
146: Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向
146: Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向

晚点聊 LateTalk
2025/12/26
在 AI 技术快速演进的当下,一线开发者和投资人正从模型能力、工具链创新与生态协同等多个维度,重新定义智能体(Agent)的边界与可能性。本期节目汇聚了来自硅谷核心团队的实践洞察,深入探讨技术趋势背后的驱动力。
随着大模型进入实用化阶段,Gemini 3、GPT-5.2 和 Claude 等模型在办公自动化、多模态生成等场景中表现突出,但长尾问题与真实工作流适配仍是挑战。谷歌通过 TPU 与模型垂直整合建立优势,而 OpenAI 和 Anthropic 则在工具调用范式上引领创新,如 PTC 提升 Agent 稳定性。创业方向聚焦垂类应用与中间层工具,强化学习环境和服务化(RLaaS)成为新热点。企业选型更看重云生态兼容性而非单纯性能,开源模型如 Qwen 和 DeepSeek 也获得广泛认可。未来优化将集中在长程任务、多模态理解与基于真实使用轨迹的自我演化能力上。
10:08
10:08
GPT-5.2 在相同成本下完成任务的能力显著提升
18:17
18:17
ChatGPT 本身可视为 Agent,连接工具后更是如此。
20:56
20:56
Gemini 3 Pro 在生成网页和交互体验上的突破使其具备强传播性
24:21
24:21
Nano Banana 的名字来自美甲上的香蕉图案,命名过程十分随意。
24:55
24:55
Google 的 Orio 在 Gemini 3 发布后表示其在 Pretraining 上有诸多突破,且未来还有改进空间。
26:34
26:34
谷歌 TPU 与模型基础设施协同设计打通整个生态系统,如今迎来爆发点
36:29
36:29
英伟达曾视 Google TPU 为劲敌,老黄要求谷歌云采购 NVIDIA GPU 以换取放缓 TPU 推广
42:10
42:10
纯粹的研究员更注重研究过程的自我突破,在谷歌内部仍可分享成果。
49:48
49:48
小厂在 AGI 实现前有机会在特定领域超越大模型
50:23
50:23
持续学习能让模型在应用场景中越用越好,Cursor 号称已实现在线强化学习。
57:43
57:43
盲测中比现有工具好 12%,显著提升 Agent 性能
1:01:49
1:01:49
RL 环境正从 AI 玩游戏转向具有实际经济价值的应用场景
1:08:47
1:08:47
企业不会轻易让数据离开当前云平台,迁移成本高且 CTO 态度保守
1:12:24
1:12:24
Claude 模型在 Agent 场景中具备显著的编程与生态集成优势
1:20:55
1:20:55
NeurIPS 航班上约三分之一人在看 DeepSeek V3.2 论文
1:27:00
1:27:00
“墨西哥卷饼测试” 是检验多模态生成能力的有趣基准
1:35:26
1:35:26
Agent 框架带动下游生态,下游生态反哺模型训练,形成正向强化循环。