110. 逐段讲解 Kimi K2 报告并对照 ChatGPT Agent、Qwen3-Coder 等:“系统工程的力量”
张小珺Jùn|商业访谈录
2025/07/30
110. 逐段讲解 Kimi K2 报告并对照 ChatGPT Agent、Qwen3-Coder 等:“系统工程的力量”
110. 逐段讲解 Kimi K2 报告并对照 ChatGPT Agent、Qwen3-Coder 等:“系统工程的力量”

张小珺Jùn|商业访谈录
2025/07/30
Shownote
Shownote
我们又来读论文啦!!! 今天我们要读的论文是最近几个星期内最值得品读的几篇技术报告,分别是:Kimi K2、ChatGPT Agent、Qwen3-Coder 的技术报告,以及 Manus 的一篇技术博文。他们的相关性是,这几篇内容都和 Agent 有关系。 今天的嘉宾是俄亥俄州立大学(The Ohio State University)的在读博士郑博元,他的研究方向是 Language Agent,他会带我们一起读上述技术报告和博文。 这是《商业访谈录》的 “技术之美” 系列,期待和你一起读论文,领略科技平权,感受...
Highlights
Highlights
本期节目聚焦于当前最前沿的 AI 智能体(Agent)技术,邀请了俄亥俄州立大学的语言智能体研究者郑博元,共同解读 Kimi K2、ChatGPT Agent、Qwen3-Coder 等多篇技术报告。节目从智能体的基本定义与分类出发,深入探讨了不同技术路线的优劣、训练方法的关键环节,以及当前智能体在实际应用中的表现与挑战。
Chapters
Chapters
本期内容概览与嘉宾介绍
00:00给 Agent 下定义和分类
02:00Kimi K2、ChatGPT Agent、Qwen3-Coder、Manus 的技术路线对比
14:50为什么对 ChatGPT Agent 整体比较失望?
19:05Agent Training 的关键环节:合成数据、强化学习、安全
28:29第一篇技术报告:Kimi K2: Open Agentic Intelligence
30:57第二篇技术报告和访谈:Introducing ChatGPT agent: bridging research and action
43:50第三篇技术报告:Qwen3-Coder: Agentic Coding in the World
1:53:38第四篇技术博文:AI 代理的上下文工程:构建 Manus 的经验教训(作者:Yichao 'Peak' Ji)
1:59:04展望:也许会有一个新的范式
2:06:06我感觉 Agent 是 “我拓展的大脑”,我背后有一个 “军团”(Family of Agents)
2:15:20不同 Bot 的语言风格:DeepSeek 嘴臭,元宝舔狗
2:16:41Transcript
Transcript
张小珺: Kimi K2 就非常实在把所有的很多 Recipe 或者小技巧都已经在这放着。但是我觉得假如我们真的要把它做出来,一种很高效的方式把它高速量做出来,本身可能还是很难的。因为每一个部分去把这个 Prompt 调好,还要包括各种参数调好。保证它的能平稳的运行或者很高的质量,本身是一个非常大的工程量。然后这里有点像,就是像是一个手艺活,所以研究员都是老师傅,感觉手艺活,像是一个老师傅。Agent 是我的另外一个大脑,就是一个特展的大脑,我日常做事情的时候,最后有一个军团在帮我做事情。我们能不能用 Ag...

Open in 小宇宙