scripod.com

110. 逐段讲解Kimi K2报告并对照ChatGPT Agent、Qwen3-Coder等：“系统工程的力量”

Overview

Shownote

Highlights

Transcript

Chapters

Pins

110. 逐段讲解 Kimi K2 报告并对照 ChatGPT Agent、Qwen3-Coder 等：“系统工程的力量”

张小珺Jùn｜商业访谈录

2025/07/30

110. 逐段讲解 Kimi K2 报告并对照 ChatGPT Agent、Qwen3-Coder 等：“系统工程的力量”

110. 逐段讲解 Kimi K2 报告并对照 ChatGPT Agent、Qwen3-Coder 等：“系统工程的力量”

张小珺Jùn｜商业访谈录

张小珺Jùn｜商业访谈录

2025/07/30

Overview Shownote Highlights Transcript Chapters Pins

Shownote

我们又来读论文啦！！！今天我们要读的论文是最近几个星期内最值得品读的几篇技术报告，分别是：Kimi K2、ChatGPT Agent、Qwen3-Coder 的技术报告，以及 Manus 的一篇技术博文。他们的相关性是，这几篇内容都和 Agent 有关系。今天的嘉宾是俄亥俄州立大学（The Ohio State University）的在读博士郑博元，他的研究方向是 Language Agent，他会带我们一起读上述技术报告和博文。这是《商业访谈录》的 “技术之美” 系列，期待和你一起读论文，领略科技平权，感受...

Highlights

本期节目聚焦于当前最前沿的 AI 智能体（Agent）技术，邀请了俄亥俄州立大学的语言智能体研究者郑博元，共同解读 Kimi K2、ChatGPT Agent、Qwen3-Coder 等多篇技术报告。节目从智能体的基本定义与分类出发，深入探讨了不同技术路线的优劣、训练方法的关键环节，以及当前智能体在实际应用中的表现与挑战。

02:13

语言智能体能通过感知环境与执行动作实现自动化任务

14:59

Manus 不训练模型，而是通过提示工程与多智能体设计实现快速迭代

24:46

Agent 自动化行为可能造成 Agentic DDoS 攻击，影响互联网安全

40:41

Kimi K2 引入 Fidelity Verification 机制确保数据准确性

1:06:03

通过定义动作空间和小环境生成多样化任务，提高数据质量

1:53:38

Qwen3-Coder 在 open router 平台使用排名高，并引入了 agentic browser use 任务。

2:03:30

通过 To-Do Markdown 控制模型注意力，提高生成效率

2:09:28

通过 reward model 模块判断探索是否成功，并将轨迹转为 API 供调用

2:15:20

未来每人可能拥有多个 AI 代理组成的 “代理家族” 协助完成任务。

Chapters

本期内容概览与嘉宾介绍

00:00

给 Agent 下定义和分类

02:00

Kimi K2、ChatGPT Agent、Qwen3-Coder、Manus 的技术路线对比

14:50

为什么对 ChatGPT Agent 整体比较失望？

19:05

Agent Training 的关键环节：合成数据、强化学习、安全

28:29

第一篇技术报告：Kimi K2: Open Agentic Intelligence

30:57

第二篇技术报告和访谈：Introducing ChatGPT agent: bridging research and action

43:50

第三篇技术报告：Qwen3-Coder: Agentic Coding in the World

1:53:38

第四篇技术博文：AI 代理的上下文工程：构建 Manus 的经验教训（作者：Yichao 'Peak' Ji）

1:59:04

展望：也许会有一个新的范式

2:06:06

我感觉 Agent 是 “我拓展的大脑”，我背后有一个 “军团”（Family of Agents）

2:15:20

不同 Bot 的语言风格：DeepSeek 嘴臭，元宝舔狗

2:16:41

Transcript

张小珺: Kimi K2 就非常实在把所有的很多 Recipe 或者小技巧都已经在这放着。但是我觉得假如我们真的要把它做出来，一种很高效的方式把它高速量做出来，本身可能还是很难的。因为每一个部分去把这个 Prompt 调好，还要包括各种参数调好。保证它的能平稳的运行或者很高的质量，本身是一个非常大的工程量。然后这里有点像，就是像是一个手艺活，所以研究员都是老师傅，感觉手艺活，像是一个老师傅。Agent 是我的另外一个大脑，就是一个特展的大脑，我日常做事情的时候，最后有一个军团在帮我做事情。我们能不能用 Ag...

小宇宙

Open in 小宇宙