scripod.com

58: 光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么?| AI 大爆炸

晚点聊 LateTalk

Shownote

本期是《晚点聊》「AI 大爆炸」系列第一期节目。 在这个系列里,我们既关注一个个 AI 公司或产品的创业和开发故事,也希望由此逐渐覆盖 AI 版图的各个面向,与关注 AI 热潮的听众一起探讨和见证这次新技术变革激起的浪涌。 这期节目中,曼祺邀请了一位老朋友,AI 领域的一位资深从业者和连续创业者,袁进辉。 袁进辉在 2016 年创立一流科技(OneFlow),2023 年加入光年之外任联合创始人,2023 年 6 月光年之外被美团收购后,袁进辉再次创业,成立硅基流动(SiliconFlow)。 在宣布这次创业的朋友圈中,袁进辉的配文是:“过去 15 年不算顺利,屡败屡战。” “屡败屡战” 与他创业以来一直所在的 AI Infra (AI 基础软件)领域在中国市场的状态有关。OneFlow 当年在 AI Infra 中做服务 AI 训练(模型的生产)的框架,SiliconFlow 则是做服务大模型推理(模型的应用)的框架。 AI 框架简单来说是连接底层硬件算力层和软件模型层之间的一层系统软件,它类似模型开发者们使用的操作系统。 纯软模式在中国的商业化和付费意愿一直是行业难题,这也是袁进辉此次创业想努力跑通的部分。 本期节目我们聊了: 第一段创业历程回顾 & AI Infra 是做什么? 01:51 - 梦想当科学家,2008 年博士后时选了一条激进的路,做机器学习和脑科学交叉学科研究。 06:10 - 当时深度学习还没热,未能转教职,来到工业界。在微软亚研院开发出 LightLDA(一种主题模型),这是互联网搜推广的核心系统之一,被快手等公司使用。 12:31 - 2016 年开始开发 AI 训练框架。当时 Google 的 TensorFlow 等框架已出现,如何差异化? 15:03 - 袁进辉的反共识判断:未来模型会变得非常大,需要新系统,创立 OneFlow。 18:27 - 再次创业,做硅基流动:看到大模型推理需求会超过训练,也能避免这支团队分散。 成立硅基流动,瞄准大模型推理需求 26:34 -“我们进光年的时候是 40 人,出来的时候是 35 人。” 28:42 - 业务重心:从训练转向推理,专注于大模型的推理部署。 36:00 - 商业模式:全球化战略,面向海外市场;在国内则要绑定客服愿意付费的东西,不能只有软件。 39:09 - 国内商业化的难度:需要创造性的策略和产品形态。 AI 基础设施的未来趋势与机遇 51:26 - 技术不会一直是壁垒,算法尤其传播得快。 53:44 - 工程能力可能更关键。因为一个算法上的好点子,往往被执行后 ROI 极高,所以大家都会做;工程优化则是每个单点的 ROI 都不大,需要日积月累,到最后真正会做的团队非常少。 56:18 - 期待大模型超级应用,认为它们大概率不来自现在的大模型公司。 58:12 - 成为 "张一鸣" 背后的人?但张一鸣背后没有人 —— 超级应用未来自己做 AI Infra 怎么办? 59:28 - 软件层面的竞争将加剧,但顶尖供应商将获得大回报。 01:04:43 - 在清华科技园吃饺子听到邻桌议论:“OneFlow 技术挺好…… 还不是被收购,没赚钱." 希望这次可以成为一个更好的范例。 相关阅读: 《晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资》 (https://mp.weixin.qq.com/s/mHIqJ07oGceIXvuhBUuvUw) 《硅基流动完成 5000 万元天使轮融资》 (https://mp.weixin.qq.com/s/ZZ5nsb7chsewyvGxLHhSpg) 本期节目中出现的产品、人物等名词: ・一批 AI 训练框架:TensorFlow(Google)、PyTorch(Meta)、PaddlePaddle(百度)、PAI(阿里)、Mindspore(华为)。 ・两个当前最主流的开源大模型推理框架:TensorRT-LLM(英伟达)、vLLM(伯克利大学)。 ・LightLDA:袁进辉在微软亚研院开发的主题模型训练算法和系统。 ・Geoffrey Hinton,图灵奖获得者,被认为是深度学习之父。 ・张钹,清华大学计算机系教授、中科院院士。 ・李飞飞,斯坦福大学教授,美国工程院院士。 ・李兆平,计算神经科学专家。 ・邢波(Eric Xing),穆罕默德・本・扎耶德人工智能大学校长。 ・汪玉,清华大学电子工程系主任,创立了无问芯穹。 ・尤洋,新加坡国立大学教授,创立了潞晨科技。 ・贾扬清,AI 训练框架 Caffe 作者之一,现在创立了 Lepton AI。 ・李沐、陈天奇,AI 训练框架 MXNet 作者。李沐曾担任亚马逊首席科学家,现在创立了 Boson.ai;陈天奇参与创办了 OctoAI。 登场人物: 袁进辉,硅基流动创始人。联系可加微信:SiliconFlow01 程曼祺,晚点科技报道负责人。即刻:程曼祺 _ 火柴 Q 贺乾明,晚点科技报道作者。即刻:我是 chiming 剪辑:甜食

Highlights

本期《晚点聊》是「AI 大爆炸」系列的第一期节目,主持人程曼祺邀请了 AI 领域资深从业者、连续创业者袁进辉,围绕他在 AI Infra(AI 基础软件)领域的创业经历与行业观察展开深入对话。节目不仅回顾了袁进辉从学术研究到工业界,再到两次创业的历程,也探讨了 AI 基础设施的发展趋势、商业化挑战以及未来可能出现的超级应用。
01:26
袁进辉提到过去 15 年创业经历屡战屡败,从清华博士毕业至今正好 15 年。
03:25
深度学习爆发前的前瞻性布局
07:49
LightLDA 是深度学习兴起前互联网公司重要的算法和系统
13:06
深度学习是工程密集型工作,将替代传统机器学习
15:03
当时主流模型参数规模小,如 CNN 模型,而现有系统已不适应未来大模型趋势
18:27
OneFlow 的多卡编程设计早于 PyTorch 两三年
28:05
大模型推理部署方向比好 offer 更有吸引力
30:20
大模型推理市场容量是训练的数倍,数据处理量远超训练
46:09
Crossing 推理框架性能优于英伟达和 vLLM
51:26
大模型的技术壁垒正在降低,但资金门槛依然存在
53:44
工程细节的积累难以开源,是构建壁垒的核心
56:18
超级应用可能不会由当前大模型公司主导开发
58:12
张一鸣靠自己兴起,代表了一种独立创业的路径
1:03:23
希望产品像大模型一样无处不在,成为 AI 基础设施公司

Chapters

AI Infra 创业故事与基础层探索
00:00
第一段创业历程回顾 & AI Infra 是做什么?
梦想当科学家,2008 年博士后时选了一条激进的路,做机器学习和脑科学交叉学科研究。
01:51
当时深度学习还没热,未能转教职,来到工业界。在微软亚研院开发出 LightLDA(一种主题模型),这是互联网搜推广的核心系统之一,被快手等公司使用。
06:10
2016 年开始开发 AI 训练框架。当时 Google 的 TensorFlow 等框架已出现,如何差异化?
12:31
袁进辉的反共识判断:未来模型会变得非常大,需要新系统,创立 OneFlow。
15:03
再次创业,做硅基流动:看到大模型推理需求会超过训练,也能避免这支团队分散。
18:27
成立硅基流动,瞄准大模型推理需求
“我们进光年的时候是 40 人,出来的时候是 35 人。”
26:34
业务重心:从训练转向推理,专注于大模型的推理部署。
28:42
商业模式:全球化战略,面向海外市场;在国内则要绑定客服愿意付费的东西,不能只有软件。
36:00
国内商业化的难度:需要创造性的策略和产品形态。
39:09
AI 基础设施的未来趋势与机遇
技术不会一直是壁垒,算法尤其传播得快。
51:26
工程能力可能更关键。因为一个算法上的好点子,往往被执行后 ROI 极高,所以大家都会做;工程优化则是每个单点的 ROI 都不大,需要日积月累,到最后真正会做的团队非常少。
53:44
期待大模型超级应用,认为它们大概率不来自现在的大模型公司。
56:18
成为 "张一鸣" 背后的人?但张一鸣背后没有人 —— 超级应用未来自己做 AI Infra 怎么办?
58:12
软件层面的竞争将加剧,但顶尖供应商将获得大回报。
59:28
在清华科技园吃饺子听到邻桌议论:“OneFlow 技术挺好…… 还不是被收购,没赚钱." 希望这次可以成为一个更好的范例。
1:04:43

Transcript

程曼祺: 大家好,欢迎收听本期的晚点聊,今天的主播是程曼祺和我们科技组的作者贺乾明,大家好。 贺乾明: 我是贺乾明。 程曼祺: 这期节目也是我们 AI 系列的第一期节目。我们会陆续约访 AI 领域的创业者,投资人和大公司 AI 团队的从业者。欢迎大家推荐你们想听的 AI 产品项目和嘉宾人选。今天我们非常高兴邀请到了 AI 领域的一位资深从业者和连续创业者。硅基流动的创始人袁进辉。袁老师之前也是光年之外的联创和一流科技的创始人。 袁进辉: 大家好,袁进辉。 程曼祺: 我先简单介绍一下袁老师之前的经历。袁老师是...