E223|应用爆发之年:聊聊模型技术进化与商业化
硅谷101
Jan 30
E223|应用爆发之年:聊聊模型技术进化与商业化
E223|应用爆发之年:聊聊模型技术进化与商业化

硅谷101
Jan 30
本期播客聚焦大模型从技术理想走向商业现实的关键跃迁,三位来自阿里云、影石 Insta360 和语忆科技的一线实践者,围绕 AI 在真实产业场景中的落地逻辑展开深度对谈。
2025 年大模型正加速进入商业化深水区:视频生成已实现可控生产,支持漫剧与电商广告的低成本工业化;语言模型推理能力增强、结构更稀疏,推理成本半年内接近下降一个量级;端云协同成为新范式,七成通用任务可在终端本地完成,兼顾隐私与低延时。企业关注点从模型参数转向性能、成本与业务适配性,小模型 + Prompt 微调成为主流选择。AI 应用也从降本迈向增效 —— 影石用多模态分层架构破解全景视频理解难题,语忆通过消费者声音分析助力品牌发现营销机会并提升销量。各方共识是:未来竞争不在于谁有最大模型,而在于谁能深耕行业、封装价值、持续迭代,真正让 AI “有用” 而非 “炫技”。
00:01
00:01
千问大模型在开源领域有较大体量,北美公司会用其作基模用于挑战 AI 智慧、进入生产环节
05:12
05:12
模型可对输入视频里人物的形象和声音保 ID 并复刻,提高生成内容的可控性
08:40
08:40
AI 生成 15 秒广告成本可控制在 10–15 元以下,低于市场合格广告价格
13:59
13:59
模型不再仅依赖单一概率,有自身逻辑偏好
16:27
16:27
千问 APP 可通过自然语言实现订咖啡、订座位等商业闭环
21:16
21:16
算力强的手机厂商和车厂经两三年打磨,开始考虑端云结合架构,端侧模型受关注
22:13
22:13
通用和基本交互任务七成以上可由端侧模型解决
25:53
25:53
客户对平台提出 Prompt Training 或 Fine-Tuning 需求,希望混合开源数据和开源模型来训练适合自己的小模型
28:25
28:25
垂直一体化不仅涉及芯片和模型,还与云有关
31:18
31:18
开源显著带动阿里云商业化,形成正循环
35:24
35:24
Agent as Service 通过集成多个模型封装出标准化任务结果供客户使用
35:41
35:41
大模型研发虽讨论热度不如商业化,但已进入高度竞争阶段,有大量工程细节待推敲使推理成本下降
38:59
38:59
与阿里合作集中在千问大模型和 Qwen 系列视频生成模型,前者偏感知理解,后者偏特效生成
40:50
40:50
用户难以清晰表达剪辑意图,让模型理解模糊语句也较困难
43:03
43:03
通用大模型对全景素材理解较差,需自研全景理解模型提取高光后再接入通用大模型编排
52:24
52:24
AI 归因模型落地后显著减少人工分析成本
54:17
54:17
千问在电商场域消费者意图理解能力较强
57:59
57:59
AI 驱动消费者洞察落地营销,实测销量提升 23%
1:02:18
1:02:18
AI 未来价值核心在人,人如何看待和挖掘 AI 处理后数据的洞察很关键
1:05:26
1:05:26
基于百万通对话、语音及社交媒体帖子数据预估大模型 Token 成本并换算给客户对应价格