scripod.com

E223｜应用爆发之年：聊聊模型技术进化与商业化

Overview

Shownote

Highlights

Transcript

Chapters

Pins

E223｜应用爆发之年：聊聊模型技术进化与商业化

硅谷101

Jan 30

E223｜应用爆发之年：聊聊模型技术进化与商业化

E223｜应用爆发之年：聊聊模型技术进化与商业化

硅谷101

硅谷101

Jan 30

Overview Shownote Highlights Transcript Chapters Pins

本期播客聚焦大模型从技术理想走向商业现实的关键跃迁，三位来自阿里云、影石 Insta360 和语忆科技的一线实践者，围绕 AI 在真实产业场景中的落地逻辑展开深度对谈。

2025 年大模型正加速进入商业化深水区：视频生成已实现可控生产，支持漫剧与电商广告的低成本工业化；语言模型推理能力增强、结构更稀疏，推理成本半年内接近下降一个量级；端云协同成为新范式，七成通用任务可在终端本地完成，兼顾隐私与低延时。企业关注点从模型参数转向性能、成本与业务适配性，小模型 + Prompt 微调成为主流选择。AI 应用也从降本迈向增效 —— 影石用多模态分层架构破解全景视频理解难题，语忆通过消费者声音分析助力品牌发现营销机会并提升销量。各方共识是：未来竞争不在于谁有最大模型，而在于谁能深耕行业、封装价值、持续迭代，真正让 AI “有用” 而非 “炫技”。

00:01

00:01

千问大模型在开源领域有较大体量，北美公司会用其作基模用于挑战 AI 智慧、进入生产环节

05:12

05:12

模型可对输入视频里人物的形象和声音保 ID 并复刻，提高生成内容的可控性

08:40

08:40

AI 生成 15 秒广告成本可控制在 10–15 元以下，低于市场合格广告价格

13:59

13:59

模型不再仅依赖单一概率，有自身逻辑偏好

16:27

16:27

千问 APP 可通过自然语言实现订咖啡、订座位等商业闭环

21:16

21:16

算力强的手机厂商和车厂经两三年打磨，开始考虑端云结合架构，端侧模型受关注

22:13

22:13

通用和基本交互任务七成以上可由端侧模型解决

25:53

25:53

客户对平台提出 Prompt Training 或 Fine-Tuning 需求，希望混合开源数据和开源模型来训练适合自己的小模型

28:25

28:25

垂直一体化不仅涉及芯片和模型，还与云有关

31:18

31:18

开源显著带动阿里云商业化，形成正循环

35:24

35:24

Agent as Service 通过集成多个模型封装出标准化任务结果供客户使用

35:41

35:41

大模型研发虽讨论热度不如商业化，但已进入高度竞争阶段，有大量工程细节待推敲使推理成本下降

38:59

38:59

与阿里合作集中在千问大模型和 Qwen 系列视频生成模型，前者偏感知理解，后者偏特效生成

40:50

40:50

用户难以清晰表达剪辑意图，让模型理解模糊语句也较困难

43:03

43:03

通用大模型对全景素材理解较差，需自研全景理解模型提取高光后再接入通用大模型编排

52:24

52:24

AI 归因模型落地后显著减少人工分析成本

54:17

54:17

千问在电商场域消费者意图理解能力较强

57:59

57:59

AI 驱动消费者洞察落地营销，实测销量提升 23%

1:02:18

1:02:18

AI 未来价值核心在人，人如何看待和挖掘 AI 处理后数据的洞察很关键

1:05:26

1:05:26

基于百万通对话、语音及社交媒体帖子数据预估大模型 Token 成本并换算给客户对应价格