scripod.com

和李楠谈人机交互:AI 时代的 “iPhone 时刻” 离我们只有 12 个月?-Vol74

脑放电波

2025/07/20
脑放电波

脑放电波

2025/07/20
在 AI 技术快速发展的今天,人机交互正迎来一场深刻的变革。语音作为一种自然、高效的交互方式,正在逐步取代传统的键盘与触控操作。本期节目邀请到怒喵科技创始人李楠,一同探讨语音交互如何重塑我们的数字生活,以及本地模型与大模型在其中扮演的角色。
节目围绕语音交互的崛起与未来人机交互的范式转变展开。首先分析了理想同学的‘三模型架构’如何实现低延迟、高响应的语音交互体验,并在游戏等场景中展现出颠覆性优势。接着讨论了语音输入法的发展趋势,如 Wispr Flow 如何通过意图理解提升输入效率,并指出当前操作系统尚未为模型交互做好准备。最后强调,真正有价值的 AI 交互不是‘一键生成’,而是通过深入对话挖掘模型潜力,语音输入正是推动这种深度交互的关键。未来,随着 AI 感知能力的增强,交互将更加贴近人类自然行为。
01:47
01:47
人机交互的三次重大范式转换成就了微软、苹果与 iPhone
23:39
23:39
语音指令在游戏中可自动完成打药、开爆闪等操作
31:36
31:36
大模型让语音输入法具备意图理解能力,省去打字及梳理思路的工作
1:07:28
1:07:28
语音输入是当今最被低估的输入或输出形式