scripod.com

他的 AI 实验给你哪些创业灵感?|和鸭哥聊:给 AI 加上耳朵、眼睛,用 AI 买菜、寄快递

十字路口Crossing

Shownote

在科技行业里,有一些富有好奇心、动手能力又很强的极客,他们会在一些产品刚出现的时候就迅速上手,不仅使用,有时还会自己动手组装、魔改,把原本的产品玩出新的花样。 本周我们邀请的嘉宾鸭哥就是这样一位极客,最近我们知道,鸭哥在做一些 AI 实验,比如他自己做了一个语音输入法,用 Apple Watch 全天 24 小时录制自己说的话,这给 AI 更好地了解他提供了丰富的语料信息。此外,他还把 Insta360 挂在胸前,拍下全天候的视频和照片 —— 我们在访谈中说,鸭哥的这些 AI 实验,就像是给 AI 加了耳朵...

Highlights

在人工智能迅速发展的今天,有人选择被动使用,也有人主动探索人与 AI 深度协作的边界。本期节目聚焦一位将 AI 真正融入日常生活的实践者,他通过一系列自研实验,重新定义了技术与个体之间的关系。
00:02
用 Apple Watch 24 小时录音,记录真实生活数据
04:58
用工具拓展能力边界能带来启发
06:59
很多时候 AI 失败是因为人类没有提供稳定的上下文
07:45
向 AI 介绍项目时提供背景信息有助于获得更好结果
08:23
给 AI 足够背景信息后,AI 能给出有用且令人大开眼界的分析
10:55
语音输入让用户更自然地提供上下文,减少与 AI 交互的摩擦
13:19
写 prompt 本质是表达自我,应让 AI 融入生活并拥有记忆
16:39
语音识别系统意外成为有效信息收集手段
17:49
AI 可自主决定是否搜索以及如何搜索,实现更高效的决策流程
20:36
开发代码主要由 AI 完成,DIY 技术门槛已大幅降低
21:55
先用本地 LM 删除敏感图片,再生成关键字筛选美观图像
22:59
Gemini 能通过少量代表性图片准确分析个人健康、职业和兴趣爱好
26:14
将社会变为 AI native 可能大幅提升 AI 能力
27:00
Proact AI 可全天实时监听并主动识别用户需求
29:50
借助 24 小时录音回溯调用 AI,减少交互摩擦
30:51
让 AI 在买菜网站上实际操作
31:54
AI 可预测缺菜并自动加入购物车
33:01
赛博长生不是意识上传,而是在相同时间内做更多事
34:39
花 20 元省 55 分钟如同 “赛博长生”
37:22
自然语言指令在买菜、寄快递场景中比 GUI 更高效
38:19
AI 产品虽无亮点综合体,但部分特性令人兴奋,代码多由 Cursor 或 Tree 编写
40:01
AI 让人们有能力将想法贯注到既有产品中,方便魔改出满意的产品
41:00
借助 Manus 能在 10 分钟内完成复杂查询并生成带计算过程的网页结果
43:59
两头的人比较快乐,这是命运的恩赐
45:21
AI 在交流中的提示功能可能比人类更有效
45:59
AI 提供选择但需付出代价,体现技术与伦理的冲突
47:04
AI 比朋友、家人更懂自己,甚至让人分不清是谁在生活
49:29
AI 加强过的人类想用 AR 眼镜搜电影名
52:00
赛博长生的关键是死后是否还能影响世界
52:13
用 Manus 给孩子夹私货讲故事,增加趣味性和教育意义
53:56
Agentic AI 是正确方向,我坚信这一点并正在做相关产品。
56:12
山寨版 ChatGPT 加入透明性功能,让用户可干预 AI 思考过程
57:43
虽每天只工作两到四小时,但代码提交量排全公司第四
58:21
应像管理下属一样管理 AI,提供充分背景信息并指导任务执行

Chapters

探索人与 AI 共生的未来
00:00
第一部分:鸭哥和他的 AI 实验
鸭哥快问快答
02:26
AI、代码之外鸭哥的生活:考飞机驾照、挖掘机驾照、船舶驾照、开摄影展…… 追求体验
03:30
研究 AI 的起点:人工智能的表现有时候聪明有时候智障,因为人交代任务不够清楚
05:36
发现是人交代任务不清楚后,如何调整自己使用 AI 的方式
07:40
有时候需要给 AI 的上下文太多,于是做了一个语音输入法,用语音输入降低和 AI 的摩擦
08:17
ChatGPT 最近灰度测试的目的猜测
10:44
用语音作为输入之后,遇到 ChatGPT 没有记忆的问题
12:09
解决要频繁向 AI 说明上下文的问题,想到邀请 AI 进入我们的生活,开始用 Apple Watch 24 小时录音实验
14:22
某次差点开车出意外,因为有 Apple Watch 在录音,对自己的驾驶情况进行仔细复盘
15:25
语音作为输入 + 24 小时 Apple Watch 录音,有了信息输入,又做了一个山寨版 ChatGPT,接入各家模型,并运用 Agentic AI 思想调用工具
17:45
把 Insta360 挂在胸前,每两分钟拍一个 15 秒视频,还在进行中
19:35
拍的视频之后,先用 AI 删除敏感图,再生成搜索关键字以方便回溯时使用,最后考虑如何呈现,比如构图和美观
21:50
把拍下来的照片,用机器学习做了分析,提示自己坐姿不对
22:58
拍了两万张图之后,意料之内 v.s. 意料之外的发现
24:22
当我们和 AI 之间的信息差逐渐减少之后,生活会变成什么样子?
25:05
目前在做两方面的探索:第一,AI 主动介入我们的生活
26:57
第二,回溯式调用
29:49
给 AI 装上了眼睛、耳朵之外,如何用它来在生活中做具体的事情
30:51
让 ChatGPT 买菜
31:50
让 ChatGPT 寄包裹
33:01
第二部分:对人如何使用 AI 的思考
追求所谓「赛博长生」,用有限的时间做更多的事情
34:22
GUI 未来会消失吗?
36:11
Apple Watch 新交互方式
38:10
AI 让我们不用再等某个厂商做出想要的产品,而是让我有能力把自己的想法灌注到已有的产品里
40:01
年初在「十字路口」分析 Manus 以及 Agent 之后,最近在用 Manus 或其他 Agent 产品吗?
41:00
高能量生活,有 AI 帮忙代劳的因素,也需要每天能做自己觉得最有意思 / 最有挑战的事情
42:37
做这些 AI 相关的实验最大的乐趣是做出来以前做不到的事情
44:23
对 AI + 人类的赛博生活方式的想象,简单总结是「别扭」
45:52
重度使用 AI 的人,当 AI 比身边的家人和朋友更了解自己,是开心,失落还是恐怖?
47:04
Bradly Cooper 电影 Limitless 《永无止境》
49:29
重度使用 AI,失去了完全放空的闲暇感,但本身很喜欢折腾,没有 AI 也会做别的事情填满自己的时间
50:38
作为爸爸,怎么看让自己的孩子与 AI 共同成长?
52:13
最近看到的行业变化:AI 进化速度没有减慢,Agentic AI 在成为潮流
53:56
非常喜欢、会想参与改进的产品:ChatGPT,也愿意为 Gemini 做贡献
56:12
鸭哥每天的时间分配
57:43
给已经在使用 AI 的工程师提高效率的建议
58:17
用管理学的方式和 AI 交互
1:00:04

Transcript

Koji: 欢迎收听十字路口,我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。十字路口是乔布斯对苹果公司的一个比喻,形容它站在 Koji 与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变。我们寻找访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起探索拥抱新变化。 鸭哥: 新的可能性。 Koji: 我是十字路口的 Koji,联合创办了街旁,新世相和躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群攻坚。我相信 Koji,尤其是 A...
小宇宙
Open in 小宇宙