Vol.84 数据不再是 “后台的沉默基石”:OceanBase 与 00 后开发者眼中的 AI 变局
屠龙之术
Jan 20
Vol.84 数据不再是 “后台的沉默基石”:OceanBase 与 00 后开发者眼中的 AI 变局
Vol.84 数据不再是 “后台的沉默基石”:OceanBase 与 00 后开发者眼中的 AI 变局

屠龙之术
Jan 20
Unprocessed episode, you can be the first!
Shownote
Shownote
这一轮 AI 爆发,过程中大家无数次提及核心的三要素:算法、算力和数据; 当前这个时点,基于 transformer 的算法基础,无限堆叠算力的大叙事下,数据的重要性边际提升了。 * 预训练数据的接近枯竭 * 大模型合成数据的使用方法与效果评估 * 后训练强化学习的激励模型构建 * 训练过程中的数据清洗和工程实践 * 未来可能范式 - online learning 对于数据以及数据处理的新要求 * …… 以上这些问题其实一直都是过去几年乃至可见的未来几年, 所有大模型厂商都需要去持续解决的症结所在...
Highlights
Highlights
Chapters
Chapters
Transcript
Transcript

Open in 小宇宙