字节AI四大命题:视频生成与动态内容成焦点
字节跳动2026年AI战略聚焦世界模型、视频生成、Coding和豆包商业化。Seedance 2.0将保持SOTA并探索互动视频生成,世界模型性能目标对齐Genie 3,豆包加速办公场景付费,对AIGC创作工具市场产生深远影响。
文章正文
资讯要点
字节2026年AI核心动向:世界模型追赶SOTA、Seedance探索动态生成、强化Coding与豆包商业化,AIGC创作工具生态将迎变局。
详细报道
要点
- 字节2026年AI四大关键命题曝光:世界模型、视频生成、Coding、豆包商业化
- Seedance 2.0保持全球视频生成SOTA,将发力“动态生成”互动视频
- 世界模型追赶Genie 3,数据预算数千万元,探索VLA与3D仿真双路线
- Coding内部强制使用Seed模型,追求极致数据工程与Agent能力
- 豆包DAU破2亿,6月上线付费,办公场景成商业化重心,出海主攻小语种
世界模型:追赶SOTA,押注未来
据36氪独家消息,字节跳动2026年为AI技术设立了四个核心命题,其中世界模型成为重中之重。内部目标是在年底前发布至少一版模型,性能对标当前世界最佳Google Genie 3。但从多方信源得知,当前内部评测显示性能尚存10%差距,负责人吴永辉多次表示效果不及预期。为加速追赶,字节已整合VLA研究组,并新设3D仿真路线团队,由前Meta FAIR Lab研究员范浩奇带队,主攻娱乐与游戏场景。数据投入也最为高昂,2026年世界模型训练数据预算达数千万元,是其他模态的数倍,供应商称高出同行3-4倍。
这对于AIGC创作者生态意义重大,一旦世界模型成熟,将极大提升虚拟场景、角色动作和物理世界的生成能力,有望与ComfyUI等开源工具结合,催生全新的交互式内容创作范式。
Seedance 2.0:稳守视频生成SOTA,探索动态生成
字节的视频生成模型Seedance 2.0已稳居全球前列,得益于海量数据和超2000人评测团队。但团队已注意到“反缩放定律”瓶颈,预训练收益递减,后续将转向精细后训练和数据清洗。2026年的新焦点是“动态生成”,即用户可实时交互的互动视频,可衍生为小游戏、互动剧集等。Seed多模态负责人周畅对该方向尤为看好,其与ComfyUI等工作流的结合可能释放更大生产力。
Coding:内部强制落地,打磨Agent地基
Coding能力被视为Agent的上限。尽管此前内部Coding模型存在感不强,2026年字节强制多个业务部门使用Seed模型,意图通过Dogfooding收集真实反馈,形成数据飞轮。此举有望提升模型逻辑与工具调用能力,为日后AI助手和自动化创作铺路。
豆包商业化:办公场景开道,出海瞄准小语种
豆包春节后DAU已达2亿,6月下旬将上线付费内容,重点推出“豆包专业版”,以PPT生成为核心切入金融、法律等高净值办公人群。海外版Dola则避开欧美巨头,在小语种市场快速扩张,目标年底DAU达3000万。商业化压力背后,是字节期望AI助手从通用入口转型办公效率工具,这将对AIGC内容生产和协作方式产生连锁效应。