
12月18日,火山引擎在FORCE原动力大会上发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。豆包大模型1.8面向多模态Agent场景进行了定向优化,其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。
据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。

作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该能力可广泛用于在线教育、产品质检等场景中。
火山引擎推出了Seedance 1.5 pro音视频创作模型,支持环境音、背景音乐、人声等多种元素,实现毫秒级的音画同步输出。在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语等)、英文及小语种,提升了视频内容的真实感与全球化创作潜力。
目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从12月23日起,通过火山引擎API接入Seedance 1.5 pro模型服务。
文/北京青年报记者 温婧
编辑/李涛
宝利配资提示:文章来自网络,不代表本站观点。