9月25日,生数科技联合创始人兼CEO唐家渝在百度云智大会上宣布,生数科技旗下视频大模型Vidu正式开放API(应用程序编程接口),并同步接入百度智能云千帆大模型平台,成为平台接入的首个视频大模型。
生数科技作为国内最早布局多模态通用大模型的团队之一,今年4月联合清华大学发布了视频大模型Vidu。
6月,生数科技完成数亿元Pre-A轮融资,由百度、北京市人工智能产业投资基金领投,中关村科学城公司、启明创投等跟投。彼时,生数科技方面曾表示,将基于百度百舸AI异构算力平台持续训练、提升模型能力,并逐步通过百度智能云千帆平台开放模型服务。
据唐家渝介绍,Vidu采用的架构是团队纯自研的U-ViT架构,是全球最早提出的Diffusion Transformer融合架构,早于Sora的DiT架构,这为通用生成任务奠定了重要基AG真人娱乐首页础。
他同时表示,Vidu模型具备文生视频和图生视频能力,同时支持中英文指令输入;在时长方面,Vidu在模型层面最长可支持一键32s视频的生成;画面质感方面,Vidu最高可输出1080p分辨率。
生数科技方面表示,目前,影视、动画、广告等行业的企业机构普遍存在规模化视频产出需求,Vidu API的开放,将助力这些企业在视频生产环节降本增效,并激发创意。同时对于众多开发者而言,Vidu API的开放也为探索AI 2.0应用提供了重要基础。
生数科技认为,视频大模型高度个性化、自动化的内容创作能力,将赋予企业在营销、品牌推广和内容创新等场景中的全新竞争力,视频模型的引入将成为创意产业提升竞争力的关键因素。基于此背景,开放Vidu API成为生数科技进一步推进商业化布局的重要战略举措。
2024年以来,视频大模型的竞争日趋激烈,9月24日,字节跳动刚刚宣布发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型。在此之前,行业内已有快手的视频生成大模型“可灵”;同时,阿里旗下的通义万相在9月宣布全面升级,并发布全新视频生成模型;图像赛道的老玩家美图秀秀同样在9月宣布旗下的美图奇想大模型(MiracleVision)视频生成能力全面升级。
如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
如何把商业交给大模型?京东科技何晓冬:需要更严肃地把大模型“幻觉率”降下来
对话生数科技CEO唐家渝:AI视频到了“普及”节点 提升时长不是产品化的重点
日本、欧洲、泰国、印度、中东市场热捧中国资产!对冲基金“闭眼”买入,美股散户:中国股票是世界上最热门的东西
媒体称伊朗导弹袭击摧毁以两个中队F-35战机!伊朗总统、以总理强硬表态!拜登:不支持以袭击伊朗
富时中国A50指数期货跌破14900关口,现报14897,日内跌0.62%