腾讯发布混元文生视频大模型,支持双语输入,企业用户可接入试用

   时间:2024-12-04 08:01 来源:天脉网作者:江紫萱

腾讯近日在微信公众号“腾讯云”上宣布了一项重要进展:其自主研发的腾讯混元文生视频大模型已正式面世。该模型不仅支持中英文双语输入,还能处理多种视频尺寸及清晰度,为用户提供了极大的灵活性。

为了展示该模型的强大功能,腾讯团队利用它生成了一段小视频。这段视频的提示词非常简单:“两只小猫在打闹,写实风格。”生成的视频效果逼真,两只小猫的动作和神态栩栩如生,仿佛就在眼前。

目前,腾讯元宝App已经开放了该功能的试用申请。企业用户也可以通过腾讯云接入,并有机会参与API内测。这意味着,越来越多的用户将有机会亲身体验到这一前沿技术的魅力。

腾讯还决定将这一视频生成大模型开源。据相关资料介绍,这可能是目前全球最大的视频开源模型,其参数量高达130亿。这一举措无疑将推动视频生成技术的发展,为更多开发者提供学习和创新的机会。

腾讯云方面发布的一项评测结果显示,该视频生成模型在多个维度上表现优异。特别是在文本视频一致性、运动质量和画面质量方面,它展现出了出色的性能。在人物、人造场所等复杂场景下,该模型同样能够生成高质量的视频内容。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报