腾讯大模型文生视频功能上线，能否在竞争中后来居上？-天脉网

腾讯混元大模型近日正式推出了文生视频功能，这一功能早在11月底就已被“剧透”，并于12月3日正式上线。该功能现已集成于腾讯元宝App中，用户可以在AI应用板块的“AI视频”部分申请试用。对于企业客户，则可以通过腾讯云接入服务，同时API（应用程序编程接口）也已开放内测申请。

自OpenAI发布Sora以来，视频生成式大模型在国内外备受瞩目。在国内，快手和字节跳动在这一领域正面交锋，阿里云、MiniMax、美图等公司也蓄势待发。相比之下，腾讯混元的节奏并不算快，但它依然凭借强大的技术实力，成功推出了自己的文生视频功能。

使用腾讯混元的文生视频功能非常简单，用户只需在提示框中输入一段描述，即可生成一段视频。这一功能与市场上类似的产品并无太大差异，但腾讯混元为用户提供了转场视频、多动作视频、超写实视频三种灵感提示，进一步丰富了用户的创作选择。

在实际体验中，用户可以选择写实、动画、电影、黑白、赛博朋克五种视频风格，以及五种不同的比例。高级指令部分的选择更为丰富，包括景别、光线、镜头运动等。其中，景别包括特写、近景等五种，镜头运动则包括固定镜头、手持摄影、拉近镜头等14种。这些选项为用户提供了极大的创作自由度。

根据腾讯提供的评测报告，腾讯混元视频生成模型与国内两个同类模型在持续时间、文本对齐、运动质量和视觉质量等方面进行了比较。结果显示，腾讯混元在文本对齐和运动质量方面表现优异，而在视觉质量方面则与GENN-3 alpha（Web）持平。尽管持续时间略短一秒，但腾讯混元凭借其在其他方面的优势，依然展现出了强大的竞争力。

腾讯混元多模态生成技术负责人凯撒介绍，混元基于与Sora类似的DiT架构，并在架构设计上进行了升级。这一升级使得混元视频生成模型能够更好地应对多个主体描绘，实现更细致的指令和画面呈现。同时，采用统一的全注意力机制，使得每帧视频的衔接更流畅，实现了主体一致的多视角镜头切换。通过图像视频混合VAE（3D变分编码器），模型在细节表现上有了显著提升，特别是在小人脸、高速镜头等场景。

腾讯在当天还宣布开源该视频生成大模型。该模型已在Hugging Face平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型。企业与个人开发者可免费使用和开发生态插件。这一举措无疑将推动视频生成技术的发展和应用。

对于为何选择在此时上线文生视频功能，凯撒表示：“一个月前我们训练完了，现在上线水到渠成。”然而，业内人士更关心的是，该功能与同行相差的几个月时间差是否会对腾讯造成压力。对此，凯撒表示：“视频生成的成熟度还没有到外界想象得那么高，现阶段还是要自己做技术打磨。”

分析师李锦清在与记者交流时指出：“文生视频的实现难度更高，但商业空间更大。短期内竞争门槛不会马上建立，行业和企业有共性或特性的问题要解决，比如数据就是个槛。”这一观点也反映了当前视频生成技术面临的挑战和机遇。

余轶南做机器人相关创业，也得到了余凯博士（地平线创始人兼 CEO）的支持。 2015 年，他加入地平线机器人，是地平线最早创始人团队之一，负责自动驾驶技术的研发工作，研发了雨果自动驾驶平台，并在多重传感器融合…

再见，人人网！

据微信公众号“腾讯云”消息，12月3日，腾讯正式发布了腾讯混元文生视频大模型，支持中英文双语输入、多种视频尺寸及多种清晰度。我们用该模型生成了一段小视频。提示词为：两只小猫在打闹，写实风格。目前，该…

12月3日，中国互联网协会今日发布声明称，近日，美国以国家安全为借口，进一步加大了对华半导体出口的限制措施。美国频繁调整管制规则，持续升级贸易壁垒，无视国际贸易规则，对我国互联网产业的健康稳定发展造成了实质…

为支持人形机器人产业的发展，华为在东莞投资72亿元建设产业园区，并计划于2025年实现一定规模量产。在ETF成份股中，岩山科技、广汽集团、利欧股份涨停，南大光电涨幅超过7%，小商品城、张江高科、许继电气等…

以公司类智能体为例，它相当于AI时代的公司官网，能够为客户提供主动推荐、及时响应和服务能力，成为企业展示形象和拓展业务的新窗口。为了推动AI应用的普及和发展，百度还发布了基于大模型的100大产业应用，涵盖了…

这份报告深入剖析了家具、二手奢侈品、宠物用品、私密护理、留学服务以及装饰装修等多个行业的成功案例，为从业者提供了宝贵的内容创作灵感。“2023年设计师精选高颜值沙发”等笔记，通过精心设计的封面和标题，成功吸引…

更为重要的是，仅退款在驱逐劣质商品和无良商家方面也能够发挥一定的正面作用，从某种程度来说也是对“七天无理由退货”的一种补充。而对于在淘宝之后才行动起来的电商平台，既然淘宝已经先发制人选择了优化这一服务，那…

在中国接入互联网30周年这一重要节点上，今年与会的互联网圈大佬们不约而同指出：AI已成当前全球创新最活跃的领域，并在持续赋能千行百业，重塑全球的生产力和生产方式。阿里CEO吴泳铭，去年峰会首度亮相就提…

传统实体店要想实现成功转型，适应互联网时代的商业要求，就要具备互联网思维，借助互联网思维来引流，提高经营效率。百度、谷歌、搜狗、360、微信搜索等都是搜索工具，商家可通过行业内容、关键词设置用户搜索的关键词，…

华为深圳全球具身智能产业创新中心正式宣布生态伙伴名单，标志着华为正式进军人形机器人领域。相关ETF方面，中证A500指数ETF（代码：159357）早盘低开，盘中持续震荡，截至10：02分，微跌0.2%，…

亚马逊作为跨境电商的老牌巨头，其政策调整同样影响了卖家的物流策略。随着FBA（亚马逊物流）入仓政策收紧及费用调整，加之SPN（ServiceProvider Network）服务的重新开放，越来越多的卖家…

机器人将会是我国颠覆全球科技格局的核心板块，更是直接决定了中美科技博弈的最终结果，其中还隐藏了一条千倍增长的超级主线。特别是有一匹黑马，是A股唯一一家与华为+英伟达+Open AI在机器人领域的合作商，其…

“短视频的转化率我们测算下，基本在千分之一二左右，有很大的不确定性和溢出”黄康祥说道，短视频电商有几个天然缺陷，首先是消费者看多了容易审美疲劳，其次是站在商家角度来看，经常看到几个内容差不多的短视频，有的突…

松果财经讯，天眼查App显示，近日，成都智胜光环科技有限公司成立，法定代表人为曾新宇，注册资本1200万人民币，经营范围含人工智能基础软件开发、人工智能应用软件开发、人工智能基础资源与技术平台、人工智能理论与…