天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

当前位置：首页 > 天脉资讯 > 科技数码 > 正文内容

阿里通义万相首推百亿参数首尾帧视频模型，AI创作迎来新变革！

时间：2025-04-19 22:46 来源：天脉网作者：柳晴雪

阿里通义万相最新宣布，其“首尾帧生视频模型”已正式向公众开源。这款模型拥有惊人的140亿参数，堪称业界首个达到如此规模并对外开放的同类模型。

借助这款模型，用户只需提供起始和结束两帧图像，它便能自动生成一段高清720p视频，无缝衔接首尾画面，极大提升了视频生成的灵活性和个性化程度。这一创新技术，无疑为AI视频创作领域带来了革命性的突破。

相较于传统的文生视频或单图生视频技术，首尾帧生视频模型在可控性方面展现出了显著优势，成为众多AI视频创作者梦寐以求的功能。然而，这类模型的训练难度极大，需要同时满足指令遵循、视频内容与首尾帧高度一致、视频过渡自然流畅等多重严苛要求。

为了攻克这些难题，阿里通义万相团队在现有的Wan2.1文生视频基础模型架构上进行了大胆创新，引入了额外的条件控制机制，实现了流畅且精准的首尾帧变换。在训练阶段，团队精心构建了专属的首尾帧模式训练数据，并采用并行策略优化文本与视频编码模块、扩散变换模型模块，从而大幅提升了模型训练和生成效率，确保了高分辨率视频的生成质量。

在推理阶段，为了在有限内存资源下支持高清视频推理，团队巧妙运用了模型切分策略和序列并行策略。这些策略在确保推理效果不受损的前提下，显著缩短了推理时间，使得高清视频的生成更加高效便捷。

基于这款强大的模型，用户能够完成更加复杂、个性化的视频生成任务。例如，用户只需上传两张相同位置但不同时间段的外景图片，并输入一段提示词，模型便能生成一段展现四季交替或昼夜变化的延时摄影效果视频。用户还可以通过旋转、摇镜、推进等运镜控制，将两张不同画面的场景巧妙衔接起来，既保证了视频与预设图片的一致性，又让视频镜头更加丰富多变。

目前，用户可在通义万相官网上直接免费体验这款模型，也可在Github、Hugging Face、魔搭社区等平台下载模型进行本地部署和二次开发。此次开源举措，无疑将进一步推动AI视频生成技术的发展与应用，为广大创作者提供更加便捷、强大的创作工具。

点赞 0反对 0举报 0 收藏 0

更多>同类天脉资讯

余倬详解Deepseek：AI如何赋能不动产行业创新与未来展望

在不动产行业，我们也有一些初步的研究，抛砖引玉，按照华为AI实践经验来说，要围绕着企业BI生产业务流，从设计、勘察到施工、运营、物业管理等业务领域去找应用场景，我在设备预测维护、节能减排等领域也基于华为自身…

04-19

字节跳动豆包深度思考模型发布，火山引擎瞄准Agent市场新机遇

在谭待看来，基础信息处理能力的提升以及成本的下降让豆包大模型从去年到今年获得了快速增长，今年模型在深度思考能力上的突破又带来新的增长。其中，豆包UI-TARS模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整…

04-19

字节新一代多模态智能体UI-TARS-1.5：高阶推理能力大提升

该智能体基于视觉-语言模型构建，具备在虚拟世界中高效执行各类任务的能力，并较前代版本显著增强了高阶推理能力。 UI-TARS-1.5在字节跳动此前提出的原生智能体方案 UI-TARS 的基础上，引入了强化学…

04-19

小红书成独立开发者新宠，为何他们纷纷选择这里作为创新试验场？

从 Shawn 和柳毅的故事里，不难看出，能够精准地链接一批有需求的用户，是让这一批开发者留下来的直接原因。小红书相关负责人也在昨天的「独立开发大赛」颁奖现场透露了下一步计划，将搭建相关产品能力，简化…

04-19

上饶跨境电商新生态启航，赋能产业升级，打造“一核两翼多园”新格局

。近日，上饶跨境电商生态大会暨上饶市跨境电子商务综合服务平台启动仪式在上饶高铁经济试验区举行。本次大会以“重构跨境电商生态·赋能数字产业升级”为主题，京东、谷歌、亚马逊、阿里巴巴等海内外知名跨境电商平台…

04-19

裕庆嘉源引领抖音电商新风尚，专业创新助力品牌飞跃

未来，随着抖音平台的不断发展和电商市场的日益壮大，裕庆嘉源将继续深耕抖音电商领域，不断创新服务模式，提升服务质量，为客户创造更大的价值。总的来说，四川裕庆嘉源商务信息咨询有限公司的抖音电商服务以其专业性、…

04-19

字节瓜瓜龙启蒙教育再传关停，用户未完课程成难题

据悉，2026年4月15日起瓜瓜龙启蒙将停止服务，停止服务后将对用户的个人信息进行删除或匿名化处理。2024年10月，瓜瓜龙就曾宣布关停服务，但后续又取消了这一决定。从2024年10月发布关停通知后，就有…

04-19

Aifeex引领AI潮流，Takwin计算系统展现卓越实力

Aifeex作为一家创新科技公司，在人工智能技术的深度应用上走在前沿，已经成功开发了一系列深度学习和自然语言处理的算法模型，在教育、数据分析、图像识别、自然语言理解等多个方面展现出了卓越的性能。相信随着技术的…

04-19

关税战下，中国跨境电商敦煌网、淘宝海外爆火，如何撬动美式消费？

从今天的敦煌网、淘宝爆火，以及以往数据（SHEIN 全球年营收破 500 亿美元，美国市场占比近三成；Temu则在一年多内拿下美国折扣零售领域 17% 市场份额）来看，老外对便宜实惠的诱惑抵抗不了，卖家可…

04-19

思恩客2025智能营销大放异彩，多项大奖彰显AI驱动实力

2024年思恩客服务的项目中，有73%通过AI技术实现营销成本下降与效能提升的双重突破，凭借“品类延伸+AI工具提效”的创新实践，其打造的某生活方式互联网平台客户效果营销案例实现激活量环比提升102.3%，激…

04-19

短剧江湖风云再起，百度优酷横竖屏争夺战谁主沉浮？

在短剧刚刚从抖音、快手等短视频平台内部发芽之际，“优爱腾”等长视频平台多少有些不以为然，道理很简单，他们一致认为，低质量、套路化的短剧与精品长剧的受众分层明显，构不成竞对关系，内部虽有上线短剧内容，却也仅是防…

04-19

TikTok欧洲新征途：本土工厂供应链携手共绘跨境新蓝图

特别是欧洲市场对于高品质、个性化商品的需求日益增长，以及对于环保、可持续产品的偏好，为拥有本土发货能力和创新能力的卖家提供了前所未有的机遇。未来，随着欧洲市场的不断成熟和消费者需求的持续升级，拥有本土发货能力…

04-19

算法向善之路：抖音揭秘算法原理，共筑网络生态新图景

“算法它不懂基本语义，它只能预估用户行为，也不可避免地在传播海量信息的过程中存在缺陷，这就需要平台治理为推荐算法设置护栏。” 面对AI生成式谣言，抖音在2023年启动了AIGC（人工智能生成内容）治理专项，…

04-19

贝壳彭永东捐900万股做公益，“天价”年薪实为股权激励？

对此，贝壳方面表示，公司在香港上市时授予彭永东股票为合规要求，非一般理解的年薪。据贝壳解释，2022年5月贝壳香港上市时，根据联交所的上市规则，具有同股不同权（WVR）架构的公司，WVR持有人（即超级投票…

04-19

外卖大战升级！美团千亿投入，王兴与刘强东的较量正酣

不管是向餐饮商户发放不同规模的助力金，为其缓解资金压力、增添运营活力，还是优化评价系统，助力商家精准把握用户需求、提升服务质量，或是强化基础建设，如推进明厨亮灶等项目，这些举措都为商家营造了更优质的经营环境…

04-19

点击查看更多 +

全站最新

余倬详解Deepseek：AI如何赋能不动产行业创新与未来展望

三国杀斗地主花语传递智慧，如何默契配合逆转战局？

《PUBG Mobile》国际服下载全攻略：安卓iOS用户必看秘籍！

《热血江湖》首饰加工实战指南：如何高效提升30%以上角色属性？

《我的世界》飞行器大揭秘：静态装饰与红石飞行，你更爱哪款？

《波克捕鱼》高手进阶秘籍：深度策略助你金币满满

热门内容

媒体信息

新传播周刊

新传播，传播新经济之声！

本栏最新

余倬详解Deepseek：AI如何赋能不动产行业创新与未来展望

字节跳动豆包深度思考模型发布，火山引擎瞄准Agent市场新机遇

字节新一代多模态智能体UI-TARS-1.5：高阶推理能力大提升

小红书成独立开发者新宠，为何他们纷纷选择这里作为创新试验场？

上饶跨境电商新生态启航，赋能产业升级，打造“一核两翼多园”新格局

裕庆嘉源引领抖音电商新风尚，专业创新助力品牌飞跃