近年来,AI视频生成领域呈现出蓬勃发展的态势,国内外多款产品竞相涌现,不断刷新着公众对AI技术的认知。从年初OpenAI的虚晃一枪,到如今各式各样的AI视频生成工具层出不穷,这一领域正经历着前所未有的变革。
在这一浪潮中,国内外多家企业纷纷推出了自家的AI视频生成工具。Runway带来了新一代模型“Gen-3”,将可生成时长延长至10秒;Pika则在AI视频基础上,不断推出新功能,如一键添加音效、延长视频等;Luma转型AI视频领域,发布了Dream Machine;而国内的字节和快手也相继推出了即梦、可灵AI,一经发布便吸引了全球网友的关注。此外,智象未来、爱诗科技等AI企业也推出了HiDream、PixVerse等工具。这些视频工具与传统的视频剪辑软件有所不同,它们更像是AI依靠自己的知识储备,“无中生有”般生成的视频内容。
据天脉网了解,当前AI视频生成的评估标准主要包括语义理解、画面美观度以及可控性。语义理解通常在于文生视频领域,主要看AI能否理解用户表达的指令;画面美观度则包含视频的画面元素合理性、画质是否精细等;可控性则是在动作幅度加大的同时,能否保证画面不出现畸变。主流视频模型都在往这三大方向进行优化,以期在未来能够进一步提升AI视频的语义理解、可控性等方面的效果。
在众多AI视频生成工具中,每一款产品都有其独特的优势和特点。例如,Vidu在人物生成上表现出了较高的稳定性,动作变化也较为自然;可灵生成的画面流畅,能够营造出人头攒动的场景;而Runway Gen-3在语义理解和画面逻辑上则更为出色。然而,这些工具也普遍存在着一些痛点,如画面准确性和可控性问题。为了解决这些问题,一些AI企业推出了动态笔刷、视频首尾帧等功能,以提升视频的可控性和物理规律。
在生成速度、质量和效果方面,AI视频工具的发展仍然面临着算力、数据和算法的挑战。尽管一些企业已经在互联网上收集高质量的视频资源来提升AI生成的精准度,但优质的视频数据远比文字图像更难获得。因此,现阶段的AI视频生成工具还需要在不断优化画面美观程度的同时,结合人工后期完成剪辑、配乐、画面转场等工作。
不过,随着技术的不断进步和创新,未来有望出现一个AI原生视频编辑平台,能够实现跨模态的内容生成,从文字开始一键生成视频。这样的平台将极大地简化视频创作的流程,成为创建视频的新思路。虽然目前这样的平台还处于雏形阶段,但相信在不远的将来,AI原生工作流将取代现有的编辑流程,为视频创作带来全新的体验。