在人工智能(AI)领域,视频生成技术已成为2024年的热门话题,然而,并非所有行业巨头都对此持乐观态度。百度创始人李彦宏在近期的一次内部会议上明确表示,百度不会涉足类似于OpenAI Sora的视频生成方向,原因是该技术在未来10到20年内可能难以实现商业化应用。
尽管如此,视频生成技术的热潮仍在持续升温。自OpenAI的Sora问世以来,国内大厂如快手、字节跳动、阿里巴巴等,以及众多头部大模型公司,如智谱、MiniMax、生数科技和智象未来等,纷纷发布了各自的视频生成模型。这些模型的出现,不仅推动了技术的进步,也让“容嬷嬷和紫薇”的鬼畜形象再次在网络上走红,成为不同模型效果和创意比拼的试金石。
在行业对“超级应用”的渴望推动下,视频生成技术成为了影响国内大模型厂商决策的关键因素。然而,对于是否涉足视频生成领域,国内大模型厂商的意见并不统一。有的厂商迅速跟进,如智谱推出了类Sora的视频生成模型“智谱清影”,MiniMax也发布了视频模型Video-01。而有的厂商则持反对态度,如百川智能CEO王小川认为,Sora并不在提升模型智力水平的通用人工智能(AGI)主线上。
还有一些厂商在探索后选择了暂缓。月之暗面曾在海外试水两个新应用——角色扮演应用Ohai和AI音乐/视频生成应用Noisse,但因效果不达预期,这两个应用并未被单独立项,停留在试验阶段。不过,月之暗面仍在继续探索多模态相关能力,至于是否会涉及视频生成功能,目前尚不确定。
随着国庆节的到来,视频生成领域迎来了两位重磅玩家。字节跳动低调推出了Seaweed和Pixeldance两款产品,而meta则放出了系列模型Movie Gen,再次引发了业界的关注。这些新玩家的加入,不仅加剧了市场的竞争,也推动了技术的进一步发展。
在视频生成技术成为新热点的背景下,大厂和初创公司都面临着重要的选择。对于拥有短视频相关业务的大厂来说,视频生成是一个不能输的方向。快手推出可灵,不仅是为了服务于其内容生态,也是为了助力其电商生态的发展。而对于初创公司来说,在AI应用方向不明朗的当下,大家都在谨慎地探索着新的可能性。有的公司选择了坚定地走自己的路,如百川智能全力落地医疗场景;有的公司则专注于视频生成领域,如生数科技旗下的Vidu在短时间内就获得了大量的访问量。
然而,视频生成领域的技术路线尚未收敛,市面上的顶级视频生成模型几乎都选择了闭源。这意味着,玩家们需要投入大量的资金和资源去试错,以找到最适合自己的技术路线和应用场景。在这个充满机遇和挑战的领域里,谁能最终脱颖而出,还需要看各家的真本事和创新能力。