国产AI图像生成能力崛起,人才成未来发展关键支撑!

   时间:2025-03-17 19:21 来源:天脉网作者:赵云飞

近期,人工智能(AI)在艺术创作领域的进展再次引起了广泛关注。曾经,一幅名为《太空歌剧院》的AI画作在科罗拉多州博览会上夺得数字艺术类冠军,这一事件在当时引发了激烈的讨论。然而,短短两年多的时间,AI画作已经从一个新兴概念变成了各大拍卖行的热门商品。无论艺术家们是否接受这种新型的艺术创作形式,AI技术已经从文本处理拓展到了视觉信息的深度理解与生成,特别是“文生图”技术,正在迅速普及。

为了评估当前市场上各种“文生图”模型的能力,香港大学经管学院的蒋镇辉教授团队近期对15个专业文生图模型和7个多模态大语言模型的图像生成能力进行了全面评估。评估结果显示,字节跳动的即梦AI、豆包以及百度的文心一言在新图像生成的内容质量与修改任务中表现尤为突出,位列评估结果的第一梯队。

在此次评估中,蒋镇辉团队共测试了22个模型,主要基于两大任务:全新图像的生成和基于现有图像的修改。在全新图像的生成方面,团队通过线上问卷收集了多样化的指令,并招募了具有美术专业背景的评价者,从图文一致性、图像合理可靠性和图像美感三个维度对生成的图像进行了评价。结果显示,即梦AI、文心一言 V3.2.0、Midjourney v6.1、豆包、妙笔生画和FLUX.1 Pr0在新图像生成的内容质量方面处于领先地位。

相较于生成全新图像,修改图像的任务更为复杂。在22个模型中,仅有13个模型能够完成修改任务。最终,豆包、即梦AI、文心一言 V3.2.0、GPT-40和Gemini 1.5 Pro在修改图像的任务中位列第一梯队。蒋镇辉教授表示,这一结果有些出乎意料,因为与起步更早的国外模型相比,国产模型在修改图像方面的性能更为优异。

值得注意的是,虽然国产模型在图像生成和修改方面表现惊艳,但在安全与责任方面,国外模型表现更佳。蒋镇辉教授指出,当前人工智能图像生成能力的评估仍处于初步阶段,现有的评价体系存在评价偏颇、公平性不足、视角单一等缺陷,特别是在安全与伦理问题上缺乏足够的关注。因此,他们团队在评估中特别注重安全与责任方面的衡量。结果表明,虽然部分专业文生图模型在内容质量方面表现出色,但在安全与责任方面的表现却不尽如人意。

蒋镇辉教授表示,随着AI技术的不断发展,图像生成技术的革新为内容创作、市场营销和平面设计等领域注入了新的活力与创意,同时也为新兴领域的发展创造了无限可能。然而,尽管已经涌现出不少图像生成的大模型,但技术仍不够成熟,特别是在图像修改技术和多模态结合方面。他强调,未来人工智能的竞争将是人才的竞争,粤港澳大湾区在发展人工智能方面具有良好的创新环境,但还需要长远的布局和耐心的积累,以吸引和培养更多的人才。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报