GPT-4o生图秘密大揭秘：港中文博士发现真相，竟可手动改图？-天脉网

近期，人工智能领域再度掀起波澜，GPT-4o的图像生成能力引发了广泛关注与热议。这款由OpenAI推出的最新模型，不仅在网络上掀起了一股“吉卜力”风潮，还激发了众多技术爱好者对其背后技术的深入探索。

据多位技术专家分析，GPT-4o的图像生成过程可能并非用户所见的逐行生成动画那般简单。港中文博士Jie Liu通过深入研究，揭示了这一前端动画背后的真相：它实际上可能是一种原生自回归（AR）生成方式，且用户甚至可以在一定程度上手动调整生成的图像。Jie Liu的发现表明，用户在浏览器中看到的逐行生成效果，更多是出于提升用户体验的前端设计，而非图像生成的真实过程。

无独有偶，CMU博士Sangyun Lee也对GPT-4o的图像生成原理提出了自己的见解。他认为，GPT-4o可能首先生成视觉token，然后通过一种类似于Rolling Diffusion的分组式扩散解码器，将这些token解码为像素空间中的图像。这一过程中，解码器可能按照从上到下的顺序进行解码，从而实现了高效的图像生成。

谷歌DeepMind的研究者Jon Barron也加入了这场讨论。他推测，GPT-4o的图像生成可能是多尺度和自回归方法的结合体。在这种混合模式下，一个自回归Transformer可能首先生成“先验”的潜在代码，随后由一个扩散解码器负责渲染图像。这一推测为理解GPT-4o的图像生成过程提供了新的视角。

尽管OpenAI尚未公布GPT-4o图像生成技术的全部细节，但用户们已经通过实际体验感受到了其强大的能力。GPT-4o不仅能够生成风格多样的图像，还能根据用户的指令进行逼真的照片编辑。这一特性使得它在美术、设计等领域展现出了巨大的应用潜力。

更令人瞩目的是，GPT-4o在生成漫画时展现出的元上下文和元理解能力。它能够自主预测不同的情境，并生成与之相符的图像内容。这一特性让许多用户感到震惊，甚至有人担忧人工智能是否正在走向自我意识的觉醒。

除了漫画生成，GPT-4o在风格重绘、形象迁移、设计参考等方面也展现出了卓越的能力。用户可以通过简单的指令，让GPT-4o将照片风格替换为皮克斯、3D、黑白等不同风格，或者将原照片放置在新的场景中。这些功能不仅让美术生和设计师们感到“破防”，也激发了更多用户对于人工智能应用的无限想象。

随着GPT-4o的广泛应用和深入探索，人工智能领域的发展前景愈发广阔。然而，如何在享受人工智能带来的便利的同时，确保技术的安全性和可控性，也成为了摆在我们面前的重要课题。

重资产模式带来的运营压力持续加剧；另一方面，电商件价格战、国际业务迟滞、新业务增长乏力等问题接踵而至。当通达系以加盟制轻装上阵、极兔以资本杠杆横扫新兴市场时，顺丰的“重”反而成了掣肘——它既无法像京东物流般与…

昨天，全球最大AI开源社区HuggingFace发布的最新趋势榜单，排在前三的分别是 DeepSeek-V3-0324、群核SpatialLM，以及通义千问Qwen2.5-Omni-7B，全部来自杭州，领先…

近日，中建五局承建的抖音集团杭州总部大楼项目顺利通过竣工验收，标志着这座集科技美学与功能创新于一体的地标建筑正式亮相。商业裙楼顶部以阶梯形态串联双塔，平面蜿蜒如引导路径，纵向层叠出丰富的露台与花园，模糊建…

为确保销量展示的真实性，需配合后期真实订单逐步增加，方可恢复至修改后的销量水平。重要提示：修改销量后，务必确保评价数量小于或等于销量数。拼多多店铺上新商品链接在出评前必须先修改销量，而且销量数必须大于评…

作为一个“内容+货架”双驱动电商平台，商家入驻TikTokShop后，在内容上，短视频带货可以提供大量曝光，直播带货则带来粉丝积累，大量种草也可以带来全渠道增长。结合用户分析、美区市场达人带货现状和品牌…

针对农产品行业薄利特性，运营团队着眼客单价与利润双提升，通过高毛利爆品打造和标准化上新，持续带动店铺销量，实现店铺经营质量升级。基于此阶段性成果，火蝠电商将持续深化三个维度的优化：精进店铺运营标准化体系，…

从这几年商超企业发生的一些发展变化看，可以得出的基本判断是：未来，大卖场、超市、便利店依然是市场的主体，零食店、折扣店等等各种新的零售商超依然会在市场中占有一定的市场份额，新的零售业态依然会保持不断创新的趋…

百度 AI技术生态副总经理周奇表示，依托文心+飞桨的核心技术，百度致力于和硬件伙伴、技术伙伴、数据伙伴等共建生态，架起技术和行业专业知识的桥梁，打通大模型垂直领域应用的工程化“最后一公里”。上海世纪出版集…

中国石头科技（Roborock）超越美国iRobot成为全球扫地机器人市场新王者。据IDC最新数据显示，石头科技在2023年全球市场实现双料第一：以16%的销量份额和22.3%的销售额份额领跑行业。全球…

网经社电子商务研究中心特约研究员刘俊斌也称，淘宝买菜原有社区团购次日自提模式对供应链有很高的要求，生鲜类商品的仓储成本和自提点的拓展管理等也有一定的难度，为了保障消费者利益和降本增效，确实应该退出。刘俊斌表…

- 平台优势：广大大作为全球领先的广告营销平台，覆盖超80个国家/地区、80+全球广告渠道，拥有16亿级别广告创意，保持小时级更新，能为从业者提供市场营销参考。报告时间段为2024.1 - 2025.2 …

在实际应用中，腾讯云RAG+DeepSeek能实现精准知识问答，大模型知识引擎在文档解析、检索等方面优势明显。腾讯云与DeepSeek合作，为企业和开发者提供了强大的大模型应用支持，推动大模型在各行业的落…

同为互联网基因服务平台，财报电话会议中快手CEO程一笑指出，“作为一家中国和全球领先的内容社区和社交平台，快手正站在AI技术与视频大模型重塑产业格局的关键节点，AI不仅是效率提升工具，更是驱动平台在流量增长…

包含终端统一底座、端端互联能力、端云协同能力和数字化综合管理平台，实现系统、标准统一，保障安全可靠，让不同设备和系统能互联互通、协同运行。 - 典型场景：碰一碰入园利用NFC技术和统一数据模型实现快速验票入园…

这种专属服务让学员体验到了更具针对性的教学，提升了考试成功率，从而吸引了更多人来报名学习。在抖音、B站等平台上发布的教学视频，观看次数和点赞数都相当可观，吸引了众多潜在学员。在高校的宣传中，让更多的学生认识到…