腾讯混元大模型家族再添新成员,全面开源3D生成技术。
近日,腾讯混元宣布了一项重大更新,正式推出五个全新的3D生成模型。这些模型不仅在生成速度和细节表现上有了显著提升,更实现了材质表达的高度逼真,并且全部面向公众开源。与此同时,腾讯混元自研的3D AI创作引擎也迎来了全面升级,新增多视图输入、智能减面、全格式兼容等功能,并正式向C端用户开放。
据悉,此次推出的五个开源模型均基于腾讯混元的Hunyuan3D-2.0技术框架打造。其中,Turbo系列模型在保持高精度和高质量的同时,通过腾讯混元提出的3D生成加速框架FlashVDM,实现了几何生成模型的数十倍加速,使得整个生成过程能够在30秒内高效完成。
多视图版本模型,如Hunyuan3D-2-MV,通过整合多个视角的输入信息,能够更精准地捕捉细节,生成符合用户预期的3D资产。而轻量级mini系列模型,则通过优化模型架构和提升运行效率,进一步降低了算力成本,使得几何模型能够在中低端显卡上流畅运行,为模型的应用场景提供了更多可能性。
腾讯混元在3D生成技术领域的探索始于2024年11月,当时发布了第一代3D生成大模型,率先支持文本和图像生成3D内容。2025年1月,腾讯混元再次突破,发布了2.0版本(Hunyuan3D-2.0),在多个维度上超越了业内排名第一的大模型。
随着模型的持续进步,腾讯混元3D AI创作引擎也迎来了重大升级。新版引擎支持多视图输入,用户只需上传2-4张标准视角图片,即可快速生成高精度、高质量的3D模型。这一功能对于游戏制作、3D UGC创作等场景具有重大意义,能够大幅降低3D设计师的制作成本。
新版引擎还引入了3D智能减面技术,能够自适应生成几百至数千面的三角面,进一步提升几何边缘平滑度,让模型在低面片的基础上最大化体现细节。同时,通过物理特性模拟技术,新版引擎还实现了PBR材质生成效果的提升,赋予模型更真实的颜色与材质表达。
在兼容性方面,新版引擎除了支持通用的OBJ、GLB、FBX等格式外,还新增了对STL、USDZ及MP4等主流格式的输出支持。这使得用户能够无缝连接3D打印工具,快速预览模型,并在移动端实现实时交互。
目前,腾讯混元的3D生成模型已经开始广泛应用于用户生成内容(UGC)、商品素材合成、游戏3D资产生成等场景。在游戏业务中,大模型生成的3D模型已经能够满足部分游戏3D资产的标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等。