在2024年度的开放原子开发者大会及首届开源技术学术盛会上,腾讯云副总裁、腾讯混元大模型掌舵人刘煜宏发表了重要演讲。他强调,腾讯已将开源协同提升至公司核心技术战略的高度,致力于推动内外部技术的开放与共享。
腾讯混元大模型系列已全面开源,涵盖了文本生成文本、文本生成图像、文本生成3D及文本生成视频等多个模态,成为开源领域中的佼佼者。其开源模型在GitHub上广受好评,总Star数接近1.4万,并多次登上热门趋势榜。
其中,腾讯混元文本生成图像大模型在国际范围内衍生出了超过1600个项目,GitHub Star数超过3700,汇聚了数千名核心开发者。腾讯混元Large模型在开源后的短短五天内,就在HugginFace百万模型中崭露头角,登上趋势榜榜首,GitHub Star数迅速达到1300。腾讯混元3D模型也表现出色,GitHub Star数达到2500,成为HuggingFace上下载增速最快的3D模型之一。
腾讯混元文本生成视频大模型同样备受瞩目,其GitHub Star数已超过6300,发布后迅速登上开源趋势热榜。社区开发者在此基础上推出了多个衍生版本,如加州大学圣地亚哥分校Hao AI实验室研究员发布的FastHunyuan版本,该版本将视频生成速度提升了8倍,大大降低了模型应用门槛。
2024年是大模型技术飞速发展的一年,腾讯不仅坚持全链路自研的大模型研发路线,还通过积极开源,将成熟的技术与社区共享。腾讯混元大模型在底层算力网络、中间Angel机器学习平台以及上层模型和应用等方面均实现了全链路自研。
今年5月,腾讯混元文本生成图像大模型进行了全面升级并率先对外开源,包括模型权重、推理代码及模型算法等完整内容,成为业内首个中文原生的DiT架构文本生成图像开源模型。评测数据显示,该模型效果远超开源的Stable Diffusion模型,整体能力达到国际领先水平。
11月,腾讯混元宣布最新的MoE模型“混元Large”以及3D生成大模型“Hunyuan3D-1.0”开源。这两个模型均属腾讯自研,在架构、算法、数据等方面具有独特创新,填补了行业空白。其中,混元Large是当时开源领域参数规模最大、效果最好的MoE模型,而Hunyuan3D-1.0则是业界首个同时支持文字、图像生成3D的开源大模型。
12月,腾讯混元生成视频大模型也宣布开源,参数量高达130亿,是当前最大的视频开源模型。开源内容同样包括模型权重、推理代码及模型算法等完整内容,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,极大地节约了人力及算力成本。
在本届大会上,腾讯还举办了数据库开源专题论坛,并参与了大模型开源专题论坛,与众多开发者分享了腾讯在数据库和大模型方面的技术历程。开源协同已成为腾讯的核心技术战略之一,通过代码的开源和协作,腾讯持续推动技术的高效创新与开放共享。
自2010年起,腾讯就开始在公司层面推动外部开源工作的开展,并逐渐由开源的使用者转变为开源项目的核心贡献者。腾讯还是开放原子的发起单位之一,自基金会成立以来就积极参与开源工作,捐赠了操作系统、编译器、数据库等核心项目。目前,腾讯内部已有超过150个开源协同小组,覆盖人工智能、大数据、数据库等技术领域。对外,腾讯主导了近200个对外开源项目,在全球企业开源贡献榜上名列前茅,吸引了超过50万开发者的关注。