记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。
(腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)
腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。
其中,腾讯混元文生图大模型在国内外衍生数量达1600多个,GitHub Star 超过3700,凝聚了数千名核心开发者。腾讯混元large模型开源五天内即在HugginFace百万模型中脱颖而出,登趋势榜榜首,GitHub Star 达1300。腾讯混元3D模型GitHub Star达到2500,开源两周内成为HuggingFace下载增速最快的3D模型。
此外,腾讯混元文生视频大模型 GitHub Star 已超过6300 ,发布后迅速登上开源趋势热榜,社区开发者还主动改进了多个衍生版本。例如,加州大学圣地亚哥分校(UCSD)的Hao AI实验室研究员基于腾讯混元开源视频生成模型发布 FastHunyuan 版本,新模型仅用1分钟就能生成5秒长的视频,比之前提速8倍,步骤也从50步减少到了6步,有效降低了模型应用门槛。
2024是大模型技术持续爆发的一年,腾讯不仅坚持全链路自研的大模型研发路线,率先实现从底层算力网络到中间Angel机器学习平台再到上层模型和应用到全链路自研,也通过积极开源,将成熟的技术与社区共享。
2024年5月,腾讯旗下的混元文生图大模型全面升级并率先对外开源,包含模型权重、推理代码、模型算法等完整模型,属业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解。 评测数据显示,腾讯混元文生图模型效果远超开源的 Stable Diffusion 模型,是当时效果最好的开源文生图模型,整体能力属于国际领先水平。
11月,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”开源,支持企业及开发者精调、部署等不同场景的使用需求。腾讯混元Large是当时开源领域参数规模最大、效果最好的MoE模型,而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。两个模型均属腾讯自研,在架构、算法、数据等方面有独特创新,填补了行业空白。
12月,腾讯混元生成视频大模型宣布开源,参数量130亿,是当前最大的视频开源模型,开源内容包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力,加速行业创新步伐。
本届大会,腾讯还出品了数据库开源专题论坛并参与大模型开源专题论坛,将腾讯在数据库和大模型上的技术历程与众多开发者进行分享。
开源协同是腾讯的核心技术战略,腾讯通过代码的开源和协作,持续推动技术高效创新、开放共享。在腾讯内部,开源协同小组已经超过150个,覆盖人工智能、大数据、数据库等技术领域。对外,腾讯积极参与社区建设,主导近200个对外开源项目,在全球企业开源贡献榜上名列前茅,总共吸引超50万开发者关注。
早在2010年开始,腾讯就在公司层面开始推动外部开源工作的开展,现在已经由最初的开源的使用者,转变为开源项目的核心贡献者。同时,腾讯也是开放原子发起单位之一,自基金会2020年成立就积极参与开源,已捐赠操作系统、编译器、数据库等核心项目。
开源已经成为全球技术发展的主流趋势,基于全球开发者众研众创的开源生态正加速形成。全球97%的软件开发者和99%的企业使用开源软件,未来,腾讯也将持续推动技术开源,与技术社区共同成长,推动技术进步。