1、产品简介
腾讯混元大模型家族近期迎来两名新成员:“混元Large”大语言模型 和 “Hunyuan3D-1.0” 3D生成模型。 这两款模型均已在腾讯内部产品中得到应用验证,并取得了出色的效果,现免费开源给企业和开发者使用,以推动 AI 技术发展和应用创新。
“混元Large”是目前业界参数规模最大、效果最好的开源MoE大语言模型。 它基于Transformer架构,拥有3890亿总参数和520亿激活参数,上下文长度高达256K。 “Hunyuan3D-1.0”是业界首个同时支持文字和图像生成3D模型的开源产品,可以高效生成高质量3D资产,显著降低3D建模成本。
2、使用场景及用户人群
“混元Large”适用于多种AI应用场景,包括:
- 文本生成: 例如文章写作、诗歌创作、对话生成等。
- 知识问答: 提供准确、全面的信息检索和知识解答服务。
- 代码生成: 辅助程序员进行代码编写,提高开发效率。
- 逻辑推理: 解决复杂的逻辑推理问题,例如数学题、逻辑谜题等。
“Hunyuan3D-1.0” 适用于所有需要3D建模的领域,例如:
- 游戏开发: 快速生成游戏场景、角色、道具等3D资产。
- 工业设计: 辅助设计师进行产品外观、结构设计,提升设计效率。
- 建筑设计: 创建建筑模型、室内外场景,进行可视化展示。
- 电商展示: 生成商品的3D模型,提供更直观的购物体验。
- UGC创作: 为用户提供个性化3D创作工具,例如3D角色生成、3D场景搭建等。
目标用户人群包括:
- 企业开发者: 利用模型构建AI应用,提升产品功能和用户体验。
- 科研学者: 进行大模型相关研究,探索AI技术前沿。
- 3D创作者: 使用模型进行高效、低成本的3D资产制作。
- AI爱好者: 体验最新的AI技术,进行创意探索。
3、产品优势和特点
“混元Large”大语言模型的优势:
- 业界领先的模型规模和性能: 参数规模和评测结果均处于业界领先水平,可处理更复杂的任务,提供更优质的AI服务。
- 高质量合成数据: 采用高质量、高多样性的合成数据进行训练,提升模型效果,例如数学和代码效果提升超过10%。
- 专家特定学习率缩放: 为不同专家设置不同的学习率,确保每个子模型都能有效地从数据中学习,提升整体性能。
- KV缓存压缩: 采用分组查询注意力(GQA)和跨层注意力(CLA)策略,显著减少KV缓存的内存占用和计算开销,提升推理速度。
- 长上下文处理能力: 最大支持256K上下文,相当于一本《三国演义》的长度,可一次性处理上传最多10个文档,并能一次性解析多个微信公众号链接、网址。
“Hunyuan3D-1.0” 3D生成模型的特点:
- 高效生成高质量3D资产: 轻量版仅需10秒即可生成高质量3D资产,标准版也将文/图生成3D资产的耗时缩至45秒内。
- 强大的泛化能力: 可重建各类尺度物体,大到建筑,小到工具花草。
- 支持原生中文和风格定制: 采用DiT架构,与混元DiT生图联合,支持原生中文,支持风格定制。
- 多视图扩散技术提升3D泛化性: 通过学习到的俯仰角度矫正,提升多视图准确性与一致性。特征平面超高特征分辨率和引入任意视角的输入图进一步提升了3D生成精度。
4、团队背景
“混元Large”和“Hunyuan3D-1.0” 均由腾讯混元大模型团队研发。 该团队致力于打造业界领先的大模型技术和产品,并积极拥抱开源,推动AI技术普惠和行业生态繁荣。 腾讯混元大模型已应用于腾讯内部超过700个业务,并通过腾讯云向合作生态进行赋能。
访问链接:
- 混元Large Hugging Face地址:https://huggingface.co/tencent/Tencent-Hunyuan-Large
- 混元Large GitHub地址:https://github.com/Tencent/Tencent-Hunyuan-Large
- 混元3D生成模型GitHub地址:https://github.com/Tencent/Hunyuan3D-1
- 混元3D生成模型Hugging Face地址:https://huggingface.co/tencent/Hunyuan3D-1
更多AI软件请到 https://ai-sou.cn/