腾讯混元大语言模型

腾讯混元大语言模型和3D模型开源!

腾讯今日宣布开源其最新研发的MoE大语言模型“混元Large”以及混元3D生成模型“Hunyuan3D-1.0”。这两个模型均已在腾讯内部业务场景中得到应用,并取得了优异的成绩,现免费开放给企业和开发者使用。

1、产品简介

腾讯混元大模型家族近期迎来两名新成员:“混元Large”大语言模型 和 “Hunyuan3D-1.0” 3D生成模型。 这两款模型均已在腾讯内部产品中得到应用验证,并取得了出色的效果,现免费开源给企业和开发者使用,以推动 AI 技术发展和应用创新。

“混元Large”是目前业界参数规模最大、效果最好的开源MoE大语言模型。 它基于Transformer架构,拥有3890亿总参数和520亿激活参数,上下文长度高达256K。 “Hunyuan3D-1.0”是业界首个同时支持文字和图像生成3D模型的开源产品,可以高效生成高质量3D资产,显著降低3D建模成本。

腾讯混元大语言模型

2、使用场景及用户人群

“混元Large”适用于多种AI应用场景,包括:

  • 文本生成: 例如文章写作、诗歌创作、对话生成等。
  • 知识问答: 提供准确、全面的信息检索和知识解答服务。
  • 代码生成: 辅助程序员进行代码编写,提高开发效率。
  • 逻辑推理: 解决复杂的逻辑推理问题,例如数学题、逻辑谜题等。

“Hunyuan3D-1.0” 适用于所有需要3D建模的领域,例如:

  • 游戏开发: 快速生成游戏场景、角色、道具等3D资产。
  • 工业设计: 辅助设计师进行产品外观、结构设计,提升设计效率。
  • 建筑设计: 创建建筑模型、室内外场景,进行可视化展示。
  • 电商展示: 生成商品的3D模型,提供更直观的购物体验。
  • UGC创作: 为用户提供个性化3D创作工具,例如3D角色生成、3D场景搭建等。

目标用户人群包括:

  • 企业开发者: 利用模型构建AI应用,提升产品功能和用户体验。
  • 科研学者: 进行大模型相关研究,探索AI技术前沿。
  • 3D创作者: 使用模型进行高效、低成本的3D资产制作。
  • AI爱好者: 体验最新的AI技术,进行创意探索。

腾讯混元大语言模型

3、产品优势和特点

“混元Large”大语言模型的优势:

  • 业界领先的模型规模和性能: 参数规模和评测结果均处于业界领先水平,可处理更复杂的任务,提供更优质的AI服务。
  • 高质量合成数据: 采用高质量、高多样性的合成数据进行训练,提升模型效果,例如数学和代码效果提升超过10%。
  • 专家特定学习率缩放: 为不同专家设置不同的学习率,确保每个子模型都能有效地从数据中学习,提升整体性能。
  • KV缓存压缩: 采用分组查询注意力(GQA)和跨层注意力(CLA)策略,显著减少KV缓存的内存占用和计算开销,提升推理速度。
  • 长上下文处理能力: 最大支持256K上下文,相当于一本《三国演义》的长度,可一次性处理上传最多10个文档,并能一次性解析多个微信公众号链接、网址。

“Hunyuan3D-1.0” 3D生成模型的特点:

  • 高效生成高质量3D资产: 轻量版仅需10秒即可生成高质量3D资产,标准版也将文/图生成3D资产的耗时缩至45秒内。
  • 强大的泛化能力: 可重建各类尺度物体,大到建筑,小到工具花草。
  • 支持原生中文和风格定制: 采用DiT架构,与混元DiT生图联合,支持原生中文,支持风格定制。
  • 多视图扩散技术提升3D泛化性: 通过学习到的俯仰角度矫正,提升多视图准确性与一致性。特征平面超高特征分辨率和引入任意视角的输入图进一步提升了3D生成精度。

腾讯混元大语言模型

4、团队背景

“混元Large”和“Hunyuan3D-1.0” 均由腾讯混元大模型团队研发。 该团队致力于打造业界领先的大模型技术和产品,并积极拥抱开源,推动AI技术普惠和行业生态繁荣。 腾讯混元大模型已应用于腾讯内部超过700个业务,并通过腾讯云向合作生态进行赋能。

访问链接:

更多AI软件请到 https://ai-sou.cn/

Publisher

SeeAI
SeeAI

2024/11/05

Categories

Newsletter

加入社群

输入邮箱,免费接收最新AI资讯、AI软件推荐