16F.COM

 

16F.COM

➮⛒🧝     

16F.COM

对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。

从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

🥦(撰稿:徐离馥群)

本文来自网友发表,不代表本网站观点和立场,如存在侵权问题,请与本网站联系。未经本平台授权,严禁转载!
展开
支持楼主

4人支持

阅读原文阅读 2151回复 4
举报
    全部评论
    • 默认
    • 最新
    • 楼主
    • 薛玉宏❮LV4六年级
      2楼
      西藏五年来全社会用电量增幅超100%⬅
      2024/06/03   来自博乐
      6回复
    • ➝甄固林LV7大学四年级
      3楼
      陪学陪玩月薪动辄上万元的陪伴师能缓解育儿焦虑吗?➺
      2024/06/03   来自阿克苏
      1回复
    • 卢裕纯🎓LV5幼儿园
      4楼
      华中地区首家柏悦酒店亮相长沙繁华中心❇
      2024/06/03   来自吉林
      7回复
    • 满康翠LV8大学三年级
      5楼
      中青漫评丨春运回家记:让视障旅客出行更从容⛻
      2024/06/03   来自象山
      7回复
    • 谢文巧🧐👥LV8大学三年级
      6楼
      “真能装”上路就被查沈阳公安交警曝光超载案例➆
      2024/06/03   来自喀什
      0回复
    • 荣胜苑LV3大学四年级
      7楼
      以守正创新的正气和锐气赓续历史文脉➢
      2024/06/03   来自铜陵
      回复
    你的热评
    游客
    发表评论
    最热圈子
    • #尹钢银任广安市前锋区副区长、代理区长川观新闻1天前#

      上官融斌

      7
    • #如果文物会说话|四通八达 明沟暗道 这座4000年前的城防御体系极为复杂#

      袁岚伟

      2
    • #6月2日印度原油花生油价格#

      奚若弘

      1
    • #女子就餐狗被服务员放工作间闷死

      上官竹顺

      1
    热点推荐

    安装应用

    随时随地关注16F.COM

    Sitemap
    安全检测