16F.COM·(中国)官方网站

16F.COM
官方平台·app·下载·手机版！

16F.COM
这里是我们共同的家园！

16F.COM

🏥来自衡水发布时间:2024年06月03日 16:0316F.COM

16F.COM

➮⛒🧝

16F.COM

对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大，优化推理成本的空间也越大。以前的模型都是单机推理，大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好，推理成本就会大大降低。

从浪潮信息发布的“源2.0-M32”开源大模型来看，其基于“源2.0”系列大模型已有工作基础，创新提出和采用了“基于注意力机制的门控网络”技术，构建包含32个专家(Expert)的混合专家模型(MoE)，并大幅提升了模型算力效率，模型运行时激活参数为37亿，在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

🥦（撰稿：徐离馥群）

本文来自网友发表，不代表本网站观点和立场，如存在侵权问题，请与本网站联系。未经本平台授权，严禁转载！

展开

打开16F.COM,阅读全文

4人支持

阅读原文阅读 2151回复 4

全部评论

默认
最新
楼主

薛玉宏❮LV4六年级
2楼
西藏五年来全社会用电量增幅超100%⬅
2024/06/03 来自博乐
6回复
➝甄固林LV7大学四年级
3楼
陪学陪玩月薪动辄上万元的陪伴师能缓解育儿焦虑吗？➺
2024/06/03 来自阿克苏
1回复
卢裕纯🎓LV5幼儿园
4楼
华中地区首家柏悦酒店亮相长沙繁华中心❇
2024/06/03 来自吉林
7回复
满康翠LV8大学三年级
5楼
中青漫评丨春运回家记：让视障旅客出行更从容⛻
2024/06/03 来自象山
7回复
谢文巧🧐👥LV8大学三年级
6楼
“真能装”上路就被查沈阳公安交警曝光超载案例➆
2024/06/03 来自喀什
0回复
荣胜苑LV3大学四年级
7楼
以守正创新的正气和锐气赓续历史文脉➢
2024/06/03 来自铜陵
赞回复

你的热评

游客

最热圈子

#尹钢银任广安市前锋区副区长、代理区长川观新闻1天前#
上官融斌
7
#如果文物会说话｜四通八达明沟暗道这座4000年前的城防御体系极为复杂#
袁岚伟
2
#6月2日印度原油花生油价格#
奚若弘
1
#女子就餐狗被服务员放工作间闷死
上官竹顺
1

守护学生身心健康看“十要义”重点措施
2024/06/03黎全妹🆙
隗楠：“AI+视听”为行业应用带来更广阔的空间
2024/06/03云雄轮🛰
历史文化名城新气象
2024/06/03盛元娅✒
【文脉华章】习言道｜革故鼎新、与时俱进是中华文明永恒的精神气质
2024/06/03姜时琴⛹
河北承德出现暴雪天气
2024/06/03宋贝蓉🗝
#5岁女孩跳英歌舞又猛又萌#
2024/06/02印奇天⚟
九张动图警示你：高速错过出口请将错就错
2024/06/02江洋茗🥅
5月中国仓储指数为48.4%仓储业务需求有所回升
2024/06/02成伟若x
俄称乌对扎波罗热核电站发动无人机袭击
2024/06/01凤勤融e
首届苏台邻里节在江苏宿迁启动
2024/06/01长孙玲欢📲

安装应用

随时随地关注16F.COM

安全检测