网友提问 :Yan 1.2大模型的推理能力和准确率如何?相关评测的数据如何?谢谢!
2024-07-22 08:48:47
岩山科技 (002195): 回答:公司旗下岩芯数智自主研发的Yan1.2多模态大模型运行在树莓派5(频率为2.4GHz的64位四核Arm Cortex-A76处理器)上进行推理每秒可达7-8 tokens的响应效率,在中低端的手机上推理每秒可达20+tokens(CPU运行,非NPU或GPU)的响应效率。根据媒体公开报道,Llama3 8B模型量化后在树莓派5上每秒速率低于2 tokens。
基于目前评测情况,Yan1.2大模型处于行业领先水平。Yan架构核心原理包括MCSD(multi-channel slope and decay)和基于仿生神经元驱动的类脑激活机制等。鉴于Yan1.2为多模态模型,为便于评测比较,岩芯数智将Yan1.2的核心模块即自然语言部分MCSD 3B模型,采用5-shot测试方法,与Llama3 8B模型、Pythia 2.8B模型、Mamba 2.8B模型、RWKV4 3B模型这4个典型自然语言模型进行了比较。岩芯数智将5个模型分别对ARC-C、ARC-E、WinoGrande、MMLU、Hellaswag 5个基本任务进行评测,MCSD 5个基本任务评测平均分为53.5分,高于Phthia(48.6分)、Mamba(52.4分)、RWKV4(49.1分),低于模型更大的Llama3(75.0分)。该评测结果评估了包括模型的准确率在内的整体综合表现,该结果已公开在论文当中(论文链接:https://arxiv.org/abs/2406.12230)。
根据美国苹果公司在其公开论文(论文链接:https://arxiv.org/abs/2404.14619)中发表的测试结果,其OpenELM模型(模型大小3.04B)采用zero-shot测试方法在7个基本任务上进行了测试,其中4个可比任务ARC-C、ARC-E、WinoGrande、Hellaswag的测试平均分为58.36分,低于MCSD的59.5分。OpenELM模型采用测试方法与MCSD不同且MCSD训练语料少于OpenELM,该对比结果仅供参考。
谢谢。
2024-08-01 21:01:21
岩山科技最新互动问答
- 您好董秘:
Nullmax推出新一代端到端自动驾驶技术Nullmax Intelligence,
请问该技术现在应用在哪个车企或者哪一辆车上面?是否量产?望请答复,谢谢!
2024-08-01 21:02:18
- 公司的总算力是多少p,够自己大模型运算吗?有没有往外出租算力的业务和打算,以后会增加算力吗?
2024-08-01 21:02:49
- 请问公司收购纽劢的ODI申请通过了没有?到哪个阶段了?
2024-07-25 18:00:59
- 请问:Yan 1.2大模型的数学、编码能力如何?能否文生图、文生视频?是否达到了GPT 4
2024-07-24 16:55:28
- 请问:公司何时推出可供大众使用的Yan大模型?如果大众无法实际体验Yan大模型,如何让投资者相信公司的实际研究成果,而仅仅是PPT的演示?Yan大模型目前是否拥有落地应用的案例?谢谢!
2024-07-24 16:57:22
岩山科技龙虎榜 | 岩山科技大宗交易 | 岩山科技股东人数 | 岩山科技互动平台 |
岩山科技财务分析 | 岩山科技主营收入构成 | 岩山科技流通股东 | 岩山科技十大股东 |
岩山科技
法定名称:上海岩山科技股份有限公司
公司简介:
公司是经上海市人民政府出具沪府体改审(2001)012号批准,由原上海欧姆龙计算机有限公司整体变更设立的股份有限公司。公司于2001年7月24日取得变更后的,注册号为3100001006617。2004年8月,经交大欧姆龙2004年度第一次临时股东大会审议,交大欧姆龙变更名称为“上海交大海隆软件股份有限公司”。
经营范围:
互联网信息服务;互联网金融服务。
注册地址中国(上海)自由贸易试验区张江路665号3层
办公地址上海市浦东新区博霞路11号3楼
主营收入