新零售网 > 品牌 >

百川智能发布Baichuan2开源大模型,号称“文理兼备全面领先LLaM

来源:IT之家 发布时间:2023-09-07 16:17   阅读量:11122   

,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为免费可商用。

据百川智能官方介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

其中 Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%,逻辑推理能力提升 25%,语义理解能力提升 15%。

图源“百川智能”公众号,下同

在 MMLU、CMMLU、GSM8K 等基准测试中,百川智能的两个模型都比 LLaMA 2 的分数要高一些,且在“中文通用”部分优势较大。

7B 参数模型的 Benchmark 成绩

13B 参数模型的 Benchmark 成绩

Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。

广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

威联通推出全新NAS双网口25GbESFP28扩展卡,支持PCI 2023-09-07 16:13

星曜11mmF2.8全画幅鱼眼镜头即将上市,适配E/Z/RF/L 2023-09-07 16:09

特斯拉计划“升级工厂停工”将致汽车交付量下降,分析师认为其“Q3 2023-09-07 15:44

自称25年码农,唐娜姐负责微软新AI项目:帮开发者使用和扩展Co 2023-09-07 15:40

中兴畅行50手机上架官方商城:紫光展锐T760处理器,售价899 2023-09-07 14:30

优予的菜:哪怕只好1%,我们愿意投入100%的认真 2023-09-07 14:07

华为Mate60引爆A股卫星产业链狂欢 2023-09-07 12:54

建设银行发布关于明确存量首套住房贷款利率调整有关具体事项的公告 2023-09-07 12:45

全球财经连线|沙特俄罗斯官宣延长减产,国际油价全线上涨 2023-09-07 12:21

上饶银行依托中征“一平台一系统”大力支持实体经济 2023-09-07 11:45

EACEO称赞重生工作室系列游戏作品,透露“还有一款未公布的原创 2023-09-07 11:32

财险业充分发挥“减震器”功能 2023-09-07 10:16

OpenAI将于11月6日举办首届开发者大会CEO预告将公布最新 2023-09-07 10:11

告别缺货和积压!消费品备货补货可以这样做 2023-09-07 10:08

引入增量资金北交所两融、做市业务将扩容 2023-09-07 08:36

主流自主品牌车企8月份销量普遍增长为迎接“金九银十”密集推出新车 2023-09-07 08:16

西门子计划投资3000万美元培训美国电动汽车充电行业技术人员 2023-09-06 15:00

鸿海集团与墨西哥奇瓦瓦州达成战略合作,布局车用产业和可再生能源 2023-09-06 14:18

经营业绩全面恢复、车流收入持续向好华夏越秀高速REIT召开中期业 2023-09-06 14:05

酷比魔方iWorkGT12二合一平板下周推出,搭载R57520U 2023-09-06 13:56