发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

百川智能发布Baichuan 3:超越GPT-4的中文大语言模型新星

2024-01-29来源:发现者网编辑:星辉

【发现者网】1月29日消息,百川智能近日发布了超千亿参数的大语言模型Baichuan 3,该模型在多个领域取得了显著突破,尤其是在中文任务上的表现更是超越了GPT-4,成为业界瞩目的焦点。

Baichuan 3在基础能力方面展现出了强大的实力。据发现者网了解,该模型在CMMLU、GAOKAO和AGI-eval等多个权威通用能力评测中均取得了优异成绩。在数学和代码专项评测如MATH、Humaneval和MBPP中,Baichuan 3同样展现出了出色的表现。这些成绩的取得,得益于百川智能在训练过程中采用的多种创新技术手段及方案,如“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等。

百川智能针对Baichuan 3在医疗领域的能力进行了专门优化。该模型在医疗领域的表现同样令人瞩目,尤其是在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上,Baichuan 3的中文效果超越了GPT-4,成为中文医疗任务表现最佳的大模型。这一成就的取得,得益于百川智能在模型预训练阶段构建的超过千亿Token的医疗数据集,以及针对医疗知识激发的问题所做的系统性研究和调优。

除了基础能力和医疗领域的突破外,Baichuan 3还在创作精准度方面取得了显著提升。该模型突破了“迭代式强化学习”技术,进一步提升了语义理解和生成能力。在诗词创作的格式、韵律、表意等方面,Baichuan 3的表现优异,领先于其他大模型。据百川智能介绍,该模型结合“RLHF&RLAIF”以及迭代式强化学习的方法,让大模型的诗词创作能力达到全新高度。其可用性相比当前业界最好的模型水平提升达500%,文采远超GPT-4。

总的来说,Baichuan 3的发布是百川智能在人工智能领域取得的又一重要成果。该模型在多个领域展现出了强大的实力和潜力,为人工智能技术的发展注入了新的活力。我们期待Baichuan 3在未来能够为更多领域带来革命性的变革和进步。

微软斥资6.5亿美元携手Inflection AI 加速AI布局
【发现者网】3月22日消息,奥迪汽车再次刷新了豪华车市场的格局,新款奥迪A8L Horch创始人版正式上市,为消费者带来了两款豪华车型,定价分别为130万元和207.68万元。这款车型不仅是对品牌传统的传承,更是对豪华汽

2024-03-22

侯晓楠领航阅文集团:“爆款之年”展望 海外业务与AI应用成新增长引擎
【发现者网】3月19日消息,阅文集团于3月18日发布了2023年全年业绩报告,显示该公司在过去的一年中取得了不错的业绩。据悉,阅文集团全年营收达到70.12亿元,虽然同比下降了8%,但归母净利润却实现了32.3%的同比增长

2024-03-19

英伟达推出高性能GB200芯片 助力AI模型训练再提速
【发现者网】3月19日消息,英伟达在美国加州圣何塞的全球开发者大会上,发布了最新一代专用于人工智能的GPU芯片及相应软件,意图巩固其在人工智能领域的领先地位。据发现者网了解,英伟达新推出的GPU架构名为Blackwe

2024-03-19

英伟达或斥巨资收购Run:AI 人工智能领域将迎新变革
【发现者网】3月18日消息,近日有知情人士向发现者网独家透露,全球知名的图形处理器制造商英伟达正与以色列的人工智能基础设施编排和管理平台Run:AI进行紧密谈判,双方正在商讨一项可能涉及数亿美元,甚至高达10亿

2024-03-18

Yi大模型API震撼上线 零一万物助力开发者领跑AI赛道
【发现者网】3月14日消息,零一万物公司近日宣布推出全新的Yi大模型API开放平台,该平台将为全球的开发者带来三款功能强大的模型:通用聊天模型「Yi-34B-Chat-0205」、支持超长上下文的「Yi-34B-Chat-200K」以及多模

2024-03-14