【发现者网】1月29日消息,百川智能近日发布了超千亿参数的大语言模型Baichuan 3,该模型在多个领域取得了显著突破,尤其是在中文任务上的表现更是超越了GPT-4,成为业界瞩目的焦点。
Baichuan 3在基础能力方面展现出了强大的实力。据发现者网了解,该模型在CMMLU、GAOKAO和AGI-eval等多个权威通用能力评测中均取得了优异成绩。在数学和代码专项评测如MATH、Humaneval和MBPP中,Baichuan 3同样展现出了出色的表现。这些成绩的取得,得益于百川智能在训练过程中采用的多种创新技术手段及方案,如“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等。
百川智能针对Baichuan 3在医疗领域的能力进行了专门优化。该模型在医疗领域的表现同样令人瞩目,尤其是在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上,Baichuan 3的中文效果超越了GPT-4,成为中文医疗任务表现最佳的大模型。这一成就的取得,得益于百川智能在模型预训练阶段构建的超过千亿Token的医疗数据集,以及针对医疗知识激发的问题所做的系统性研究和调优。
除了基础能力和医疗领域的突破外,Baichuan 3还在创作精准度方面取得了显著提升。该模型突破了“迭代式强化学习”技术,进一步提升了语义理解和生成能力。在诗词创作的格式、韵律、表意等方面,Baichuan 3的表现优异,领先于其他大模型。据百川智能介绍,该模型结合“RLHF&RLAIF”以及迭代式强化学习的方法,让大模型的诗词创作能力达到全新高度。其可用性相比当前业界最好的模型水平提升达500%,文采远超GPT-4。
总的来说,Baichuan 3的发布是百川智能在人工智能领域取得的又一重要成果。该模型在多个领域展现出了强大的实力和潜力,为人工智能技术的发展注入了新的活力。我们期待Baichuan 3在未来能够为更多领域带来革命性的变革和进步。