发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

AI模型评估赛道崛起:90后团队打造LMArena 获1.5亿美元融资估值17亿

2026-01-07来源:快讯编辑:瑞雪

AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资,公司估值跃升至17亿美元。这支由90后华人主导的团队,凭借独特的评估模式和开源技术积累,在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投,Andreessen Horowitz、The House Fund等知名机构跟投。

故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS,因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量,现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的,却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。

"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化,通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者,新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大,2024年Chatbot Arena正式独立为商业公司lmarena.ai,转型专注AI模型评估赛道。

当前主打的LMArena平台构建了三维评估体系:匿名对战机制下,用户提问后系统随机匹配两个模型匿名作答,投票后才揭晓身份;评分系统采用改进版Elo算法,通过胜负关系动态调整分数;人机协同框架则通过算法平衡模型曝光度,避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性,成为行业公认的"模型试金石"。

数据印证着平台的爆发式增长:自2024年获得1亿美元种子轮融资后,累计收集5000万张跨模态投票,完成400余种开放/专有模型评估,产出14.5万个开源战斗数据点。当前排行榜上,Gemini 3 Pro以1490分领跑,OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可,让这个由学术团队转型的创业公司,在AI评估赛道走出独特路径。

360集团获首批智能体互联协议试点资格,以AI+安全赋能产业新发展
公司不仅发布了全球首个L4级多智能体蜂群,展现出处理复杂任务的卓越协同能力;同时推出了 “360企业级智能体构建与运营平台” ,致力于解决政企用户在智能化转型中面临的实际挑战,赋能千行百业安全、高效地创建和部…

2026-01-07

国标GB28181设备接入端EasyGBD:破局异构接入 赋能安防智能化升级
在平台兼容性上,其全面支持Windows、Linux、Android、iOS、ARM等所有主流操作系统及嵌入式平台,真正实现“一套组件、全平台运行”,无论是移动端设备、嵌入式终端还是服务器,都能快速部署集成…

2026-01-07

360集团凭技术积累入选智能体互联协议首批试点 领航AI下半场发展
公司不仅发布了全球首个L4级多智能体蜂群,展现出处理复杂任务的卓越协同能力;同时推出了 “360企业级智能体构建与运营平台” ,致力于解决政企用户在智能化转型中面临的实际挑战,赋能千行百业安全、高效地创建和部…

2026-01-07

罗永浩“科技春晚”遇小插曲,中国移动5G保障显实力引关注
中国移动此次为罗永浩大会提供的保障,其实已是行业内大型活动网络保障的常规操作,但即便如此,仍难以完全满足所有用户的即时需求,这也足以说明大型密集场所网络保障的复杂性。 罗永浩从曾经吐槽网络服务到如今信赖中国移…

2026-01-07