发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

Kimi向Open AI发起冲击

2024-11-16来源:华尔街见闻编辑:瑞雪

作者 | 刘宝丹

编辑 | 周智宇

5天前,炙手可热的AI独角兽公司创始人杨植麟陷入一场仲裁纠纷,他坚定选择了依法抗辩。AI大模型正处于技术追赶的关键阶段,他要把重心放在技术和产品上。

一年前的今天,Kimi正式面向全社会开放服务。一年后,Kimi迎来重磅技术迭代。

11月16日,杨植麟在媒体沟通会上表示,Scaling范式已经发生变化,公司接下来的重点是基于强化学习去“Scale”。Scaling是支撑AI技术在过去几年发展的根本原因,但并不是把模型做得更大就好,核心是找到Scaling的有效方法。

杨植麟表示,简单去预测下一个token,其实有一定的局限性,我们希望AI能够去探索,接下来很重要的一个东西就是让AI具备思考的能力。

会上,月之暗面发布了最新的数学模型k0—math,该模型主要通过数学场景去培养和训练AI深度思考的能力。这是Kimi 推出的首款推理能力强化模型。

Kimi将苗头对准OpenAI的最新技术。在多项基准能力测试中,k0-math 的数学能力可对标OpenAI的o1系列。比如,在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math 初代模型成绩超过o1-mini和o1-preview模型。

不过,追赶OpenAI并没有那么容易。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了o1-mini最高成绩的90%和83%。

目前,月之暗面已经开始在k0-math上做产品化,公司将强化学习用到Kimi探索版,让它做更复杂的搜索。据杨植麟介绍,Kimi探索版在搜索意图、信源分析、链式思考方面表现显著。

同时,数学本身有更广泛的应用场景,月之暗面计划把k0—math应用到教育场景,包括K12、大学甚至是竞赛。

过去一年多,月之暗面经历了飞速发展,无论是产品技术还是估值,都成为最受瞩目的AI独角兽公司。

2023年3月,月之暗面成立;11月,Kimi 智能助手宣布全面开放,今年初,该产品因“长文本”出圈,诞生Kimi概念股,受到广泛关注。截至目前,月之暗面已完成四次融资,阿里、腾讯纷纷入股,公司估值超过200亿元。

杨植麟在会上透露,Kimi在10月月活超过3600万,而且还在持续更快的增长。业内人士分析,Kimi是仅次于豆包的AI应用,目前处于第一梯队,不过,相对国外几亿量级的用户而言,Kimi还有很长一段路需要追赶。

公司已将Scaling范式切换到强化学习,获悉,公司的多模态产品已经处于内测当中,预计很快会对外公布,这些动作无疑将带来更多用户。

在这场全球AI竞赛中,杨植麟要带领月之暗面在一个裹挟着巨大希望和时刻被质疑的行业里,闯出一条通往AGI的路,这场战役才刚刚开始。

以下为交流会实录(经编辑):

问:数据会不会成为比较大的挑战,怎么判断哪些数据可以用,哪些有价值?

杨植麟:这个问题对于强化学习来讲是一个核心问题,如果是像以前做Next—Token prediction,它是一个静态数据,相对来说,这些技术会更成熟一些。但是对强化学习来讲,所有的学习数据可能都是自己生成的,就会对奖励模型效果提出挑战。

对于这个问题,核心是怎么更好地训练奖励模型,设置奖励的机制,如果做得足够好话,一定程度上是可以被解决的。有点像以前的(pretraining)你还要做很多的对齐工作,我觉得其实对强化学习来说也是一样的。

问:对于强化学习,怎么平衡数据、算力、算法?

杨植麟:我觉得AI的发展就是一个荡秋千的过程,你会在两种状态之间来回切换,一种状态就是算法数据是非常ready,但是你的算力不够。所以你要做更多的工程,把infra做得更好,它就能够持续地提升。我觉得其实从transformer诞生到GPT4,其实更多的矛盾就是我怎么能够Scale,但是你可能在算法和数据上可能没有本质的问题。

今天,当你Scale差不多的时候,你会发现我再加更多的算力,并不一定能直接解决这个问题,核心是,因为你没有高质量的数据,小几十G的token是人类互联网积累了20多年的上限。这个时候要做的事情,就是通过算法的改变,让这个东西不会成为瓶颈。所有的好算法就是跟Scaling做朋友,如果你的算法能够释放Scaling的潜力,它就会持续变得更好。

我们从很早就开始做强化学习相关的东西,我觉得这个也是接下来很重要的一个趋势,通过这种方式去改变你的目标函数,改变你的学习的方式,让它能持续的Scale。

问:这个产品如果一至两周之后放到Kimi探索版里,用户可以选择用这个东西,还是你们会根据用户的提问来分配模型?怎么去平衡成本问题?

杨植麟:这个问题特别好,接下来的版本大概率会让用户自己去选择。早期通过这种方式可以更好地分配或者更好地满足用户的预期。

这里面最终可能还是一个技术问题,两个点,一个点是能够动态地给它分配最优的算力。如果模型足够聪明的话,简单的问题它的思考时间会更短。但是它可能还不是到最优的点,我觉得它还有更优,这是我们通过算法迭代去做的。

长期来讲,第二个点是成本也是不断下降的过程。比如说,今年如果达到去年GPT4模型的水平,可能只需要十几B的参数就能做到。所以我觉得整个行业先做大或者做小,是这样的普遍普世的规律。

问:怎么看待AI创业公司被收购,人才回流大的现象?

杨植麟:这个问题我们没有遇到,但可能有一些别的公司遇到。

我觉得倒也正常,行业发展进入了一个新的阶段,它从一开始有很多公司在做。变成了现在少一点的公司在做,接下来大家做的东西会逐渐不一样,我觉得这是必然的规律。

我们主动选择做了业务的减法,你应该聚焦一些重要的事情,把一个产品做好,做到极致是最重要的。在几个大模型创业公司里,我们始终保持人数最少,保持卡和人的比例是最高的,我觉得这个是非常关键的。我们不希望把团队扩那么大,太大对创新有致命性伤害。如果想把团队保持在一定的规模,最好的方式是业务上做一些减法。

另外一点,我们也根据美国市场的情况去判断,哪个业务最后做大的概率更高,我们聚焦在上限最高的事情,而且跟我们AGI的misson也最相关。

问:多模态我们一直不做的原因是什么?

杨植麟:我们几个多模态的能力在内测。

我觉得AI接下来最重要的是思考和交互这两个能力,思考的重要性远大于交互,不是说交互不重要,我觉得思考会决定上限,交互我觉得是一个必要条件,比如说vision的能力,如果没有vision的能力没法做交互。

我觉得他们两个不太一样,多模态肯定是必要的,但是我觉得是思考决定它的上限。

问:怎么看自己跟豆包的竞争?

Valve推出Steam Frame新VR头显 正式宣告上一代Index头显停产
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

小天互连IM系统:打破政企信息孤岛 驱动一体化协作新变革
某省级政务大厅在信创升级中,通过小天互连IM系统实现了与政务服务平台、电子证照系统的无缝对接,群众办事进度可直接通过即时通讯推送,办理效率提升50%,印证了其国产化集成的稳定性。 从国产化生态适配到开放 A…

2025-11-14

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

2025微信数据保护全攻略:误删聊天记录别急,多场景恢复方案来了
提前备份是数据安全的核心,2025年微信已支持电脑、云服务、外部存储等多种备份方式,恢复时只需简单操作即可找回记录。苹果和安卓厂商的云服务早已支持微信数据备份,关键是确认误删前有有效备份记录。 2. 选择…

2025-11-13

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

SK海力士VFO工艺打造HBS技术,为移动设备AI性能提升带来新突破
据闪德资讯获悉,SK海力士正在研发结合移动DRAM和NAND的高带宽存储(HBS)技术,可提高智能手机和平板电脑等移动设备的AI性能。 相比HBM使用的硅通孔(TSV)技术,VFO无需穿孔,成本更低、良率更高…

2025-11-12

中国电信携手多方完成2万公里中轨NTN在轨试验 速率达140Mbps
快科技11月11日消息,近日,中国电信研究院联合浙江电信,携手清华大学、上海清申科技、北京捷蜂创智科技,依托云网融合大科创装置天地一体卫星试验能力,成功完成NTN(非地面网络)制式在中轨卫星条件下的在轨技术验…

2025-11-12

物联网防逆流方案:10秒动态调节,光伏发电余电不上网更高效
防逆流柔性调节通过加装物联网网关与双向计量电表,监测市电总进线处的功率和逆变器实时的发电功率,通过网关内置的智能算法,以*快10秒为一个检测周期,持续跟踪负荷变化,动态调节逆变器的有功功率输出,既达到防逆流…

2025-11-11

奇安信“未知威胁检测防护”项目获2024年度北京市科技进步一等奖
央广网北京11月11日消息(记者 万玉航)11月7日,北京市人民政府召开了2024年度北京市科学技术奖励大会,奇安信参与申报的“面向海量软件的未知威胁高效检测与防护关键技术研发及应用”项目获得北京市科学技术进…

2025-11-11

可编程网络中控系统:控制为核心基石,附属功能助力效能提升
AI算法在中控系统中的应用,并非为了追求技术噱头,而是通过分析设备运行状态数据,实现控制指令的预判与自适应调整——如根据会议室人数自动调节空调温度、根据室外光照强度自动调整室内照明亮度,让控制更智能、更贴合实…

2025-11-10