发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

英伟达开源新大模型Nemotron,仅次于GPT-4?

2024-10-17来源:ITBEAR编辑:瑞雪

英伟达,全球AI技术的领头羊,近期宣布开源其最新研发的超强模型——Llama-3.1-Nemotron-70B-Instruct。据测试数据揭示,此模型在性能上已成功超越GPT-4o、GPT-4turbo、Gemma-2等140多个开源及闭源模型,其表现仅次于OpenAI最新发布的o1模型。

Nemotron的基础架构源自Llama-3.1-70B,但其独特之处在于采用了一种创新的混合训练方法,该方法融合了Bradley-Terry与Regression两种策略,用于训练奖励模型,显著提升了模型效果。

业界观察家指出,英伟达频繁开源先进模型,不仅得益于其雄厚的科研资金支持,更深层次的目的在于推动GPU销售与开发生态的繁荣。相比之下,meta凭借其社交帝国的商业化和资金优势,亦在AI领域占据一席之地。然而,这一趋势对于大模型初创企业而言,无疑构成了巨大挑战,它们在资金、商业化及知名度方面均面临严峻考验。

Nemotron的成功,部分归功于其创新的混合训练方法。该方法旨在优化奖励模型,使其更精准地理解并执行用户指令,无论是翻译、文本生成还是问答任务。Bradley-Terry与Regression的结合,既考虑了用户偏好,又兼顾了响应质量的细致评估,从而克服了单一方法的局限性。

为了实施这一混合方法,英伟达开发了包含评分和偏好注释的HELPSTEER2-PREFERENCE数据集,通过严格的注释和预处理步骤,确保了数据的质量和一致性。测试结果显示,使用该数据集训练的模型在RewardBench评测中取得了94.1的高分,表现出色。

一位高级AI用户分享了使用Nemotron模型的心得,表示在商业写作方面,该模型相较于Claude3和ChatGPT展现出更高的智能水平,尽管仍会犯一些错误,但整体表现更为出色。

英伟达的创新混合训练方法不仅体现在技术层面的突破,更在数据集的构建上展现了独到之处。HELPSTEER2-PREFERENCE数据集的多元化注释过程,不仅增强了数据的透明度,也为后续分析提供了丰富的背景信息。

英伟达以极低的成本实现了这一技术飞跃,若其愿意,将难以有竞争对手匹敌。这一创新不仅推动了AI技术的进步,也为行业树立了新的标杆。

总体而言,AI领域的竞争正以惊人的速度推动着行业的进步,而英伟达的这一开源举措无疑为这一进程注入了新的活力。

英伟达与台积电“内讧”?Blackwell出货推迟真相了!
还有一些英伟达的工程师认为,Blackwell芯片的生产放缓源于台积电采用了一项新技术,该技术将不同类型的芯片封装在一起。有客户曾将部分原本交给台积电的业务转给其他制造商,后来试图重新找台积电做,张忠谋就提…

2024-10-17

Model Y遭遇新挑战者,新能源汽车市场风云再起?
问:我们都有关注到华为对梦想家这种销量立竿见影的提升效果,想问一下知音目前有没有在做一些跟乾坤3.0,ADS3.0和鸿蒙座舱4.0的这种储备,会不会在某一个阶段推出来这种华为版的车型,尤其在FSD一直在传入华…

2024-10-16

中国人寿前三季净利破千亿,大基金拟减持赛微电子股份!
3、概伦电子:股东金秋投资、嘉橙投资等合计拟减持不超过公司总股本3%的股票。 3、徐工机械:为优化资产结构、提高资产营运效益,公司拟发行总额不超过人民币200亿元的资产证券化项目,包括深圳证券交易所市场资产…

2024-10-16

奇瑞风云T8 C-DM申报图曝光:插混系统,5/7座任选!
10月16日消息,从工信部网站获取到了一组奇瑞风云T8C-DM的申报图。与风云T9、T10不同的是,新车前中网由与车身同色改为了黑色,与传统燃油车更加相似。该车定位为紧凑型SUV,提供5座和7…

2024-10-16

AI耗电非大头?未来“耗电大户”曝光,需求竟是数据中心三倍!
IEA表示,排除其他可变因素,到2050年,住宅空调的能源使用量预计将增长280%,将占建筑物总能源需求的14%,而目前这一比例还不到7%。 IEA表示,全球电力需求以每年1000TWh的速度增长,相当于每…

2024-10-16