发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

苹果再出手,300亿参数AI大模型MM1.5来了!

2024-10-13来源:ITBEAR编辑:瑞雪

苹果公司近期为其多模态大模型MM推出了1.5版本,新版本在延续前代MM1数据驱动训练原则的基础上,着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布,并附有论文链接。

MM1.5版本提供了10亿至300亿多种参数规模的选择,具备图像识别和自然语言推理能力。苹果的研发团队在新版本中改进了数据混合策略,显著增强了模型在多文本图像理解、视觉引用与定位以及多图像推理方面的表现。

根据参考论文,苹果在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,大幅提升了模型对富含文本内容的图像的理解能力。研究团队还在监督式微调阶段分析了不同数据类型对模型性能的影响,并优化了视觉指令微调数据的混合方式,使模型实现了更高的效率,即便是小规模的模型(10亿、30亿参数版本)也能展现出优秀的性能。

苹果公司此次还推出了MM1.5-Video模型,专门用于视频理解,以及MM1.5-UI模型,专注于移动设备用户界面的理解。MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,它能够处理各种视觉引用与定位任务,总结屏幕上的功能,或者通过对话与用户进行交互。

《黑神话:悟空》销量破2100万,评分真低估它了?
其媒体平均评分为81分,但近日一名玩家在Reddit论坛上表示,他认为这款游戏的潜力远超这个分数。这篇新闻后面提到了一款名为《黑神话:悟空全收集互动地图》的作品,不过我没有找到更多的相关信息。 综上所述,《…

2024-10-13

特斯拉Q4重启全自动驾驶转移,这次能行吗?
在6月份特斯拉年度股东大会上,马斯克同意让特斯拉再推出一个季度的FSD转移服务,此前,在首席执行官开始回答有关转移的问题时,一名股东大喊再推出一个季度。马斯克同意再推出一个季度的FSD转移服务,但他也解释了特…

2024-10-13

深圳新规:新能源汽车地下充电,四层以下说不!
10月13日消息,深圳发布全国首个关于新能源汽车地下停放场所消防安全管理的地方标准。由深圳市消防救援支队提出并牵头编制的地方标准《新能源汽车地下停放场所消防安全管理规范》(DB4403/T509—20…

2024-10-13

上海大学新研究:深度学习助力材料微纳结构成像!
注:STM 是用于成像和操控单个原子和分子的工具,在纳米科技和表面科学领域具有不可替代的重要作用。通过该系统,研究团队实现了 STM 的自主操作,使其在无人干预的情况下长时间、高精度地获取单分子分辨…

2024-10-13

问界携手中汽中心,共创“新豪华汽车技术实验室”,啥情况?
10月12日消息,从赛力斯汽车获悉,10月11日,问界与中汽中心共建的“问界新豪华汽车技术共创实验室”揭牌暨签约仪式在天津举行。据悉,问界新豪华汽车技术共创实验室覆盖了高端智能电动汽车的多个领…

2024-10-13

淘宝88VIP会员超4200万,直播GMV增25%,啥情况?
10 月 13 日消息,在 2024 天猫双 11 发布会上,淘天集团表示淘宝 88VIP 过去一年持续保持双位数增长,00后用户数同比增长 67%,会员规模超 4200 万。 据称,淘宝直播 Q…

2024-10-13

吉利缤越L SUV外观首曝,月底即将上市,你期待吗?
2024-10-1211:40:27作者:姚立伟吉利汽车今天公布了缤越LSUV车型的外观预告图。据悉,该车预计将于本月底上市。与现款车型相比,缤越L主要在前脸造型上有所调整,换装了大尺寸横幅式前格栅,并配备了…

2024-10-12