发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

阿里开源Qwen3.5小尺寸模型系列,性能亮眼引马斯克关注与网友热议

2026-03-03来源:天脉网编辑:瑞雪

阿里近日宣布开源Qwen3.5系列中的四款小尺寸模型,包括Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B。这些模型专为笔记本电脑等端侧设备设计,支持在消费级显卡上运行,并允许通过LoRA或全量微调进行任务适配。

在性能评测中,Qwen3.5-9B在多项基准测试中表现突出,尤其在GPQA Diamond、MMMU-Pro、ERQA和Video-MME等任务中超越了GPT-OSS-20B、GPT-5 nano和Gemini 2.5 Flash-Lite等竞品。尽管Qwen3.5-4B作为更小版本,在多语言知识、视觉推理和文档理解等任务上接近9B版本的水平,但在纯数学推理方面仍有提升空间。

开发者社区对这批模型的发布反应热烈。一位开发者指出,Qwen3.5-9B在MMMU-Pro测试中以13分优势击败GPT-5-Nano,证明架构设计比参数规模更重要。另一位开发者分享了实际使用体验:在Mac mini上运行Qwen3.5-9B,结合OpenClaw工具,可构建成本低于初级员工月薪的AI系统。还有用户通过AMD Ryzen AI Max+395处理器和Q4_K_XL量化算法,实现了约30个token/s的处理速度,且显存占用不足16GB。

不同版本模型针对特定场景优化:0.8B和2B版本以轻量化见长,适合移动设备和低延迟交互场景;4B版本作为多模态基座模型,可平衡性能与资源消耗;9B版本则在紧凑结构下实现接近GPT-OSS-120B的性能,成为服务器端高性价比选择。所有模型均采用Apache 2.0协议开源,基座模型也同步开放。

社区讨论中,有用户提出Qwen3.5系列可在手机端运行,引发关于iPhone部署方案的追问。不过也有开发者客观指出,4B模型在复杂推理任务中正确率不足50%,数学测试正确率仅约15%,更适合作为自动补全工具而非深度思考伙伴。尽管存在局限,但这些小尺寸模型在特定能力维度已达到Gemini 3 Flash等云端模型的水平,具备实际端侧应用价值。

目前Qwen3.5家族已形成完整产品线,包含1个397B参数的大尺寸模型、3个中型模型(122B、35B、27B)和4个新发布的小尺寸模型。开发者可通过魔搭社区和Hugging Face平台获取相关资源。

国产恒脑安全智能体大显身手:复现3漏洞再挖10个,实现AI安全新突破
而现在,国产安全智能体给出了一份更深度的答卷——杭州安恒信息旗下的恒脑安全智能体,不仅在第一时间内100%复现了上述3个漏洞。 就在2026年1月,恒脑安全智能体作为全球首位AI选手,亮相第六届“天府杯”国…

2026-03-03

GPT-5.4或下周登场:200万Tokens加持,状态化AI开启工作流新纪元
近日,OpenAI 的一名工程师在 Codex 的公开 GitHub仓库中提交了一次代码拉取请求,无意间将「gpt-5.4」这个尚未公布的型号写进了版本判断条件中。 它试图终结近期大模型领域挤牙膏式的常规…

2026-03-03

编程交互新变革:Claude Code语音写代码登场,开启自然编程新征程
有意思的是,OpenAI的Codex几乎在同一时间也加了类似功能。你说话时会自然带出更多上下文——就是那个,登录页面,输入带加号的邮箱,它验证就报错了——这种人类碎碎念的信息密度,打字时你绝对懒得写。 写…

2026-03-03

马斯克:AI与机器人或引发工作变革,部分岗位超七成将被替代
PChome 3月2日消息,马斯克近期在多个场合表示,随着AI和机器人技术的快速发展,未来10年内人类的工作模式将发生根本性转变。 据PChome了解,马斯克认为,随着Optimus人形机器人、自动驾驶技术的…

2026-03-03