当你向主流AI聊天机器人询问“1到10之间的随机数”时,答案大概率是7。再次询问,可能会得到3或4,第三次又变成8或9。这种看似巧合的现象,暴露出当前大语言模型在开放性任务中的显著局限——答案趋于同质化,缺乏真正的多样性。
澳大利亚初创公司Springboards正试图打破这一僵局。他们开发的Flint模型,在回答“欧洲旅行目的地”或“汽车品牌”等问题时,不再重复常见答案,而是提供更具差异化的选择。例如,当其他模型反复推荐丰田或本田时,Flint会给出福特F-150;面对随机数请求,它可能返回3.7916而非整数7。这种差异源于其设计理念——允许模型保留一定程度的“幻觉”,即非完全确定但富有创意的回答。
Springboards联合创始人Pip Bingemann通过实验展示了这种差异。在广告标语创作测试中,ChatGPT和Claude均给出“Run your way”,而Flint的“Built to last, run to win”虽不惊艳,却避免了重复。乐队命名任务中,主流模型围绕“玻璃”“霓虹”等词汇生成名称,导致重复率高达20%,而Flint的提案更显独特。
学术研究印证了这一现象的普遍性。2024年发表的论文《人工蜂群思维》指出,25个不同模型在回答“用隐喻形容时间”时,1250个答案中76%集中在“河流”或“织布者”等表达,而人类受试者则提供了完全不同的比喻。研究团队认为,模型同质化源于训练数据、方法及目标的相似性,形成了一种群体思维效应。
Springboards的解决方案并非从头训练模型,而是基于阿里巴巴开源的Qwen 3进行优化。他们发现,单纯调整“温度”参数无法精准控制创造力——过高会导致回答混乱,过低则缺乏变化。因此,团队重新训练模型,使其仅在关键节点(如目的地名称、品牌选择)增加随机性,而非整体输出。这种“局部创新”策略,使Flint在保持合理性的同时,提供更多意外答案。
广告行业率先感受到这种变化。商业战略顾问Zoe Scaman试用后表示,Flint常将她的思路引向全新方向,尤其在需要突破传统框架时效果显著。例如,在重新设计金融公司的案例中,主流模型聚焦于“年轻化金融教育”,而Flint提出“重新包装财富积累”这一差异化视角。
然而,Flint仍面临稳定性挑战。用户反馈显示,高强度使用时模型可能崩溃,且答案质量参差不齐。营销专家Maximilian Weigl指出,Flint的价值在于提供“思考起点”,而非最终答案。他强调,AI应辅助人类创意,而非替代思考——“直接复制AI输出不是工作,交流与表达才是核心。”
目前,Flint主要服务于广告和营销领域,但Springboards认为,答案同质化是所有聊天机器人用户的共同痛点。他们希望将选择权交还用户,让技术成为激发灵感的工具,而非制造千篇一律的“灰扑扑世界”。




