【发现者网】9月26日消息,音乐流媒体巨头Spotify正式宣布,他们正在积极测试一项全新的人工智能功能,名为“声音翻译(Voice Translation)”。该功能引起了广泛的关注,因为它具有革命性的潜力,可以将播客节目拓展到全球范围,消除语言障碍,使得不同语言的听众都能够轻松地享受内容。
Spotify表示,这一功能的开发得益于他们与OpenAI的合作,利用OpenAI的自动语音识别(ASR)系统Whisper。该系统使用先进的语音转文本生成AI模型来将音频文件转化为文本,并通过语音复制模型来保持原始说话者的风格和声音特点。这意味着,即使是在不同语言中,播客主播的声音和个性都可以被保留下来,确保内容的连贯性和质量。
据发现者网了解,首批加入这一新功能的主持人包括戴克斯・夏普德、莫妮卡・帕德曼、莱克斯・弗里德曼、比尔・西蒙斯和史蒂文・巴特利特。不过,目前仅提供西班牙语翻译版本,而且并非每一集都会立即提供多语言版本。然而,Spotify承诺在未来的几天和几周内将推出更多剧集,并计划提供法语和德语翻译,以满足不同地区和语言的用户需求。
这一举措被认为将为全球播客产业带来革命性的变革,拓宽了播客的受众范围,同时也为语言交流和文化传播提供了全新的机会。不过,随之而来的技术和隐私问题也备受关注,因此Spotify需要确保数据的安全性和合规性,以维护用户的信任。声音翻译功能的推出,预示着音频内容的未来将更加多元化和全球化。