近日,国内AI领域迎来了一项重大突破,阶跃星辰公司在其官方公众号上正式揭晓了其倾力打造的Step-1o千亿参数端到端语音大模型。这一创新成果被誉为国内首个达到千亿参数级别的端到端语音模型,标志着我国在语音技术领域迈出了坚实的一步。
传统语音模型往往采用级联处理方案,这一过程中,用户的语音信息首先需要被转化为文本,然后再经过二次处理转化为语音输出。这种处理方式不仅效率低下,而且在信息转换过程中容易丢失包括情感在内的诸多关键信息,从而导致模型反应迟钝、回答质量欠佳、智能水平有限以及情感表达刻板等问题。相比之下,Step-1o所采用的端到端语音方案则实现了语音理解和生成的一体化,极大地提升了模型的智商和情商。
Step-1o支持混合形式的输入和输出,无论是语音还是文本,都能轻松应对。其快速反应和随时打断的特性,使得用户体验更加流畅。更重要的是,Step-1o能够深度理解和模仿各种声音特征,包括音色、韵律、方言以及个性化的口语表达习惯等,为用户带来更加自然和真实的交互体验。
除了具备出色的理解和模仿能力外,Step-1o还通过自学和模仿不断提升回复质量。它既能提供解决问题的专业建议,也能作为高情绪价值的陪伴者,满足用户多样化的需求。Step-1o还继承了阶跃星辰语言大模型的创作能力,进一步丰富了其应用场景和可能性。
据阶跃星辰透露,Step-1o即将接入跃问App端,为用户提供实时语音通话服务。这一举措无疑将进一步提升跃问App的用户体验,同时也为Step-1o的应用推广打开了新的窗口。