发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

微软新探索:音生图AI,实时视觉化会议演讲场景?

2024-10-15来源:ITBEAR编辑:瑞雪

近日,科技媒体MSPoweruser发布报道,透露微软公司新获一项创新专利,该专利描述了一种基于用户实时语音输入来生成图片的技术。

据悉,这项专利文件长达20页,微软于2023年4月5日提交申请,并于10月10日获得批准。根据专利的详细描述,该系统能够在会议或讲座等场合实时捕捉音频内容,随后利用语言模型对这些音频进行总结,并据此生成相应的AI图像。

该专利所描述的工作流程分为三个主要步骤:首先是捕捉音频,即用户通过麦克风发言,系统实时记录并将其转化为文本;其次是处理文本,系统将文本分段记录,并对每段内容通过语言模型进行总结;最后是生成图像,系统根据总结生成的提示,创建AI生成的图像,并在屏幕上实时显示。

预计这一功能将主要应用于Microsoft Teams平台。随着演讲者话题的变化,实时生成的图像也会随之更新,从而为用户带来更加丰富的视觉沟通体验。微软表示,这种图像的使用有助于澄清概念,尤其适合那些需要通过视觉辅助来学习的用户。

小米汽车新专利曝光!底盘灯带隐藏设计,能防刮擦?
10月15日消息,小米汽车科技有限公司今日公布了一项“车辆底盘发光系统及其控制方法和车辆”发明专利。本公开的目的是提供一种车辆底盘发光系统及其控制方法和车辆,该车辆底盘发光系统能够减小灯带受到刮擦的风…

2024-10-15

2024年7-8月,中国插电混动汽车全球市场占比高达83%!
10月15日消息,据乘联分会最新数据,2023年世界汽车销量8,901万辆,其中新能源汽车销量1,429万辆,燃油车销量总比占比相对下降。2024年1-8月份世界汽车销量达到5,824万辆,新能源汽车…

2024-10-15

一加13月底发布,配置大升级,性价比能否再创新高?
在设计方面,一加13预计将延续其一贯的家族式圆形模组设计,并进行一体化升级,使手机外观更加简约。 除此之外,一加13还将配备一块6000毫安时的大容量电池,并支持100瓦有线充电和50瓦无线快充以及磁吸无线…

2024-10-15