发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

OpenAI Sora视频生成器上线:最高1080p,20秒时长,AI创作新时代来临?

2024-12-10来源:ITBEAR编辑:瑞雪

OpenAI近期推出了其视频生成服务的两个新订阅层级——ChatGPT Plus和ChatGPT Pro,为用户提供了将文本转化为视频的新方式。

ChatGPT Plus订阅允许用户生成最多50个优先视频,这些视频的分辨率最高可达720p,时长限制为5秒。这些视频生成服务需要消耗1,000个积分。相比之下,ChatGPT Pro订阅则更为高端,每月收费200美元,提供无限生成功能,并可将视频数量提升至最多500个,分辨率也提高到了1080p,时长则增加到了20秒。

对于追求更高品质的创作者,ChatGPT Pro还提供了额外的优势,如允许下载无水印的视频,并同时支持最多五次生成操作。这些高级功能为专业视频创作者提供了更多的灵活性和创作空间。

OpenAI在2月份首次发布了其文本转视频AI模型Sora。在最近的直播中,OpenAI展示了Sora的新探索页面,页面上展示了由其他社区成员利用AI生成的视频。OpenAI重点介绍了两个新功能:故事板功能,可以根据一系列提示生成视频;以及将照片转换为视频的功能。OpenAI还演示了一个混音工具,允许用户通过文本提示调整Sora的输出,并展示了如何使用AI将两个场景混合在一起。

值得注意的是,所有通过Sora生成的视频都会带有可见的水印和C2PA元数据,以表明它们是AI制作的。在上传图像或视频到Sora之前,用户需要同意一项协议,确保上传内容不包含18岁以下人士、露骨或暴力内容以及受版权保护的材料。滥用媒体上传可能会导致帐户被禁止或暂停。

OpenAI研究副总裁Aditya Ramesh在直播中表示,OpenAI面临着巨大的压力,需要在阻止非法活动与促进创造性表达之间找到平衡。他承认,这将是一个持续的挑战,OpenAI可能无法在第一天就做到完美,因此他们希望用户能提供反馈以改进审核系统。

OpenAI首席执行官Sam Altman在直播声明中强调了视频在文化中的重要性,并表示不希望世界只有文字。尽管Sora目前已在美国和许多国家/地区推出,但Altman透露,在欧洲大部分地区和英国的推出可能还需要一段时间。

就在Sora发布一周前,一群自称参与OpenAI alpha测试计划的艺术家泄露了该产品,以抗议OpenAI将他们的劳动成果用于无偿研发和公关。这一事件为Sora的发布增添了一些波折。

在竞争方面,ChatGPT的制造商OpenAI希望通过Sora与meta和谷歌等公司的视频生成AI工具展开竞争。谷歌在1月宣布推出Lumiere,而其他初创公司如Stability AI也推出了类似的AI工具,如Stable Video Diffusion。亚马逊也发布了Create with Alexa,这是一种专门生成基于提示的儿童短动画内容的模型。

YouTuber Marques Brownlee在其频道发布的视频中透露了Sora的消息,并抢先体验了这一新工具。据Brownlee介绍,Sora的主页滚动展示了最近生成并由OpenAI策划的Sora视频。用户可以将视频收藏到已保存选项卡中,以便以后查看,还可以组织到文件夹中,并查看制作视频时使用的文本提示。

Brownlee表示,Sora可以根据上传的图片和提示生成视频,并允许用户编辑现有的Sora制作的视频。使用重新混合功能,用户可以描述他们希望在视频中看到的更改,Sora会尝试将这些更改合并到新生成的剪辑中。重新混合功能还提供了一个“强度”设置,让用户指定他们希望Sora对目标视频进行多大程度的更改。

然而,Brownlee也指出了Sora存在的一些问题,如与物体永久性相关的问题,以及在涉及长时间行走的人和动物时出现的腿部问题。尽管有这些缺陷,Sora仍然为视频创作者提供了一个新的创作工具,并有可能成为生成式人工智能的下一个前沿。

随着聊天机器人和图像生成器逐渐进入消费者和商业领域,视频生成可能会成为下一个重要的生成式人工智能应用。然而,这也带来了严重的虚假信息问题。据机器学习公司Clarity的数据显示,人工智能生成的深度伪造视频数量同比增长了900%。因此,OpenAI在推广其视频生成服务的同时,也需要加强审核和监管,以防止非法活动和虚假信息的传播。

OpenAI将多模态性(即文本、图像和视频生成的结合)作为其提供更广泛的AI模型套件的一个突出目标。随着Sora的推出,OpenAI正朝着这一目标迈进,为用户提供更多样化的AI服务。