发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

FramePack新技术:6GB显存轻松驾驭60秒AI视频生成

2025-04-20来源:ITBEAR编辑:瑞雪

近日,一项名为framePack的创新技术横空出世,为AI视频生成领域带来了革命性的突破。这项技术由GitHub的Lvmin Zhang与斯坦福大学的Maneesh Agrawala携手打造,成功实现了视频扩散模型的实用化,极大地提升了处理效率,使得在较低硬件配置下生成高质量长视频成为可能。

framePack是一种全新的神经网络架构,其核心优势在于采用了多阶段优化技术,有效降低了AI视频生成任务对硬件的需求。通过利用固定长度的时域上下文,framePack能够显著减少GPU的显存开销,使得在仅6GB显存的情况下,也能生成长达60秒的视频片段。这一突破性的成果得益于framePack独特的帧压缩技术,它能够对帧进行智能压缩,并汇集到固定大小的上下文长度内,从而确保了高效的显存利用。

传统的视频扩散模型在生成视频时,需要处理大量的先前生成的带噪帧数据,以预测下一个噪声更少的帧。这一过程中,所参考的输入帧数量会随着视频长度的增加而增长,导致显存需求极高。而framePack则通过其创新的架构,成功解决了这一问题。它不仅能够降低显存消耗,还能在不显著牺牲保真度的情况下,支持生成更长的视频内容。

framePack还结合了缓解“漂移”现象的技术。这一技术能够解决视频质量随长度增加而下降的问题,确保生成的视频内容始终保持高质量。在硬件兼容性方面,framePack明确要求使用支持FP16和BF16数据格式的英伟达RTX 30、40或50系列GPU。对于其他品牌的硬件以及更早的英伟达显卡,目前尚未得到验证。但考虑到6GB显存的需求,市面上大多数现代RTX显卡都能满足运行要求。

在性能方面,framePack同样表现出色。以RTX 4090为例,在启用teacache优化后,生成速度可达每秒约0.6帧。虽然实际速度会因显卡型号的不同而有所差异,但framePack在生成过程中会逐帧显示画面,提供即时的视觉反馈,这一特性极大地提升了用户体验。

值得注意的是,framePack所使用的模型目前可能有30帧/秒的上限,这或许会限制部分用户的需求。然而,对于大多数普通消费者而言,framePack的出现无疑为他们进行AI视频创作提供了极大的便利。它不仅为专业内容创作者提供了一种替代昂贵第三方云服务的可行方案,还为非专业用户制作GIF动图、表情包等娱乐内容提供了有趣的工具。

随着framePack技术的不断发展和完善,相信未来会有更多的用户能够享受到AI视频生成带来的乐趣和便利。这一技术的出现,无疑为AI视频生成领域注入了新的活力和希望。

“祖冲之三号”同款芯片赋能!我国超导量子计算机“天衍-287”搭建完成并开放服务
据了解,该量子计算系统具备“量子计算优越性”能Q力,处理特定问题的速度比目前最快的超级计算机快4.5亿倍,未来将接入“天衍”量子计算云平台并首次面向全球开放应用服务,这也将是我国首个具备“量子计算优越性”的量…

2025-11-14

水库增殖放流站物联网升级:实时监测,远程管控,开启智慧渔业新模式
通过接入溶解氧传感器、水温传感器、水质监测仪、自动投料机、自动增氧机、循环水设备PLC、摄像头等多种设备,物通博联智能数采网关能够实时采集各个鱼池的水质、溶解氧、水温以及投料、增氧、循环水等设备状态,通过5…

2025-11-14

水浸传感器RS-SJ:4G蓝牙双助力,高效守护防积水安全
当检测到水浸情况时,相关信息会通过4G网络快速传输至指定的管理平台或用户终端,无需人工现场查看,让用户在第一时间知晓积水隐患,为及时采取排水、设备转移等应对措施争取时间,避免积水造成更大损失。 水浸传感器凭借…

2025-11-14

上海电信“双万兆”护航进博会:数智赋能通信保障,服务跨越语言距离
浦东机场T1电信营业厅及T2一站式服务中心电信柜台是进博会观众和外宾抵沪的“入境第一站”, 两处服务点均开设“进博专席”,为参展人员和往来旅客提供中英双语咨询、交通指引与爱心便民服务。未来,上海电信将持续夯…

2025-11-13

照片压缩至5M内超全指南!七大实用方法助你轻松搞定分享难题
具体的执行步骤是:将它们直接开启,随后去挑选照片,该应用会自动给出推荐的压缩级别,你能去预览最终结果,还能够对某些设置予以调整,比如把分辨率调低或者转换格式,借此令文件大小小于5MB,这对即时分享至社交媒体来…

2025-11-12

山海星耀攻克超低轨难题,以硬核技术逐梦空天新蓝海
天虎科技了解到,虽然当前市场上有一些针对超低轨的吸气式推进器,但从气体收集率、推进效率、测试工作环境等维度上,山海星耀的电推进器均具备一定优势。 蔡东升表示,目前该产品是商业航天公司首次实现了“高真空运行环…

2025-11-12

万卡AI集群:算力变革下数据中心建设逻辑、系统瓶颈与交付模式之变
它迫使数据中心的建设逻辑从“基建思维”转向“IT思维”;它将系统瓶颈从“算力”引向了“网络”;它也将交付模式从“工程项目”推向了“产品制造”。 当一个万卡集群被点亮时,它不再是一个被动容纳IT设备的“机房”…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12

Viwoods发布AiPaper Reader电纸书:6.13英寸墨水屏搭载AI阅读互动功能
IT之家 11 月 11 日消息,据科技媒体 NoteBook Check 今天报道,Viwoods 现已推出 AiPaper Reader电纸书,运行 Android 16 操作系统,机身配备专用 AI …

2025-11-12