LTX-2 炸场了!全球首个音画同步 4K 视频生成模型,ComfyUI 已支持

LTX-2是Lightricks发布的全球首个音画同步4K视频生成模型,可生成20秒、50fps高清视频,支持文本/图像...

小龙
2025年11月1日

OmniAvatar:让静态照片活起来的AI数字人技术突破

OmniAvatar是浙江大学和阿里巴巴集团联合开发的音频驱动数字人系统,能够根据静态照片、音频及文本提示生成自然流畅的...

小龙
2025年7月6日

百度MuseSteamer深度解析:国产AI视频生成的新里程碑

百度商业研发团队推出的多模态生成大模型MuseSteamer,在VBench图生视频评测中取得全球第一,在中文音视频同步...

小龙
2025年7月5日

Veo 3深度解析:谷歌AI视频生成的里程碑突破

2025年5月,谷歌推出Veo 3,首次实现AI音画同步生成,使AI视频角色能“开口说话”。该模型突破包括4K画面、物理...

小龙
2025年5月26日