DC娱乐网

快手悄悄憋了一个大招,国产Sora级视频生成模型——可灵开放内测

这里所有文章均来自微信公众号“火星AIGC”想要看到更多更新的AI前沿信息、AI资讯和AI工具实操,请关注微信公众号“火

这里所有文章均来自

微信公众号“火星AIGC”

想要看到更多更新的AI前沿信息、AI资讯和AI工具实操,请关注微信公众号“火星AIGC”。

这几天全球AI领域的新闻都集中在中国了,一边是几家最新的开源大模型发布,另一边在AI领域默默无闻的快手,突然憋了一个大招,开放其自研的视频生成模型——可灵内测。效果直逼Sora,惊呆业界。

真的万万没想到,快手能在视频生成模型上进行了突破。快手应该只是给一些经济媒体像新浪财经,每日经济新闻等发了通稿,昨天AI领域的人生都没当回事,结果今天一些视频实测效果出来后大家都蒙圈了。圈内人士都吐槽,快手这官宣是干啥呢。

官方Demo最长可以生成两分钟的视频,看起来完全没有AI痕迹。

长达2分钟的视频生成

得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。

大幅度的合理运动

可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。

模拟物理世界特性

基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。

强大的概念组合能力

基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。

电影级的画面生成

基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。

支持自由的输出视频宽高比

可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。

类似AI舞王的玩法

基于自研的3D人脸和人体重建技术,结合背景稳定性和重定向模块,实现表情肢体全驱动技术,仅需一张全身照片,即可体验生动的“唱跳”玩法。

原始图片

今天一早大家就蜂拥申请内测,可能由于申请人数太多,很遗憾截止发稿,我还没得到申请通过的通知。申请内测需要通过官网下载“快影”APP

APP下载地址:

h5.kwaiying.com/officialWebsite

然后在APP页面填写申请问卷,然后等短信通知。

内测只能生成5秒的视频,根据抢到内测资格的实测视频,效果跟官方Demo一样好。

模型官网:

kling.kuaishou.com