推荐一个开源项目html-video,它能把 HTML 当成视频的中间态:你只要写一句描述,或者贴一篇长文、一个 GitHub 仓库,本地的 Agent(如Claude Code / Cursor / Open Design 等)就会帮你把内容拆成多场景、自动生成带动画的 HTML,再用 Chromium + ffmpeg 在本地渲染成 MP4。
这跟传统“套模板导出视频”还有点儿不太一样:
比如,内容不是装饰在模板上的,而是由 Agent 读原文后,自己决定分几幕、每帧讲啥、关系怎么连接。
同时,模板可商用、免版税,拿来就能用在商业项目里。
你还可以选 AI 配乐 + 旁白混音,可以直接用 ffmpeg 合成到最终视频,不用亲自去剪音频轨道。
最强的一点是,整个流程都可以在本地完成。
从技术侧来看,也很有意思:它在所有渲染引擎上做了一层 meta-layer,统一成
"render(input, ctx)" 接口。
今天如果用 Hyperframes,明天可以换 Remotion / Motion Canvas,你只需要换适配器,Agent 和模板都不用改动。
👉 项目地址:github点com/nexu-io/html-video
该项目支持 Web / Windows / macOS,
"pnpm install" 就能启动,适合想用 AI 规模化做视频内容的团队。