独立开发者分享:用闲置 GPU 做了个 AI UGC 视频生成工具(含简单技术细节)

最近折腾了一个 AI 生成 UGC 视频 的小工具。 目标很简单:输入一句话 / 一段语音 / 一张图片,就能生成类似 TikTok 、小红书那种“真人出镜讲解”的短视频。 工具地址 👉 https://aivideomaker.ai/ai-ugc 下面简单分享下实际效果和技术实现。 🎬 实际使用效果(简短说明)

30 秒内视频效果最好:口型、表情、动作都比较自然

语音驱动效果最真实:根据语速、情绪自动带动作

英文比中文更稳定(特别是口型同步)

最长支持 3 分钟:需要跑一小时,小细节的一致性还需要继续优化

🧩 简单技术细节(轻量版)

基于 Wan2.2 做的,感谢阿里

⚡ 性能表现(单卡 RTX 6000 Pro )

30 秒视频:8 分钟生成

60 秒视频:15 分钟

3 分钟视频:一个小时,暂时禁用了,等做完多卡并行优化再打开

🧪 为什么做这个? 身边做电商、跑广告的朋友经常说: “写脚本很快,但拍视频太慢了。” 于是就试着用闲置 GPU ,把“拍视频”这件事自动化一下。 如果你对 AI 视频生成、数字人、口型同步、长视频渲染这类方向感兴趣,也欢迎讨论。我还在持续优化中 🙌 👉 https://aivideomaker.ai/ai-ugc