全流程解析！如何让AI从0到1，帮你做一部动画短片？

wuhu专访

先来看支片子。

感觉怎么样？

那如果我现在告诉你：这是由1个人在20小时之内独立完成的，你又会怎么想？

……

短片《遥远地球之歌》由北京大学AI学者陈刘芳制作，从剧本、分镜到画面剪辑，全部使用AI生成技术来完成。

原本可能几周甚至数月的工作量，直接缩短到了20个小时，这不禁让人感叹AI的强大。

事实上，从年初爆火的ChatGPT，到每次迭代都会刷新人们认知的Midjourney，网络上早已出现了大批的AIGC作品，这似乎证明着曾独属于人类的创造力大门已经被AI叩响。

人类能否驯化AI？

AI是解放人类双手，还是取代人类？

AI飞速发展的未来是怎样的？

我们到底应该用什么样的态度，去对待它？

......

曾有大量的影视作品试图描绘一个那样的未来，而其中的情景似乎也正在现实中上演。

AI，真的是人类的敌人吗？

本期【动画教练】导师陈刘芳借这支短片对此进行了大胆的尝试，她也许能够回答这些问题。

wuhu专访421期

童年的哆啦A梦

为她埋下了研究AI的种子

2021年，陈刘芳因为工作需要，开始探索能够批量创作内容的新方法。

她当时找到了两个大方向，其一是通过编辑不同的角色表情、动作、服装等进行排列组合生成，其二就是人工智能方法，如扩散模型或VQGAN实现自动生成，这是通过CLIP引导扩散模型生成的AI版《飞鸟集》。

出于对AI的兴趣，当时陈刘芳选择了人工智能艺术作为硕士毕业论文的主要研究方向。

“我本身就对艺术与科技的结合，对人工智能很感兴趣，特别喜欢一本叫《数字生命》的小说，小时候也会梦想拥有自己的哆啦A梦，这些都为我后续学习和研究AI埋下了种子。”

与此同时，国际上一些优质AI作品的出现，也让陈刘芳更加确信人工智能在艺术领域存在巨大的潜力。

让她印象深刻的一部片子，是Runway首届人工智能电影节上的《Generation》。这部作品以真人舞蹈视频为基础，利用了Disco Diffusion完成了图像生成。

“我记得当时第一次看到它的时候，真的被它带来的视觉力量震撼到了，非常惊艳。它展示了人工智能在为动画创作提供崭新的思路和技术上的可能，相信未来人工智能在动画创作领域还有很大的潜力可以继续挖掘。”

AI制片该如何落地？

正式着手准备《遥远地球之歌》，是从8月初开始的。陈刘芳已经不是第一次制作AI全流程动画，基于过去的制片经验，她总结出了以下几个难点：

难点一：建立高效的AI制片流程

前文中提及的20个小时制片时间，包括了从分镜到画面生成、镜头生成和剪辑的时间，但不包含前期准备工作。如果问及资料搜集环节，那就要追溯到更远的时间点。

而以AI为核心制片，也意味着此次项目中没有“前期设计”与“后期渲染”等环节，普通制片流程并不适用。

难点二：使AI输出结果更加可控

AI作为本次的创作核心，其实是最不可控的部分。事实上，如果没有经过针对性的海量训练，目前的AI还无法给出可控的回答。

而海量训练意味着前期的大量人力物力投入，例如全流程人工筛选过滤，这也是颇为耗时的一环。

难点三：AI如何制作高质量动画

虽然目前有些AI已经具备视频制作能力，但镜头语言相对单调。若想要高质量输出，则大多限于提供现成模板的情况下。

想要从0到1去制作原创动画，每个镜头的节奏、绘画风格、表现形式等还必须通过真人导演的把控。

为了更深入地了解AIGC制片流程，我们邀请到了陈刘芳本人为大家拆解《遥远地球之歌》的制作流程。

上百个问题+604张图像+196个视频

=2分钟动画

首先来看一下《遥远地球之歌》的完整制片流程。

STEP1：资料搜集+AI脚本化

由于《遥远地球之歌》原著是科幻作家克拉克的短篇小说，陈刘芳提前整理好了原著的各个发表版本。

对于脚本创作阶段用到的语言类AI，她选择了Claude。

具体流程是：根据原著快速梳理世界观、人物和关键情节→索引故事中的独特元素→分解场景→整理分镜头

这阶段的主要问题在于，语言类AI无法100%对接上创作者的思路，而它的一些描述也并不具有视频表现力。

因此陈刘芳总结了几个沟通的技巧，在这里分享给大家：

设定AI的角色身份，比如导演、编剧、Prompt工程师等，让它明确自己的定位和目标。

提供明确的、有针对性的创作要求，简明扼要。

引导对话的方向，根据需求进行调整，必要提供案例让它进行学习。

最重要的是，作为导演，你需要保证清晰认知自己的创作想法，并且发挥主导人的审美把控作用。

“成功与语言类AI合作的关键在于，我们要非常清楚自己的创作目标和流程，对AI的输出进行持续引导和反馈优化，这样才能获得高质量的结果，发挥AI的最大价值。”

Step2：AI图像生成

在这里，陈刘芳首先利用Claude生成了较为详尽的文本描述，然后再进行提取和筛选，作为视觉关键词。

需要注意的是，这个步骤中人为筛选和提炼是非常必要的环节，大概占了前期工作时间的20%左右，因为过于冗长的描述只会让图像类AI更加难以抓住核心需求。

而对于图形类AI，陈刘芳则选用了Midjourney。

其实市面上利用Midjourney生成的AIGC作品不少，除却部分专业作品，好像AI制图的门槛也不是很高，只要会上网、有一定英文水平，哪怕零画画基础也能生成好看的图像。

但如果想要正式用于商业项目制作中，达到预期效果，那就需要大量Prompt测试，来精准定义你想要的风格了。

提一个问题：让你做一部科幻短片的话，你要怎么和AI描述它？

如实地说：Generate sci-fi type pictures（生成科幻类型画面）？

这或许能生成还不错的图像，但类似的空泛描述是绝对不能出现在商业项目里的。

以下是陈刘芳用到的Prompt模板：

_____,expansive and intimate visual storytelling,epic sci-fi vision,Kodak Vision3 500T --ar 21:9 --style raw --v 5.2

模板每个部分含义如下：

expansive and intimate visual storytelling:宏大而细腻的视觉叙事风

epic sci-fi vision:科幻视觉风格

style of Interstellar movie cinematography:模拟电影《星际穿越》的摄影风格

Kodak Vision3 500T:模拟柯达Vision3 500T电影胶片的色调和质感

--ar 21:9:生成接近电影画面宽高比的图像

--style raw:原生风格,减少Midjourney默认处理的影响

--v 5.2:使用5.2版本的Midjourney模型

在此过程中，陈刘芳在《遥远地球之歌》中一共生成了604张图像，通过不断调整提示词+人工筛选，来进一步靠近想象中的效果。

Midjourney生成的部分画面

可以看出，与图形类AI的对话仍是个相对耗时的过程，并且人类仍然占据着创作中的主导地位。

“我认为AIGC制片中，人类的审美能力和讲故事能力是最重要的。现在的AIGC工具确实很方便，但要真正发挥其价值，人类创作者的主导作用是不可或缺的。在应用中积累相关的审美和讲故事经验，才能更好地驾驭这项新技术。”

Step3：视频生成

陈刘芳选择在Runway中完成视频的生成，目前它提供给用户三种方式生成视频，分别是:

Gen1-通过视频生成视频

Gen2-通过文字/图像引导生成视频

FI-基于连续图像生成插帧视频

《遥远地球之歌》是基于Gen2来完成的。

简单地说，就是拖入在Midjourney生成的图像，每10张-20张画面做一次可用镜头的筛选，最后批量导出。

但说起来容易做起来难。

一个难点是对于镜头运动参数的控制。陈刘芳告诉我们，现在runway已经推出了导演模式，可以通过参数来控制镜头移动的方向、速度等，有导演、分镜相关经验的朋友可以更好地驾驭它。

另一个难点是角色的连贯性。目前比较靠谱的方法，就是ControlNet搭配Ip adapter，通过一张图片引导生成一个角色的多角度、多场景的变化等等。动画人可以关注的类似方法还有Roop，styledrop等等。

“我们在使用AI进行创作时，可控性和工作流长期都是大家的关注的点。但随着技术的成熟，我们半年之前苦恼的许多问题，比如视频生成，画面抖动等，这些都在被逐渐攻克。”

Step4：剪辑后期

基于前期Claude生成的分镜，陈刘芳使用了DaVinci来进行剪辑。

DaVinci Resolve 剪辑>调色>AE后期>加字幕>输出

但由于前期图像生成阶段，并没有对Midjourney的色彩倾向进行严格限制，所以要额外进行调色处理。

之后就是传统流程上的声画同步、调整镜头速度和运动方向等等操作，最后通过AE制作了一组特效字。

至此，《遥远地球之歌》的制作已经完成。

那么我们来算一笔账。

陈刘芳老师在制作过程中，使用的是免费版Claude，但如果频繁使用的话，专业版费用是一个月20美元。

Midjourney目前有3个等级的订阅费用，陈刘芳选择了1个月30美元的付费标准。

Runaway上，每1000积分能生成200秒的视频，《遥远地球之歌》用了700积分左右，大概是7美元。

按照现在的汇率，也就是416.19元。

从这个角度上看，对比传统流程，AIGC制片还是具备一定优势的。尤其是对于很多想讲故事的朋友们来说，可以帮助我们快速把想法视觉化。并且也许随着相关技术的成熟，未来画面质量得到提升的同时，成本也会越来越低。

AI真的是高性价比的代名词么？

其实看完整个制作流程，我们可以很直观地感觉到与AI沟通的过程还是非常繁琐，并且存在不可控性质的。

以目前的水平来看，离“AI解放人类双手”仍然有着很长一段距离。

而加入商业工作流就更难了，想高效且保质保量完成需求，前期的大量准备工作与人工筛选也是一个问题。

所以我们与陈刘芳本人进行了讨论。

Q1 就目前的AI水平而言，它能否在商业项目中保持高质量、高性价比的优势呢？

我最近也做了几个商业广告项目的尝试，确实不同品牌和项目的需求千差万别。有的客户希望看到非常新颖、有想象力的效果，这时我们要发挥AI的特长，但同时要充分揣摩品牌调性，及时沟通确保客户满意。

另一类客户对品牌广告的要求更为具体和严格，这时我们需要拿其他技术手段来辅助，在AI生成的基础上进行后期调整，提高图片的可控性和质量，才能达到客户的标准要求。当某个技术路线并不适合实现目标时，要及时做沟通和调整。

要在商业项目中发挥AI的优势，我们既要能够驾驭好各类AI工具，又要掌握后期处理等相关技能。更关键的是要根据项目类型灵活选用合适的技术路线。在整个流程中跟客户多沟通也很重要。

我认为未来AI要真正落地商业应用，需要克服的挑战还有很多。我们要善于通过人机合作的创作模式，发挥协同的价值，这是也是大势所趋。

Q2 提到AI就无法避开一个尖锐的话题，那就是AI是否会取代人类艺术家。您怎么看？

我个人来看，目前AI还比较难完全取代人类艺术家，因为人类艺术家注重的是从自己的经验和灵感出发，发挥想象力和创造力，作品充满艺术性。当前AI