摘要:现如今,AI这两个字母开始频繁的出现在我们的日常生活或各行各业中,随着AI行业的蓬勃发展,AI的能力、使用场景也与日俱增,AI大模型已经可以从简单的文生图进化到复杂的视频生成,相信大家在各种新闻或自媒体视频中经常看到或听到“AI视频生成”的相关内容,甚至会有利
现如今,AI这两个字母开始频繁的出现在我们的日常生活或各行各业中,随着AI行业的蓬勃发展,AI的能力、使用场景也与日俱增,AI大模型已经可以从简单的文生图进化到复杂的视频生成,相信大家在各种新闻或自媒体视频中经常看到或听到“AI视频生成”的相关内容,甚至会有利用AI制作短片并在自媒体开展副业的说法,那么,AI到底能不能生成短片?究竟该如何利用AI制作出来一个简单的AI短片?AI视频是否能够成为一项副业?带着这份好奇我用了一周的时间进行了探索,从0开始完成了一个AI短片的制作,并最大限度进行了流程的简化,我会用我的实际制作流程来进行说明,AI小白朋友们也绝对都可以上手。
需要说明的是,由于我本人也是能力有限的,无法与AI大神们相提并论,这个教程属于比较初级的,所制作出来的短片效果并没有多么完美,但绝对是可行、可实施、可复制的!
一、制作前提及大致步骤
在整个AI短片的制作过程中,各个环节都尽量选择免费、不花钱的AI工具,保证低成本输出成片。
在制作短片的开始,我们肯定是需要确定一个剧本和脚本的,这完全取决于您个人想制作一个什么样的视频,抑或者是您如果想做一个自媒体账号,您的自媒体账号主题是什么,确定好主题后使用AI帮助我们生成一个视频脚本。
这里我使用到的AI工具为AI对话类工具“豆包”,也有很多类似的工具如:智谱清言、文心一眼、讯飞星火等,大家可以根据自己的喜好进行选择或者都试用一下,目前主流的AI对话类工具基本都可以很好的完成这个工作,并且基本都是免费的。
比如,我想做一些儿童寓言故事的动画短视频,使用AI对话工具把我们的需求打给它:
生成第一版本的脚本之后,肯定会有些不足或不满意的地方,我们可以继续对话,让AI帮助我们修改,比如这里AI生成了一个主题为“坚持就能成功”的故事,讲述了一个小蜗牛不畏艰险最终登上一颗大树,但在脚本中我发现最好有一些小蜗牛爬树时遇到挫折的情节,AI起先加入了小蜗牛在爬树过程中被小鸟干扰的情节,不过我们还要考虑后续视频生成时的难度,小鸟啄蜗牛导致其险些掉落的画面对于AI来说过于困难,所以我让AI继续修改,最后再优化掉其他一个难以实现或不太合理的画面/桥段,基本上5~10分钟,脚本就确认完毕了。
由于AI生成视频的能力有限+我们没有很强的能力去调校AI大模型或使用非常复杂的AI工具来生成素材,所以我们脚本中的剧情除了要合乎逻辑之外,一定要考虑的是画面简单、出现的人物少一些,另外还需要注意的是,一般AI视频生成的的片段为4~8秒(大多就是4秒、5秒)左右,所以还需要大致把控一下每一幕画面的时间。
简单总结一下,这部分就是用AI工具生成一个剧本+让脚本简单化+合乎基本逻辑。
2、生成人物形象、背景
AI文生图工具:豆包、即梦
AI视频生成非常重要的一点就是画面的一致性,所以我们断不能拿着生成好的脚本直接扔给AI生成视频,为了保证画面的一致性我们至少要固定好脚本中每一个角色的形象与背景。
我们将此前生成好的脚本上传给豆包,让豆包AI帮助我们生成其中角色的形象,包括长相、体型等,如果主角不是动物,则还需要考虑头发、穿搭等。
生成好人物形象的文字版本后,我们生成人物形象的图片,可以将这些表述全部复制粘贴到文生图的AI工具中当作关键词,这里我是用到的文生图AI工具为豆包与即梦两款,目前有非常多的AI文生图工具,比如可灵AI、阿贝智能、通义万相等等,由于这些工具大多是限量免费使用,所以大家可以灵活使用这些软件进行图片生成,我就是由于即梦每天送的66个积分使用完后,继续使用豆包进行图片生成。
接下来就要将文字版的人物形象输入到AI生图工具中了,在生成图片时还需要注意三点问题:
第一是生成人物形象时我们就要开始统一图片生成的绘画风格,例如我这里给出的风格是“儿童动画风格”,您可以根据您想要的风格给出关键词,或现在AI生图工具都有预设的绘画风格可供选择;
第二是人物生成时最好生成两视图(人物的正面/侧面各一张)或三视图(人物的正面/侧面/背面各一张),可以更确保在后续生成视频时不容易出现人物前后不一致的问题。
第三是对于我们这些初级选手来讲,所使用的AI工具较为简单,生成出来的图片质量极其不稳定,所以需要多次生成+微调关键词,这又叫“抽卡”,说白了就是生成多张图片之后选一张合适的使用。
我们这个剧本中总共只出现了两个人物,小蜗牛与小白兔,最终经过多次微调关键词+抽卡,我们生成出来了还算满意、没啥大槽点的两个形象的三视图,我们再将三视图中的每个视角单独截取出来。
然后是背景的生成,与人物形象的生成流程基本一致,将脚本上传至豆包后,让豆包帮助我们生成和总结一下每一幕场景的文字背景描述,然后将这些文字描述当作关键词让AI来生成背景图片,这里还是要注意统一绘图风格,经过很多次的生成+调整关键词+抽卡后,最终我筛选出了一些可用的背景(展示的为一部分图片。实际在后续的视频生成时,有一些场景是可以重复使用同一张背景图片的)。
3、生成视频
接下来就是最重要的一步,视频生成了。
该部分使用到的AI工具为
AI视频生成类工具:Vidu
目前,国内好用的视频生成类的AI工具感觉上并不如文生图工具那么多,这里推荐可灵AI、Vidu,我这次用的是Vidu。
选择的模式是参考图生成视频,根据视频脚本将每一幕出现的角色和背景上传,Vidu的参考图生成视频最多可同是允许3张参考图,也很符合我们这个脚本的需要,因为我们只有两个角色,再加一张背景图,刚好三张图,上传的人物形象图优先侧视图为好。
在关键词方面,AI视频生成感觉会更加不稳定,所以就需要更多次的抽卡,在抽卡时根据生成内容对关键词进行微调,根据我这次生成视频的经过来看:
(1)、有些时候关键词给的详细一些反而不如简单一些来的效果更好,比如如下所示,只简单的给了“谁”、“在哪”、“干什么”的描述反而要比“长篇大论”生成出来的内容更好。
(2)、需要根据情况固定一些“常识”的关键词,比如我们都知道蜗牛相对于大树来讲是非常小的,但是AI并不能“自动”理解这点,所以我几乎在每一次生成视频时都需要加入一段关键词:“一定要凸显出小蜗牛和大树之间极大的大小反差”,否则就会出现蜗牛和树一样大的情况。
(3)、有很多情况下背景图片可以在多个场景下重复利用,Vidu可以对参考图进行框选,AI可以着重在框选区域进行视频制作与生成,需要灵活运用这个特点。
(4)、这是我唯一花钱了的地方,购买了Vidu每月800积分的会员,59元。Vido每月免费赠送80积分,生成一条4秒的视频片段需要4个积分,再将合适的视频片段进行高清化生成还需要4分,所以80积分完全撑不起来我这条共几十秒的短视频的抽卡,最终共花费250~300积分左右,完成了共11条视频片段。
4、配音生成
该部分使用到的AI工具为
AI配音类工具:刺鸟配音
目前AI配音工具非常多且大多为免费,例如讯飞智作、腾讯智影、悦音配音、琅琅配音,我这次用的刺鸟配音就是随便找的一款。
制作过程就是将脚本中的配音复制到AI工具之中,这次我们脚本中的配音非常简单,大部分都是旁白,还有小蜗牛和小白兔的一两句话,AI配音工具中都会有一些不同性别、年龄和音色可供选择,找一个合适的即可,我最终找到了一个略有亲和力的女声作为旁白声音,两个儿童的声音作为小蜗牛和小白兔的配音。
生成好后,下载导出即可。
这里需要注意的是由于我们每一个视频片段仅有4秒,所以我们需要将每一段配音尽量简洁一些,也可以加速语速。
5、剪辑
该部分使用到的软件为
剪辑软件:剪映
这步就不是AI来操作了,而是常规的剪辑,将视频片段与配音导入至剪辑软件中,再进行简单的排列音画匹配即可,如果可以加入合适的音乐,成片效果会更好。
在视频剪辑时我们很有可能会出现配音时间超出所相对应视频片段的问题,因为前面也已经提到了,用Vidu的参考图生视频最多只能每条视频片段4秒钟,解决这个问题共有两种比较简单的方法,一是在合理范围内加快配音的语速,二是加入我们之前生成的静态背景图片或视频片段的循坏播放来填充画面,这些就需要大家来视情况灵活分配了。
三、总结
至此,一个全权由AI人工智能生成的视频就制作完毕了。
回归到开头提出的两个问题,AI能生成视频短片吗?答案是肯定的,AI已经具备了让普通人生成一个短片的能力,但是,AI在生成视频时存在着局限性,AI不能完全按照我们设想的画面进行生成,并且在生成视频的整个流程中我也花费了一定的金钱,不是完全免费的。不过要强调的是,对于我这种不会建模、不会一切有关动画制作的人来讲,如果没有AI,我不可能制作出一个哪怕粗糙到极致的视频短片的。
第二个问题是能否利用AI视频开展自媒体副业,这是可能的,首先它需要一定的投入,第二是相比于制作的流程与成片的质量,视频更需要的是一个人民群众喜闻乐见的主题,所以如果想进行玩票性质的副业,那我认为是可行的。
以上就是本篇文章的所有内容了,希望能够帮助您入门AI视频创作。
最后,文章中的这则视频正片正在进行最后一个步骤的制作中,近期将上线,敬请期待。
来源:太平洋电脑网