《AI生成式工具使用》之：AI文本生视频（二战！）

《AI生成式工具使用》之：AI文本生视频（二战！）

2024-12-23 11:25

背景说明及目标

尝试练手

1、豆包AI之图片生成

总结：豆包AI生成的图片，不太能看细节，涉及到中文的基本上不能细看都是类似乱码的东西，有明显的逻辑性问题（比如不符合道路交规）。需要根据生成的结果不断地调整关键词，存在着太多的不确定性。

2、用即梦AI生成图片

总结：相比豆包AI，即梦AI生成的图片没有明显的逻辑性错误，更有氛围感，对于成语和动词更具有理解性，且能表现出来。存在相同的问题：涉及到中文都是乱码，存在细节问题。

3、用可灵AI生成图片

总结：可灵AI生成的图片氛围感不错，相比即梦AI貌似可灵AI没能理解"拥挤"，更多的体现了"清晨"的氛围。存在相同的问题：涉及到中文都是乱码，另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了，还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

1）即梦AI图片生视频

总结：不能看细节，物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

2）即梦AI文本生视频

结论：即梦AI生成视频依旧有中文乱码、细节性问题，逻辑性问题会很随机的出现，也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

1）可灵AI图片生视频

2）可灵AI文本生视频

总结

关注我，躺不平就一起卷吧

想在抖音上创建账号，主要用于日常读书分享。抖音流量大，因为是视频平台，所以需要制作视频。因本人从没有过这方面的经验，所以思考是否可以考虑借助外部工具。

背景：想运营一个抖音的读书账号：斯斯讲书。第一本要分享的书名叫《急救比医生快一步》

目标：做一个预告视频，预告一下，希望能吸引关注。以预告做一个入门练习，熟悉了后面的所有分享就可以用AI生成视频，而我只需要专注于读书分享的文案就可以。

上一篇“《AI生成式工具使用》之：自助生成视频”完全没摸着AI生成视频或者AI生成图片的边儿，导致生成的“玩意儿”一言难尽。重新做了梳理，决定二战AI文本生视频！

学习中的小总结：AI写作、AI画图、AI生成视频对于非这类工作的人其实还是有门槛的，并不是有了AI工具，所有人都能通过AI工具去替代写文案的、画图的、做视频的。本质上还是需要有工作能力和创作思维。有工作能力+创作思维+AI能提高工作效率，事半功倍。有创作思维+AI可以一定程度上实现跨界。但是很不幸，在写作、画图、视频这块完全门外汉的我，显然是既没有相关的工作能力，又没有创作思维，手上拿个AI也是个棒槌。

不过一生要强的中国女人，为了省钱，就是得一人身兼多职，AI文本生视频怎么滴都得拿下，也就只能蹒跚学步了。毕竟AI这股潮流，谁都得赶一赶。

想象中的预告片描述：

远景：拥挤繁忙的早高峰，街头热闹而拥挤。刺耳且紧迫的120急救车的鸣笛声穿透出来，由远及近，再匆匆驶离

中景：医院的急救大厅，医生护士匆忙的进行着抢救，家属慌乱的呼唤着病人的名字

近景：逆光的太平间的大门

下载豆包App，可通过抖音绑定注册登录
登陆后进入主界面，选择下方"图片生成"

在图片生成页面，比例选择9:16（手机竖屏显示），点击”+添加特征词“
镜头视角：全景；光线：自然光；风景：城市景观；人像：无，点击"添加"
继续补充输入"拥挤繁忙的早高峰，街头喧闹拥挤，急速行驶的120急救车"，点击发送按钮，生成图片如下：

（问题：地点没有在中国，生成的人物和地点都是外国，车上的标语都是英语。人都是随便的散在了机动车道。仔细看细节异常奇怪，有人头是反的，缺胳膊少腿儿的。）

重新生成，修改特征词如下：“全景、自然光、城市景观、北京繁忙的早高峰，街头喧闹拥挤，急速行驶的120急救车”，点击发送按钮，生成图片如下：

（问题：依旧是行人在机动车道上乱窜，没有交规。如果不看细节倒也还能接受。）

重新生成：“全景，自然光，清晨，一辆中国的急救车行驶在拥挤的北京街道上。比例9:16”，生成图片如下：

总结：豆包AI生成的图片，不太能看细节，涉及到中文的基本上不能细看都是类似乱码的东西，有明显的逻辑性问题（比如不符合道路交规）。需要根据生成的结果不断地调整关键词，存在着太多的不确定性。

采用与上面相同的内容，“全景，自然光，清晨，一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下：

总结：相比豆包AI，即梦AI生成的图片没有明显的逻辑性错误，更有氛围感，对于成语和动词更具有理解性，且能表现出来。存在相同的问题：涉及到中文都是乱码，存在细节问题。

采用与上面相同的内容，“全景，自然光，清晨，一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下：

总结：可灵AI生成的图片氛围感不错，相比即梦AI貌似可灵AI没能理解"拥挤"，更多的体现了"清晨"的氛围。存在相同的问题：涉及到中文都是乱码，另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了，还是学习的数据来源有偏差。

1）即梦AI图片生视频

用即梦AI图片生视频，选用之前AI生成的图片，填写文案如下“北京繁忙的清晨，一道急促紧急的鸣笛声穿过，一辆急救车在拥挤的道路上行驶”，随机运镜、慢速、标准模式、3s，生成视频如下：

（问题：生成图片时没有细看，现在图片生视频，图片上的车动起来之后发现了逻辑错误的地方，急救车逆向行驶了！！！！）

（问题：车的行驶状态飘忽，总有正在发生车祸的感觉。远处出莫名其妙的飘出来了鬼东西！！！）

总结：不能看细节，物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

2）即梦AI文本生视频

填写文案“北京繁忙的清晨，一道急促紧急的鸣笛声穿过，一辆急救车在拥挤的道路上行驶”，随机运镜，慢速，3s，9:16，生成视频如下：

（问题：中文乱码，出现了警车。给出的是清晨，画面太暗了。调整文本重新再试一下）

调整文案“北京繁忙的上午，一道急促紧急的鸣笛声穿过，一辆急救车在拥挤的道路上行驶，不要出现警车”，随机运镜，慢速，3s，9:16，生成视频如下：

（问题：改成上午了，还是没有很亮的感觉。另外！！！！MD！！！真的吓人，边上出鬼东西了！！！！！）

结论：即梦AI生成视频依旧有中文乱码、细节性问题，逻辑性问题会很随机的出现，也就是不确定性很大。

1）可灵AI图片生视频

用即梦AI图片生视频，选用之前AI生成的图片，填写文案如下“北京繁忙的清晨，一道急促紧急的鸣笛声穿过，一辆急救车在拥挤的道路上行驶”，实际上等了近3个小时均未能生成成功。

2）可灵AI文本生视频

文案输入“北京繁忙的上午，一道急促紧急的鸣笛声穿过，一辆急救车在拥挤的道路上行驶”，生成视频如下（忘记选9:16了，但不影响其生成的内容）：

（问题：一言难尽，一台晃晃悠悠的老头乐？？边上出现的诡异车..）

AI生成视频还是比较适合创意性的、虚拟的、非真实的应用场景。对于写实一点或者细节很多的场景，逻辑问题会很随机的出现，输出的结果不确定性很大！另外，出现中文的地方都是乱码！！！问题蛮大的。

像我的实际需求可能更偏向于真实存在的场景，因此对我来说可能更好的选择是选用现成的视频模板进行替换、剪辑。

另外还有个AI Mate App，可以直接输入文案（可以是故事），然后生成视频。因为没有试用功能，直接就需要充钱使用，风险蛮大的，暂时未测试。

即梦AI也有类似AI Mate的故事创作功能，但需要充值VIP，暂时未测试。

依旧没有完成目标，没能按照需求生成想要的视频。但至少验证了，我的需求没办法通过AI完全满足。得学习基础剪辑，或者试试AI剪辑功能。

以上就是本篇文章【《AI生成式工具使用》之：AI文本生视频（二战！）】的全部内容了，欢迎阅览！文章地址：http://fabua.ksxb.net/news/4629.html
文章相关文章动态同类文章热门文章栏目首页网站地图返回首页海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多