目录
背景说明及目标
尝试练手
1、豆包AI之图片生成
总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。
2、用即梦AI生成图片
总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。
3、用可灵AI生成图片
总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。
4、用即梦AI尝试图片生视频和文案生视频
1)即梦AI图片生视频
总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。
2)即梦AI文本生视频
结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。
5、用可灵AI尝试图片生视频和文案生视频
1)可灵AI图片生视频
2)可灵AI文本生视频
总结
关注我,躺不平就一起卷吧
想在抖音上创建账号,主要用于日常读书分享。抖音流量大,因为是视频平台,所以需要制作视频。因本人从没有过这方面的经验,所以思考是否可以考虑借助外部工具。
背景:想运营一个抖音的读书账号:斯斯讲书。第一本要分享的书名叫《急救比医生快一步》
目标:做一个预告视频,预告一下,希望能吸引关注。以预告做一个入门练习,熟悉了后面的所有分享就可以用AI生成视频,而我只需要专注于读书分享的文案就可以。
上一篇“《AI生成式工具使用》之:自助生成视频”完全没摸着AI生成视频或者AI生成图片的边儿,导致生成的“玩意儿”一言难尽。重新做了梳理,决定二战AI文本生视频!
学习中的小总结:AI写作、AI画图、AI生成视频对于非这类工作的人其实还是有门槛的,并不是有了AI工具,所有人都能通过AI工具去替代写文案的、画图的、做视频的。本质上还是需要有工作能力和创作思维。有工作能力+创作思维+AI能提高工作效率,事半功倍。有创作思维+AI可以一定程度上实现跨界。但是很不幸,在写作、画图、视频这块完全门外汉的我,显然是既没有相关的工作能力,又没有创作思维,手上拿个AI也是个棒槌。
不过一生要强的中国女人,为了省钱,就是得一人身兼多职,AI文本生视频怎么滴都得拿下,也就只能蹒跚学步了。毕竟AI这股潮流,谁都得赶一赶。
想象中的预告片描述:
远景:拥挤繁忙的早高峰,街头热闹而拥挤。刺耳且紧迫的120急救车的鸣笛声穿透出来,由远及近,再匆匆驶离
中景:医院的急救大厅,医生护士匆忙的进行着抢救,家属慌乱的呼唤着病人的名字
近景:逆光的太平间的大门
- 下载豆包App,可通过抖音绑定注册登录
- 登陆后进入主界面,选择下方"图片生成"
- 在图片生成页面,比例选择9:16(手机竖屏显示),点击”+添加特征词“
- 镜头视角:全景;光线:自然光;风景:城市景观;人像:无,点击"添加"
- 继续补充输入"拥挤繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车",点击发送按钮,生成图片如下:
(问题:地点没有在中国,生成的人物和地点都是外国,车上的标语都是英语。人都是随便的散在了机动车道。仔细看细节异常奇怪,有人头是反的,缺胳膊少腿儿的。)
- 重新生成,修改特征词如下:“全景、自然光、城市景观、北京繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车”,点击发送按钮,生成图片如下:
(问题:依旧是行人在机动车道上乱窜,没有交规。如果不看细节倒也还能接受。)
- 重新生成:“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。比例9:16”,生成图片如下:
总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。
- 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:
总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。
- 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:
总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。
1)即梦AI图片生视频
- 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜、慢速、标准模式、3s,生成视频如下:
(问题:生成图片时没有细看,现在图片生视频,图片上的车动起来之后发现了逻辑错误的地方,急救车逆向行驶了!!!!)
(问题:车的行驶状态飘忽,总有正在发生车祸的感觉。远处出莫名其妙的飘出来了鬼东西!!!)
总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。
2)即梦AI文本生视频
- 填写文案“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜,慢速,3s,9:16,生成视频如下:
(问题:中文乱码,出现了警车。给出的是清晨,画面太暗了。调整文本重新再试一下)
- 调整文案“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,不要出现警车”,随机运镜,慢速,3s,9:16,生成视频如下:
(问题:改成上午了,还是没有很亮的感觉。另外!!!!MD!!!真的吓人,边上出鬼东西了!!!!!)
结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。
1)可灵AI图片生视频
- 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,实际上等了近3个小时均未能生成成功。
2)可灵AI文本生视频
- 文案输入“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,生成视频如下(忘记选9:16了,但不影响其生成的内容):
(问题:一言难尽,一台晃晃悠悠的老头乐??边上出现的诡异车..)
AI生成视频还是比较适合创意性的、虚拟的、非真实的应用场景。对于写实一点或者细节很多的场景,逻辑问题会很随机的出现,输出的结果不确定性很大!另外,出现中文的地方都是乱码!!!问题蛮大的。
像我的实际需求可能更偏向于真实存在的场景,因此对我来说可能更好的选择是选用现成的视频模板进行替换、剪辑。
另外还有个AI Mate App,可以直接输入文案(可以是故事),然后生成视频。因为没有试用功能,直接就需要充钱使用,风险蛮大的,暂时未测试。
即梦AI也有类似AI Mate的故事创作功能,但需要充值VIP,暂时未测试。
依旧没有完成目标,没能按照需求生成想要的视频。但至少验证了,我的需求没办法通过AI完全满足。得学习基础剪辑,或者试试AI剪辑功能。