业界动态
《AI生成式工具使用》之:AI文本生视频(二战!)
2024-12-23 11:25

目录

《AI生成式工具使用》之:AI文本生视频(二战!)

背景说明及目标

尝试练手

1、豆包AI之图片生成

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

         2)可灵AI文本生视频

总结

关注我,躺不平就一起卷吧


        想在抖音上创建账号,主要用于日常读书分享。抖音流量大,因为是视频平台,所以需要制作视频。因本人从没有过这方面的经验,所以思考是否可以考虑借助外部工具。       

        背景想运营一个抖音的读书账号:斯斯讲书。第一本要分享的书名叫《急救比医生快一步》

        目标做一个预告视频,预告一下,希望能吸引关注。以预告做一个入门练习,熟悉了后面的所有分享就可以用AI生成视频,而我只需要专注于读书分享的文案就可以。

        上一篇“《AI生成式工具使用》之:自助生成视频”完全没摸着AI生成视频或者AI生成图片的边儿,导致生成的“玩意儿”一言难尽。重新做了梳理,决定二战AI文本生视频

        学习中的小总结:AI写作、AI画图、AI生成视频对于非这类工作的人其实还是有门槛的,并不是有了AI工具,所有人都能通过AI工具去替代写文案的、画图的、做视频的。本质上还是需要有工作能力和创作思维。有工作能力+创作思维+AI能提高工作效率,事半功倍。有创作思维+AI可以一定程度上实现跨界。但是很不幸,在写作、画图、视频这块完全门外汉的我,显然是既没有相关的工作能力,又没有创作思维,手上拿个AI也是个棒槌。

        不过一生要强的中国女人,为了省钱,就是得一人身兼多职,AI文本生视频怎么滴都得拿下,也就只能蹒跚学步了。毕竟AI这股潮流,谁都得赶一赶。

        想象中的预告片描述

        远景:拥挤繁忙的早高峰,街头热闹而拥挤。刺耳且紧迫的120急救车的鸣笛声穿透出来,由远及近,再匆匆驶离

        中景:医院的急救大厅,医生护士匆忙的进行着抢救,家属慌乱的呼唤着病人的名字

        近景:逆光的太平间的大门

  • 下载豆包App,可通过抖音绑定注册登录
  • 登陆后进入主界面,选择下方"图片生成"
  • 在图片生成页面,比例选择9:16(手机竖屏显示,点击”+添加特征词“
  • 镜头视角:全景;光线:自然光;风景:城市景观;人像:无,点击"添加"
  • 继续补充输入"拥挤繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车",点击发送按钮,生成图片如下

        (问题:地点没有在中国,生成的人物和地点都是外国,车上的标语都是英语。人都是随便的散在了机动车道。仔细看细节异常奇怪,有人头是反的,缺胳膊少腿儿的。

  • 重新生成,修改特征词如下:“全景、自然光、城市景观、北京繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车,点击发送按钮,生成图片如下

        (问题:依旧是行人在机动车道上乱窜,没有交规。如果不看细节倒也还能接受。

  • 重新生成:“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。比例9:16,生成图片如下

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

       1)即梦AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,随机运镜、慢速、标准模式、3s,生成视频如下

        (问题:生成图片时没有细看,现在图片生视频,图片上的车动起来之后发现了逻辑错误的地方,急救车逆向行驶了

        (问题:车的行驶状态飘忽,总有正在发生车祸的感觉。远处出莫名其妙的飘出来了鬼东西

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

  • 填写文案“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,随机运镜,慢速,3s,9:16,生成视频如下

         (问题:中文乱码,出现了警车。给出的是清晨,画面太暗了。调整文本重新再试一下

  • 调整文案“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶不要出现警车,随机运镜,慢速,3s,9:16,生成视频如下

        (问题:改成上午了,还是没有很亮的感觉。另外!MD!真的吓人,边上出鬼东西了

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

       1)可灵AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,实际上等了近3个小时均未能生成成功。

         2)可灵AI文本生视频

  • 文案输入“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,生成视频如下(忘记选9:16了,但不影响其生成的内容

        (问题:一言难尽,一台晃晃悠悠的老头乐?边上出现的诡异车..

        AI生成视频还是比较适合创意性的、虚拟的、非真实的应用场景。对于写实一点或者细节很多的场景,逻辑问题会很随机的出现,输出的结果不确定性很大!另外,出现中文的地方都是乱码!问题蛮大的。

        像我的实际需求可能更偏向于真实存在的场景,因此对我来说可能更好的选择是选用现成的视频模板进行替换、剪辑。

        另外还有个AI Mate App,可以直接输入文案(可以是故事,然后生成视频。因为没有试用功能,直接就需要充钱使用,风险蛮大的,暂时未测试。

        即梦AI也有类似AI Mate的故事创作功能,但需要充值VIP,暂时未测试。

        依旧没有完成目标,没能按照需求生成想要的视频。但至少验证了,我的需求没办法通过AI完全满足。得学习基础剪辑,或者试试AI剪辑功能。        

    以上就是本篇文章【《AI生成式工具使用》之:AI文本生视频(二战!)】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/4629.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
见证智能新时代!2023中国智能应用发展论坛圆满成功
2023年4月19日,由中国软件行业协会主办,中国软件行业协会智能应用服务分会、国软教育研究院、CSDN承办,清
谷歌发布Chrome浏览器108版本更新 修复8个漏洞
适用于 Mac 和 Linux 的 Chrome:108.0.5359.124适用于 Windows 的 Chrome:108.0.5359.124 或 108.0.5359.125适用于 Mac 的 Chr
如何实现0成本、无门槛的AI头条搬运,轻松日入500+?
在当今数字化与信息化迅速发展的浪潮中,利用人工智能(AI)进行内容创作与搬运已逐渐成为一种崭新的商业模式。许多创业者渴望通
2024GPU品牌排行榜 最新GPU排名分享
中国报告大厅网的最新揭示了GPU行业的品牌影响力。2024年,GPU市场迎来了新的变化,各大品牌在产品质量、技术创新和市场占有率等
揭秘SEO,搜索引擎优化背后的核心工作原理
SEO(搜索引擎优化)主要涉及提升网站在搜索引擎结果页面(SERP)中的排名。它包括优化网站内容、结构、关键词和链接,以提高搜
全网最全vue2技术栈实现AI问答机器人功能(流式与非流式两种接口方法)
补充日志:(我最开始是使用非流式接口实现的,后续业务改造使用流式接口,重点的代码讲解都在下边哈~~)
AI文章生成器揭秘:高效创作秘籍大揭露
本文全面阐释了线上AI文章生成器的九个关键领域,深入解析并详尽解读,带您入门并洞悉这一新兴技术的魅力。 1.什么
《AI生成式工具使用》之:AI文本生视频(二战!)
目录 背景说明及目标 尝试练手 1、豆包AI之图片生成         总结:豆包AI生成的图片,不太能看细节,
NPS内网穿透-P2P连接
NPS的P2P点对点穿透,大文件传输,如在内网架设NAS,流量不经过公网服务器转发目标内网设备(被访问端)与访问端都需要运行npc客
《实战十一人》12月20日内测开启
t2627_2_2627_1:4.0t1-t0:45.0t2-t1:4.0t3-t2:0.0t4-t3:2.0t5-t4:32.0t6-t5:14.0t7-t6:3.0t8-t7:0.0t9-t8:15.0t10-t9:0.0t11-t10