视频模型争霸战:揭秘你的首选 No.1
各位老铁们,大家好,今天由我来为大家分享。。模型争霸战:揭秘你的首选 No.1,以及的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!
这么多的AI。。模型,在让人眼花缭乱的同时,也带来了一个疑问:谁才是AI。。模型的No.1?
乌鸦君也非常好奇各款产品表现优劣。刚好上周三Runaway宣布Gen-3 Alpha向所有用户开放测试,借着这个契机,乌鸦君就把市面上开放的AI。。模型都拉过来测一测。
参与此次测试的选手有7位,涵盖了AI。。领域的国内外名将、新星,其。。外的包括Gen-3 Alpha、Dream Machine、Genmo、Pika 1.0,国内AI。。的。。则是爱诗科技的PixVerse、快手的可灵和字节跳动的即梦。
结合测试结果和个人体感,乌鸦君得到以下三个结论:
1.可灵的综合体验最好,信息准确度高、。。时长和质量稳定性上都有着不错的表现,偶有瑕疵。
2.即梦、PixVerse、Gen-3 Alpha和Dream Machine四家普遍在人物一致性和物理逻辑上会有问题,继续迭代一下,未来可期。
3. Genmo和Pika1.0则受限于发布时间较早,在语义理解能力、画面平滑度、运动一致性等方面明显落后于其他竞品,足见AI。。迭代速度之快。
/ 01 / 三组Prompt,6个测评维度
测评会使用同一个Prompt,对不同AI。。模型生成的结果进行评判。考虑到AI。。模型的表现可能会有波动,乌鸦君给出以下三组文生。。提示词,综合评判表现效果。
考题1:我用《爱乐之城》的经典画面为基准,设定一个Prompt:Under the night sky, a girl in the yellow skirt are dancing with a man.(在夜空下,一位穿着黄色裙子的女人在和一个男人跳舞。)
考点:对Prompt中提到的“夜空”“黄色裙子”“跳舞”等元素进行生成,描绘出双人跳舞的画面,对人物动作的协调性有一定要求。
考题2:我用Sora公布的一条。。提示词:Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes. (在熙熙攘攘的东京,白雪皑皑。镜头跟随几个人穿过城市街道,他们正享受美丽的下雪天,并在附近的摊位购物,绚丽的樱花伴随着雪花随风飘扬。)
考点:描绘镜头、人物和街道商贩的动态,并保持着雪花和樱花一同飘落的效果。
考题3:我改写了一条Sora公布的电影预告片风格提示词:A movie trailer featuring the adventures of the 20 year old space man wearing a transparent fish tank, blue sky, desert, cinematic style, shot on 35mm film, vivid colors. (影片讲述了20岁太空人的冒险经历,他戴着透明的鱼缸,背后是蓝天、沙漠,电影风格,35毫米胶片拍摄,色彩鲜艳。)
考点:消化电影预告片的风格,细腻描画人物,还原蓝天、沙漠等场景,也考验AI对于科幻故事的想象力。
测试方法
评判的维度包括六个层面,分别是语义理解、图像质量、物理逻辑、一致性、风格创意、易用性。每个层面根据。。表现来评分,总分6分。
1、【语义理解】。。结果和Prompt的描述是否一致,一致得1分。
2、【图像质量】图像质量的考量包括清晰度、分辨率、色彩准确性和动态范围,表现较佳得1分。
3、【物理逻辑】。。内容符合基本的物理常识,得1分。
4、【一致性】保持物体和场景的一致性和连续性,得1分。
5、【风格创意】画面有风格或创意,得1分。
6、【易用性】产品体验友好,得1分。
以下评测基于我个人主观判断,结果仅供参考,有不同看法欢迎讨论。
/ 02 / 测评结果和简单分析
1、Gen-3 Alpha,综合得分:4分
和上一代Gen-2相比,Gen-3 Alpha面对复杂指令的敏感度更高,能够处理更复杂的场景。
从。。画面来看,Gen-3 Alpha整体控制得很好,具备很高的保真度,能够生成逼真的人类角色和动态场景。
画面准确展示了双人舞动的动态、东京街头纷飞的雪景,质感很接近。。效果,在画面纹理、镜头视角控制等方面的表现也很突出。
在风格和创意上,Gen-3 Alpha明显超越其他AI。。,风格堪称大片级。
值得注意的是,Gen-3 Alpha在物理逻辑上存在瑕疵,比如,第1题中的人物在跳舞时手部动作相对失真;同时,女人在跳舞转身后,脑袋上出现了男人的脸,bug明显。
易用性方面, Gen-3 Alpha可以进行细节控制,支持多种。。生成和控制工具。现在Runaway已将Gen-3 Alpha开放给所有C端用户,月费会员15美元,每月只能生成约60秒的。。,相当于4s。。就要消耗1美元。
2、 Dream Machine,综合得分:4分
Dream Machine是Luma AI在6月中旬发布的产品,目前只能生成5秒的。。,且生成的过程很漫长,但这不妨碍网友排队用这个免费AI来二创梗图的热情。
从。。画面上看,除了第一个。。没有展示夜空外,Dream Machine的表现基本与Prompt的描述相符,勉强可以算合格,人物一致性也没有问题。
图像质量整体控制的不错,Dream Machine在后两个。。也展示了其专业的拍摄角度,镜头模拟几乎达到电影级水准。
美中不足的是,Dream Machine在物理逻辑上表现很差。无论是第一个。。里毫无美感的舞蹈,还是第三个。。里怪异的走路姿势,都说明Dream Machine当下很难理解物理逻辑,甚至连简单动作的动态输出都有问题。
在使用便利性上,用户只需前往官网点击“Try Now”按钮,按要求登录谷歌账号,然后在提示栏中输入文字或图片,静静等待即可。如果用户一时半会想不到提示词,还可以在系统预先准备的六条中进行选择,十分好操作。
3、 Genmo,综合得分:2分
作为去年11月发布的一款免费AI。。工具,Genmo的表现就相对逊色许多。
先说语义理解,就基本不合格。在第一个。。里,画面显示的是夕阳西下,日照金山,并不符合指令中“夜空下”的要求。而在第二个。。里,Genmo也完全没有呈现Prompt里的“白雪皑皑”和“下雪天”,反而把环境变成了粉色的樱花。
在物理逻辑和一致性上,Genmo同样表现不佳。这一点在其作答第1题时体现得很清晰,画面开始女生的长头发出现在男生的头上,跳舞过程中,双方的手在运动过程中也出现了多次瞬移。
要说优点,Genmo在图像质量上的表现勉强合格,在第1题中做了比较多的光影渲染。易用方面,Genmo也做到了保姆级别,提供了直观清晰的界面,不仅可以调整。。片段的持续长度、平滑度、变化程度等,还可以模拟相机运动,比如进行画面放大/缩小、顺/逆时针旋转、平移、倾斜等操作,简化了。。生成过程。
4、 Pika1.0,综合得分:1分
说真的,乌鸦君对这款明星产品此次的表现非常失望。
首先,Pika很难理解复杂的指令。比如,Pika在第3题直接给我个大鱼缸,甚至连“太空人”、“沙漠”等元素都不见了。同时,现在Pika只能生成3秒的。。,是参评工具生成的。。中最短的。
在画面质量上,无论是东京雪景还是双人舞蹈,纹理较差,Pika的画面都简陋得像动画建模的初学作品。
另外,Pika在物理逻辑和一致性上也同样存在问题,例如第1题中的人物动作模糊、肢体粘连,人物的脸部没有细节,甚至右侧的男生在跳舞时就干脆一动不动,像个木头人。
Pika唯一的优势在于,创作相对方便,单次文生成。。的过程大约消耗30s,算是比较快的。用户可以选择。。尺寸和帧率,并对镜头的运动方向和物体的运动速度进行控制。今年3月,Pika还上线了无缝生成音效的Sound Effects功能,提高了工具便捷性。
5、 PixVerse,综合得分:4分
由字节前视觉技术负责人王长虎创立的爱诗科技,在今年1月推出了PixVerse。到今年3月,PixVerse的月访问量超百万。PixVerse基本能够准确理解Prompt的意思,并给出相应的画面。
从。。质量上来看,PixVerse始终表现得很稳定,画面整体和谐,也不乏亮点。比如,作答第3题时,PixVerse生成的。。出现大多数AI。。里没有的运动镜头,而背景画面依旧保持着较高的质量。
另外,PixVerse也很擅长对人物面部细节的刻画,第3题的。。中,太空人拥有“紧皱的眉头”和“思索的神情”,看起来十分灵动。
不足的地方在于,PixVerse几乎没有任何人物动作的画面。在第1题中,除了手部轻微的动作外,根本看不到任何舞蹈的动作,而且女人似乎也只有一只腿。而且,在第2题中,PixVerse生成。。的行人走路动作也相对模糊,说明其在物理逻辑存在问题。
易用性方面,PixVerse的“Upscale”功能,让用户不用花钱,就能提高。。分辨率。用户也可以浏览热门作品,查看它们的详细参数信息,包括关键词、。。、画面的纵横比、运动幅度、风格以及原始图片,学习和模仿优秀作品。
6、可灵,综合得分:5分
快手推出的可灵大模型采用了与Sora相似的技术路线。从。。画面来看,可灵的表现非常稳定,能准确完成指令,整段30秒。。没有出现太大的偏差,只是遗漏了第2题中的“飘雪”指令。
可灵的画面质量超出了我的预期。它对树木、星空、雪景等自然景观模拟得很到位,还在第2题中努力做出人脸等细节,看得出可灵是想做出接近实拍的效果,它的一致性也没什么问题。在风格和创意方面,与其他AI中较夸张的动漫、电影艺术风格相比,可灵的实拍风格算是独树一帜。
但是,可灵在理解物理世界方面仍然存在一些小瑕疵。例如,第1题中的女孩在跳舞抬腿动作时,出现了模糊和瞬移,不过相比其他模型,可灵在物理理解上的表现得算是优秀了。
7、即梦,综合得分:4分
即梦是抖音前CEO张楠亲自挂帅的剪映所推出的产品,它在时长上比别的AI要高一截,单次可以生成12秒。。,是这次参评工具中最长的。
即梦基本能准确识别Prompt中的关键词;画面质量,比较细腻。
例如,第2题中的东京街景描画得非常优美。在风格创意方面,即梦也能做到让人眼前一亮的效果,比如在第3题中,即梦对透明鱼缸头盔、宇航服的描画很有科幻色彩。
与很多AI。。模型一样,对物理世界的理解是即梦的短板,完成运动幅度较大的。。时,即梦会出现较为明显的崩坏,例如作答第1题时的表现。从一致性上来看,即梦也存在问题,比如第2题的东京街头,不少人在转身之后都出现了另一张脸。
在易用性方面,即梦。。支持各种变焦、摇镜等运镜控制,还有更多的尺寸选择,操作上也很简单,非常适合爱玩。。的抖友们。
/ 03 / 最终的测试结果:
高分组:可灵
中分组:即梦、PixVerse、Gen-3 Alpha、Dream Machine
低分组:Genmo、Pika1.0
用户评论
我一直在关注这项技术发展,感觉最近进步真是飞快啊!Stable Diffusion那个开源的太厉害了,用起来也方便,很多大神直接把它用来制作特效动画,简直绝了!
有13位网友表示赞同!
。。生成这块确实是大混战啊,各种平台、公司都推出了自己的模型。每个都有各自的特点,比如有些注重真实度,有些更注重艺术感。我还没找到最适合自己的No.1呢。
有7位网友表示赞同!
说实话,我对这个标题有点无语,哪个是No.1?这东西没有绝对的标准啊!每个人对视觉效果、生成速度、适用场景都有不同的需求吧?况且技术的更新迭代太快了,今天 No.1 明天就可能被超越。
有8位网友表示赞同!
这个AI。。模型,感觉就是未来的趋势啊!想象一下,以后我们可以自己用手机就能简单地制作出高质量的。。片段,简直太酷炫了!
有14位网友表示赞同!
我还是更喜欢传统的拍摄方式,虽然AI。。生成技术越来越厉害,但我觉得还是缺乏一些真实感和情感传达。。。本质上还是记录生活,真实的情感才是最打动人的吧。
有16位网友表示赞同!
最近在用一个叫 Dream by WOMBO 的模型制作。。还挺有意思的!它可以根据你的文字描述直接生成。。,玩法挺多样化的,你可以试着自己输入一些你脑海中 bizarre 的场景看看效果哈哈
有19位网友表示赞同!
我看过很多AI生成的短片,技术确实厉害了,可就是感觉有些缺乏灵魂啊,还是需要人来注入情感和创意才能真正打动人心。
有14位网友表示赞同!
"AI。。模型大混战" 确实可以这么形容!不同公司推出的模型都有自己的优势和不足,玩家们可以选择不同的工具,自己去探索和创作吧。
有14位网友表示赞同!
这技术发展真是太令人兴奋了!我一直在看一些AI。。生成Demo,未来想想各种应用场景简直让人脑洞大开:游戏研发、教育教学、新闻报道等等,都可以被革新!
有6位网友表示赞同!
我觉得这个AI。。模型对。。行业的影响还是比较大的,很多重复性的工作都可能被取代了,比如简单的画面特写。 但是也给我带来了新的挑战和机会,需要我们不断学习和进步才能跟上时代的脚步。
有7位网友表示赞同!
我还是更喜欢用传统的方式拍摄。。,我覺得AI生成的。。总是缺少点什么…也许是人自身的温暖和活力吧?哈哈
有17位网友表示赞同!
我也一直在关注这个领域的进展。从最初的粗糙图像生成到现在的精致。。,科技进步真是令人惊叹!未来我期待看到更多更逼真的AI。。作品,可以让人们在虚拟世界中体验到更生动的感官震撼。
有15位网友表示赞同!
虽然这些AI。。模型很厉害,但我觉得他们缺乏真正的“思考”和“情感”。最终还是人才是创作的灵魂吧?
有7位网友表示赞同!
我感觉每个AI。。模型都有自己独特的风格和特点,像Some models are good at generating realistic scenes, while others excel at creating artistic and imaginative visuals. It really depends on what you're looking for!
有15位网友表示赞同!
我觉得这“AI。。模型大混战”是件好事。推动技术的创新发展,让更多人参与到这个领域,最终能让 AI 技术更加成熟、完善。
有16位网友表示赞同!
我对这个领域未来发展的趋势感到非常好奇!或许有一天我们可以用AI轻松制作出媲美电影级的。。作品,这不禁令人欣喜若狂!
有9位网友表示赞同!
希望以后越来越多的AI。。模型都能开源发布,让大家都能有机会尝试和探索。 这会促进技术的发展,也会让更多人能够享受科技带来的便利。
有8位网友表示赞同!