最近cable av 国产,GPT-4o 模子的文生图功能走红收集。依稀同学 Z 在第一时刻也作念了测试,并用国内的新生 AI 模子与 GPT-4o 进行了节略的对比。勾通其他测试者的测试扫尾,同学 Z 发现:
在不同的场景下,GPT-4o 们有着相称亮眼的发达,但离"成精"……
因为只是同学片面尝试体验,不代表各 AI 模子的简直水平,也不代表依稀态度,请同学们落寞判断。
文 / 依稀同学 Z
只需上传像片到 GPT-4o,并输入"调整为 XX 作风的图像",几分钟的时刻,GPT-4o 便能将日常场景霎时转为合适用户盼望的写照图像。
同期,走红的不单是 GPT-4o,从字节旗下的即梦 AI、快手旗下的可灵 AI,到上个月刚刚发布,誉为" AI 图像生成新标杆"的 Reve Image等等,一多数文生图大模子正棋布星陈般出现。
是以,这些器具之间有哪些功能别离?又有哪些果真可觉得我所用?
勾通上手的试验体验,我为民众整理了一些愚弄案例,通过不同模子生成扫尾的对比,匡助民众在不同的愚弄场景里,去解锁图像生成 AI 从初学到进阶的 N 种新姿势。
由于这次我尝试的模子功能相对比较节略,后期民众还思看哪些 AI 模子功能的效用对比,可以在挑剔区留言,我会挑选出比较有代表性的模子来不时作念对比测试。
生成 / 转为 XXX 作风的图像
先拿最火的吉卜力作风来说,用户只需输入"把这个图片转为吉卜力作风",并上传图片,GPT-4o 便可以将一张极具写实作风的像片调整为宫崎骏笔下的颐养系童话。
不管笔触、调色都让东谈主嗅觉来自简直的艺术家之手,这是最近一段时刻里,民众都在跟风尝试的方式。
举例,我浮松选一张善友西宾的像片,发送给 GPT-4o 并条件转为吉卜力作风图像,扫尾高傲:
即梦 AI 生成的效用似乎还可以,再比如我选一张西宾与其他同学家属互动的像片:
GPT-4o 一次生成的完成度照旧相称可以了,相同的内容再分辩由即梦 AI 措置,生成的扫尾如下所示:
举座而言,即梦的措置速率相称快,简直体感在 3-5 秒的时刻内便能生成内容左近的四张图。
如果用户招供某一张的细节,可以再次条件就某一张生成高清的版块,反映速率方面即梦极度有上风。
草榴社区最新地址但也可以清醒发现,即梦对于吉卜力作风的把捏依然不够进修,这粗略与模子能够参考的数据相相干。
即梦 AI 生成的图片更偏向平凡道理上的漫画作风,而非辨识度很高的吉卜力作风,在依据用户领导词的生奏凯率上是打了扣头的。
除了调整图片的作风外,GPT-4o 文生图的才调也相称亮眼,相同以吉卜力作风为例:
(起首:收集)
扫尾很可以,GPT-4o 生成的海边小镇场景是很有代表性的吉卜力作风,颐养系的气味以及色调、纹理、街景,都是宫崎骏系列电影中常见的笔触。
再用调换的领导词来计较即梦 AI:
相对而言,完成度也很可以,但相同的问题再次清晰——
吉卜力的作风特征相对并不充分,与 GPT-4o 比拟效用如故打了扣头的。
再来看进阶一些的玩法,举例上传一张图并给出领导词:"以 XXX 作风重新想象图像并保留扫数细节":
一句话就能切换吉卜力、粘土风、皮克斯 3d 动画风、像素风、漫画风等等,不需要特等的刻画。
相同的内容即梦 AI 也可以终了,大体上的特征如故罢职了领导词的条件,但效用照实不够紧密。
即梦 AI 对于图片作风有一定的把捏,但的确不够——
归并作风生成的不同图片各别度以致比生成不同作风的图片还要大,阐明识别、生成才调与褂讪性都有待种植。
艺术功能愚弄
节略的作风调整功能测试事后,咱们再来看文生图模子最蹙迫的功能之一——
对于艺术创作职责的终了过程。
GPT-4o 作漫画的才调相同亦然民众津津乐谈的地方,咱们拿一段网上的贵府来对比。
举例给出领导词:
制作一个 4 格漫画的图像:
第一格:小老鼠在家里败兴极了,打电话给小牛,小老鼠问小牛"你在作念什么",小牛说"在作念草莓果酱"
第二格:小老鼠又和小老虎打电话,小老鼠问小老虎"你在作念什么",小老虎说"在和弟弟一齐剪纸帽子"
第三格:小老鼠又和小兔子打电话,小老鼠问小兔子"你在作念什么",小兔子说"在作念胡萝卜汤"
第四格:小老鼠又和小羊打电话,小老鼠问小羊"你在作念什么",小兔子说"在青青草原吃草"
输出扫尾高傲:cable av 国产
(领导词及生成图源自收集)
相同的内容咱们交给即梦 AI 来措置:
文本的罢职效用并不太好,对话内容如故比较零乱,但画面作风相较于 GPT-4o 而言更为丰富,且每一张图作风各有不同,在创意的效用上来说是有上风的。
更进一步创作的话可以发现,如果思要更经典的瑕瑜漫画,也只需要给 GPT-4o 追加领导:愚弄瑕瑜日漫作风,即可获取:
即梦 AI 天然也能创作出合适条件的作品,但漫画比较节略,还无法达到雷同东谈主工创作的紧密过程。
除此之外,还有一些特道理的图片效用,举例给老画填充模式:
(图源自收集)
再举例生成一些海报,领导词:创作一张对于不同种类鲸鱼的教会海报,收受明朗的水彩作风。配景设为纯白色。"
左边为 GPT-4o 的输出扫尾,右边为相同领导词的即梦 AI 输出的扫尾:
相对而言,即梦的内容更为丰富一些,但种类不算皆全,但在后续的测试中可以修改领导词不时丰富鲸鱼种类。也即是说,在海报生成一方面上,二者才调基本相称。
GPT-4o 也可以顺利作念剖解图:
(上图为 GPT-4o 生成,图源自收集)
(上图为即梦 AI 创作,领导词:生成一幅蜜蜂的剖解图并用华文注视)
即梦 AI 也可以生成不同形势的剖解图,但标注的笔墨比较零乱,这种情况在好多需要笔墨刻画的图片中平时出现。
除了海报和插图,还有网友发现可以用 GPT-4o 给我方家的屋子生成装修效用图:
这种情况,我也在即梦 AI 中引入了节略的毛坯房图片并进行了愚弄,扫尾如下:
在不加以遗弃的情况下,它对于装修有筹算的生成如故较为可以的,相同的户型不同的作风有了一个看法效用。
而当我相同将条件看成领导词输入后,生奏凯率如下所示,其扫尾如故很令东谈主惊喜的。
装修效用图效用还可以,家装行业的想象师猜测坐不住了。
而坐不住的不单是是家装行业,试验上作念告白图也不需要模特了。
(GPT-4o 勾通昂跑商品图生成的模特展示,注:源自收集)
GPT-4o 在商品模特上身图上,生成的效用还比较好,而在即梦 AI 的体验上就比较倒霉了:
在不同的领导词下,唯有提供了参考图,即梦 AI 生成的效用图中基本如故以参考图的展示为主,而且经测试,AI 的逻辑还无法立体通晓一个物体的相貌,
天然,粗略亦然参考图的权重过重导致。
雷同的问题,还出现时以下对于项链的佩带示图上:
项链的佩带效用目不忍视,照旧出现了清醒诞妄,这少量照实很影响使用体验。
再比如把古东谈主像作转为了了拍摄的像片:
领导词:把这个场景酿成一张像片。用数码单反相机 ( DSLR ) 拍摄。
输入图片并获取反馈:
在这里我还思先容一个新的 AI 模子器具:Reve Create,它对于简直图片的生奏凯率相称可以,比如我但愿它能为我生成杜甫的简直像片,可以获取:
以致于,前几天依稀学园公众号发布了一篇以查理 · 芒格角度解读关税计谋的著述,我也用这个模子生成了一张特朗普和查理芒格交谈的像片,扫尾高傲:
画面传神过程简直观得拍摄完成。
但该器具还无法上传参考图,对于图片的生成十足依赖笔墨刻画,这少量上照实会遗弃其功能的阐扬。
比如,生成一幅菜谱:
(上图来自 GPT-4o,下图来自即梦 AI)
经测试,即梦 AI 离开齐全的领导词,很难顺利生成一份菜谱,生成的均为菜品的效用图。
小结:
这次模子功能的对比主若是由 GPT-4o 和即梦 AI 完成,可灵 AI 在图片转视频的效用上相称出色,但由于相对较久的列队恭候情况不利于生成图片的测试,是以举座测试如故由即梦 AI 完成。
(可灵 AI 图片生成的效用)
需要认果真是,即梦 AI 和可灵 AI 均为创意引发 AI,它们集成了较多的 AI 功能——图文、视频、数字东谈主等。本次测试主要用到的是图文功能,不行代表模子的齐全水平,有需要的同学还要我方上手测试才能看到简直、有针对性的效用。
从测试的扫尾来看,GPT-4o 的图文才调要卓绝国内主流图文 AI,但就功能效用而言,国内对应 AI 基本能够终了下位替代。
现时图文模子间也存在一些通病,比如在一些笔墨内容复杂度较高的图片中,笔墨的展示效用相称不睬思,这少量在 GPT-4o 上也不例外。
下图所生成的长图以及元素周期表都可以看到笔墨效用的问题:
在 GPT-4o 的官方文档中,开发者列举出了一些详备的模子谬误,而这简直亦然扫数图文模子共性的存在:
1、编订:GPT-4o 偶而会诞妄地编订较长的图像(如海报),尤其是围聚底部的部分。
2、捏造信息:与其他文本模子一样,图像生成模子也可以捏造信息,尤其是在凹凸文领导较少时。
3、高勾通问题:当生成图像需要依赖于其常识库时,它可能难以同期准确地呈现 10-20 多个不同的看法,举例齐全的元素周期表。
4、精准绘画:模子可能在绘制触及数据的图表时不准确。
5、多谈话文本渲染:模子偶而难以渲染非拉丁谈话,而况字符可能不准确或产生幻觉,尤其是在更复杂的情况下。
6、编订精度:当条件编订图像生成的特定部分(举例拼写诞妄)时,扫尾并不老是灵验,还可能出现时莫得央求的情况下更正图像的其他部分或引入更多诞妄的情况。另一个诞妄是模子难以保持用户上传的东谈主脸在编订中的一致性,但 OpenAI 瞻望将在一周内开发该诞妄。
7、小文本信息密集:无人不晓,当被条件以极度小的尺寸呈现详备信息时,模子会遭遇繁难。
参考贵府:
1.GPT-4o 引爆全球吉卜力作风生图潮水!附 10+ 玩法与教程
2.Alan 李厂长:《AI 不败兴》第 2 期|GPT-4o 的生图才调,正在颠覆创意产业链的"底层逻辑
3. 新智元:不啻吉卜力!GPT-4o 新玩法全网疯传,网友:AI 成精了
4. https://openai.com/index/introducing-4o-image-generation/
读完同学 Z 的这篇著述后,咱们不难发现,不管是 GPT-4o 的吉卜力童话、即梦 AI 的秒级出图,或是 Reve lmage 近乎简直的场景生成,这场 AI 图像更动早已卓绝了 " 手艺秀场 " 的领域,它正在悄然重构企业与用户之间的创造力范围。
对每一位依稀同学而言,这不仅是器具的迭代,更是一次重新界说创意分娩关系的机遇。
翌日已来,翌日的竞争一定会属于 AI 与东谈主工协同的模式,这少量,依稀的同学需要早特意志,也要尽早布局。
2025 李善友开年大课门票售卖倒计时 6 天:
今天,咱们站在旧期间和新期间的晨昏线上,
迁移互联网的大船已开到了天下极度。
今天,扫数不必 AI 的企业都成了传统企业,
扫数不必 AI 的东谈主都成了传统从业者。
今天,依稀大课呼应 AI 期间逶迤新生,
咱们要跟随万分之一的前锋者,
一齐提前半步,走入 AI 的清晨。
课照旧 10 年,如果说以前我是在迭代,那么本年我可能会重构,因为期间变了,AI 的清晨呼啸而来。
"第一批 iPhone 的使用者,最早在迁移互联网创业奏凯"。莫得东谈主悦目错过 AI,依稀照旧 All in。
本年大课,我思站在 AI 天下的基座上去证明,这三年,咱们亲自探索对于 AI 的一切,AI 和创新将开启一个什么样的斯文。
我思邀请地球上最硬核、最新锐、最有梦思的创造者们,一齐来走入依稀,走出依稀。在期间依稀的转化期,你的一个思法,可能即是翌日斯文的火种。
——李善友 依稀创办东谈主
4 月 25 日 -4 月 26 日,在杭州大会展中心,善友西宾会用 2 天时刻,为依稀同学作念闭门共享。如果你赶巧偶而刻,千万不要错过善友西宾的年度共享,它会匡助你在 AI 期间找寻新的契机和场所。
现场莫得直播,是与善友西宾面临面地流淌。
现时,咱们诚实地邀请你来插足,这场合向翌日的 AI 嘉会。
点击下方购票齐集cable av 国产,可以了解到更多票务信息。