stablediffusion吧 关注:34,335贴子:123,838
  • 14回复贴,共1

Gpt营销太厉害了,实测就文字生成图片来说被谷歌吊打

只看楼主收藏回复

用的词是一位美丽的车模穿着银色短裙,站在车展的展车前摆出一个pose 。图1,2是gpt,第二张要求模特换成全身照,波浪长发。图3,4是谷歌的,第二张要求换成蓝色露背长裙坐在黑色行政轿车的车引擎盖上。gpt效果被谷歌吊着打,而且gpt慢的一笔还是1k小图,谷歌嗖嗖的快,全是2k的大图。。
实测下来,大模型公司还是有些东西,指令遵循和理解明显高于flux,而且谷歌手部几乎不会崩坏,即使是复杂动作拿玻璃杯这样的都几乎完美,估计他们的图像模型参数量肯定远大于flux这样的12b吧


来自iPhone客户端1楼2025-04-24 20:57回复
    豆包也能出差不多效果的图,但gpt强在对画面控制更精细,而且它的图片本身也是上下文的一部分,因此对图片内容的理解更强,对指令的遵从度更高



    IP属地:北京来自Android客户端2楼2025-04-24 21:45
    收起回复
      2025-06-04 00:15:09
      广告
      GPT 的优势是控图,图生图


      IP属地:安徽来自iPhone客户端3楼2025-04-25 00:02
      收起回复
        问题在于都有内容审查,本地部署质量虽然略差,但是随心所欲阿


        IP属地:辽宁4楼2025-04-25 09:07
        收起回复
          个人觉得语言模型生图最大的优势就是能一键修改参数,不然要生成带剧情且内容连续的作品就极为折磨


          IP属地:四川来自Android客户端5楼2025-04-25 12:29
          回复