AI生图都卷成麻花了,Google新玩具Whisk凭啥又火了?

B站影视 2024-12-29 05:27 2

摘要:想必你也经历过:感觉天天都在被各种AI生图工具刷屏,仿佛一夜之间,人人都能轻松P出梵高的星空,画出赛博朋克的猫咪。但面对各种大同小异的功能,写到头秃的提示词,最后却总觉得差了那么点意思...

麻木尔 霍元甲 发自 AI星舰指挥中心


各位又酷又潮的读者朋友们,还在为AI生图工具的千篇一律而头疼吗?


想必你也经历过:感觉天天都在被各种AI生图工具刷屏,仿佛一夜之间,人人都能轻松P出梵高的星空,画出赛博朋克的猫咪。但面对各种大同小异的功能,写到头秃的提示词,最后却总觉得差了那么点意思...

但等等!Google刚刚甩出了一个超带感的新玩具——Whisk,这个叫Whisk的神器,用起来简直是太野了!

它不走寻常路,完全抛弃了传统AI工具繁琐的提示词,而是玩起了“图片调教”的新花样。


想让你的自拍秒变二次元美少年/美少女?想让你家猫主子变身Q萌贴纸?只需要简单两步:甩图片,选风格,Duang!你的大片就诞生了!

没错,就是这么简单粗暴!连见过大风大浪的资深玩家都忍不住直呼:"这也太香了吧!"

好奇这个不走寻常路的Whisk到底有多神奇?跟着小星一起来探秘吧!

告别“祖传”提示词,三张图就能解锁AI创作新玩法

当其他AI生图工具还在苦苦钻研“提示词艺术”时,Whisk却给出了一个惊人的解决方案——“少废话,直接上图!”

它的玩法简单粗暴:上传三张图片,分别代表“主题(subject)、场景(scene)和风格(style)。

然后,Duang!一张融合了三者精髓的全新图片就诞生了。


来看个具体例子:想让一个老人出现在藤蔓缠绕的场景里,还要带着90年代复古动漫feel?

简单!上传三张对应的图,再加上一句简单提示"角色骑着飞行自行车",瞬间就能获得一张充满吉卜力风味的神仙作品。

你看,还是那个熟悉的老人,但骑上了自行车,背景也充满了复古动漫的韵味,简直妙不可言。

Whisk这玩法,简直是懒人福音。不用再绞尽脑汁想提示词,直接把灵感“拍”给它看就行。

比如“鲁路修+粉色花海+玩偶风”的组合,就能让叛逆的鲁路修在粉色花海中萌到冒泡。

更贴心的是,如果你懒得上传图片,Whisk还内置“随机骰子”功能,帮选择困难症的你随机组合主题、场景和风格。

而且,Whisk自带的预设风格也相当丰富,什么徽章、贴纸、刺绣、黏土、美漫、马赛克拼贴…各种潮流元素应有尽有。



不用填满所有空,玩的就是一个“意想不到”

Whisk最有趣的地方在于,它不是强制你提供所有三张图片。

你可以只上传主题和场景,让Whisk自己发挥想象力填充风格;或者只上传主题和风格,让Whisk来构建场景。

这种“留白”的设计,反而能激发更多的创意与可能性,每次生成都像在拆盲盒,充满惊喜。

不信你看这些有趣的尝试:

主题:锁定 -《将国》的玛法姆特与天鹰伊斯卡达尔

场景:锁定 - 城堡网球场

风格:Whisk自由发挥


可以看到玛法姆特与伊斯卡达尔准确地出现在了每种风格中,满分!

主题:锁定 - 《骑士&魔法》的艾尔

场景:Whisk自由发挥

风格:锁定 - 白边贴纸



可以看到艾尔、黑板、机器人,白边贴纸风格等元素都有很好地被体现,唯一美中不足的是把艾尔错认成了女孩子,不过可能也跟原图人物形象比较中性化有关,瑕不掩瑜。


是不是感觉脑洞大开?Whisk就像一个神奇的画布,任你自由挥洒创意!

不仅支持多人同框,还能“凭空创造”素材

Whisk还藏着一个超强大的功能,它的主题图片支持多张上传。这意味着你可以轻松实现“多人同框”的愿望啦。

比如,让鲁路修、玛法姆特、艾尔一起变成可爱的珐琅徽章,想想都觉得有趣!

当然,如果你对生成的细节有更高要求,Whisk也支持手动添加提示词。

比如在徽章生成时加上:"角色们都举着一块告示牌,上面写着:AIStarship"

结果简直完美:所有角色都乖乖举起了牌子!

更厉害的是,Whisk还能“凭空创造”素材,如果你缺少某个场景或风格的参考图,可以直接用提示词让Whisk帮你临场发挥一个。

比如,想要一个校园风的背景?一句提示词搞定!再搭配你想要的主题和风格,一张独一无二的创意图片就诞生了。

Whisk的“小心机”:它其实是个“翻译官”

折腾了半天,大家可能也发现了,Whisk生成的东西,并不能完美保留原图的造型和风格。

答案其实很有趣。让我们打开Whisk的文件库,看看我们刚刚生成的这张“校园男孩们”的图片。

在这张图片的详情页面上,你会看到Whisk生成这样的描述:

三位动漫风格的年轻人,每个人都有着独特的特征和服装,站在阳光明媚的校园足球场上,背景是学校建筑和充气圆顶。

阳光明媚的校园里三位动漫风格的年轻人的详细图片。第一位年轻人有着齐肩的深色头发、浅紫色的眼睛、白皙的皮肤,身穿带有金色装饰的深色领夹克;他用手托着下巴,另一只胳膊交叉,脸上带着一丝笑意。第二位年轻人有着齐肩的金发、浅肤色、蓝眼睛,戴着一顶红白相间的头巾式帽子,上面点缀着绿色和金色的宝石;他穿着一件带有金色细节的深红棕色衣服。第三位年轻人有着灰紫色的短发、浅肤色、明亮的蓝眼睛,表情坚定;他们穿着蓝绿色和灰色的衣服,领子很高,戴着护臂,一只拳头紧握。他们位于一个大型人造草坪足球场上,球场周围有白色线条,周围环绕着多层校舍,包括一栋浅色的主楼,有许多窗户,右侧是一个巨大的白色充气圆顶室内体育设施。远处可以看到更高的住宅楼,天空是清澈明亮的蓝色。风格是受动漫启发的,线条简洁,阴影柔和。

是不是很神奇? 但这串文字,其实并不是在描述这张图片,恰恰相反,我们的图片正是根据这段文字描述生成的!

当你上传图片时,Whisk实际在做这些事:

首先用Gemini模型“看”你的图片把看到的内容转换成超详细的文字描述再用这段描述让Imagen3模型重新创作图片

这就是为什么你能在每张生成图片的详情页看到文字描述,甚至可以修改它们!

本质上,Whisk就像一个既懂画画又懂你的AI伙伴:用Gemini理解你的想法,用Imagen3把想法变成艺术。

还在等什么?快来一起“Whisk”一下!

总而言之,Google这次的Whisk,真真儿的是把AI生图玩出了新高度!它不追求像素级的完美复刻,而是更注重创意的自由挥洒。

正如它的slogan所说:“prompt less, play more.” 这才是AI工具该有的样子嘛。

而且,目前Whisk还是免费的哦, 快去体验一下它的魔力吧。




来源:AIStarship

相关推荐