摘要:建立角色后在同一对话中复用。第一次提示:"一个奇幻插画风格的小精灵,戴着发光蘑菇帽",第二次直接说:"让同样的精灵骑着蜗牛穿过花田"。
Google 官方也出nano banana的使用指南了。
在此之前介绍过:
Google发布"Nano Banana"图像生成模型,号称全球第一
复制就能用!Google新图像模型nano banana的100种玩法
这款模型核心能力主要体现在下面五个方面:
角色一致性:同一个角色在不同场景中能保持外观特征不变。以前你画个人物,换个背景就可能长得完全不一样了。
精确局部编辑:可以用自然语言对图片特定区域进行修改,比如"把沙发改成蓝色",不会动到其他地方。
概念融合:把完全不相干的元素合成一张图,比如太空人在雨林篮球场扣篮。
风格迁移:保持主体不变,完全改变艺术风格。一张摩托车照片可以瞬间变成建筑制图风格。
逻辑推理:AI 能理解物理规律和因果关系,比如你让它画个人端蛋糕,再让它画这人摔倒后会怎样。
简单的一两句话也能出图,但想要精确控制效果,最好包含这六个部分:
主体:描述具体,别说"一个机器人",要说"一个表情严肃的机器人咖啡师,有蓝色发光的眼睛"。
构图:镜头怎么拍的,特写、广角、俯视角度这些。
动作:在做什么,"正在煮咖啡"比"站着"要有用得多。
场景:在哪里,"火星上的未来咖啡厅"比"咖啡厅"信息量大。
风格:3D动画、电影胶片感、水彩画、写实摄影等等。
编辑指令:改现有图片时要直接具体,"把领带改成绿色","移除背景中的汽车"。
建立角色后在同一对话中复用。第一次提示:"一个奇幻插画风格的小精灵,戴着发光蘑菇帽",第二次直接说:"让同样的精灵骑着蜗牛穿过花田"。
A side-by-side fantasy illustration shows a small pixie-like creature with a mushroom cap hat. On the left, it floats in a dark, misty forest. On the right, it rides a smiling snail through a sunlit field of wildflowers.
2. 精确编辑
先生成一张现代简约客厅图片,然后逐步修改:"把灰色沙发改成深蓝色","在茶几上加三本书"。每次修改都很精准,不会影响其他部分。
Three side-by-side images of a living room demonstrate different interior design choices. The first photo features a gray sofa, the second shows a dark blue sofa, and the third shows the same blue sofa with a stack of books on the coffee table.
3. 概念融合
分别生成太空人和雨林篮球场,然后让太空人在这个球场扣篮。这种组合创意以前基本做不到。
A three-panel sequence shows an astronaut in a spacesuit on Mars, an abandoned basketball court in a lush jungle, and the astronaut dunking a ball on that same court.
4. 风格转换
摩托车照片直接转成建筑制图风格,主体形状保持不变,风格完全重新渲染。
A side-by-side comparison of a detailed photograph of a parked motorcycle and a black-and-white line drawing of the same scene.
5. 逻辑推理
先画个人端着三层蛋糕,再问"如果这人摔倒会怎样",AI 会根据物理规律画出蛋糕散架的场景。
A two-panel image shows a chef holding a pristine three-tiered cake, followed by a second image of the same cake falling to pieces while the chef looks on in shock.
这次更新不亚于当年的GPT-4o吉卜力风格图片生成的影响力。当然,官方也指出模型也存在一些问题,比如:
风格化有时不一致,会出现意外效果文字渲染容易拼错,复杂字体支持不好角色一致性虽然改进了,但仍不是100%可靠长宽比控制不够精确,你要求的尺寸不一定能实现来源:正正杂说
