Prompt(提示词)决定AI图像生成效果。提示词描述得越具体,AI 越容易理解你想要什么,提示词约束得越合理,结果越接近你的预期。
如果只向AI描述“一个咖啡馆里的女生”,AI可能会生成各种类型的人物和场景,例如长发/短发、各种肤色、首饰、服装、表情的女生,咖啡馆场景也完全随机,难以达到想要的效果。
当然,提示词也并非越长越好:
一个女生在咖啡馆,阳光很好,很好看,真实一点,有氛围,背景虚化,像电影,颜色高级,人物自然,画面不要太假,照片感强一点。
这比前一句好,但比较混乱,且不够具体。
本文将介绍如何结构化撰写 Prompt,适用于 AI 图片生成场景。
提示词基本结构
可以按照以下顺序组织提示词:
[风格 / 类型],[主体描述],[主体动作或状态],[场景环境],[构图方式],[光线描述],[色彩和质感],[文字要求],[画面比例或用途],[负面约束]
并非每次都需要写满所有部分,但这个顺序可以尽可能避免遗漏关键信息。
例如:
真实摄影风格,一位年轻女性坐在东京街角的小型咖啡馆靠窗位置,穿深色针织衫,面前放着一杯热咖啡。画面采用半身构图,人物位于画面右侧,窗外有模糊的街景和行人。自然晨光从左侧窗户照入,柔和阴影,浅景深,色调温暖,生活化随手拍,不完美构图,真实手机摄影质感。
这段 Prompt 的信息是分层的:先告诉 AI 生成“照片”,而不是卡通插画;再告诉它主角;然后描述“在哪里”;接着说明“怎么拍”;最后强化“光线、质感和真实感”。

(使用 ChatGPT Images 2.0 生成)
产品图示例:
高级商业摄影风格,一瓶透明磨砂玻璃精华液放在大理石台面上,瓶身有极简叶片logo,瓶中为浅绿色液体,银色滴管瓶盖。背景是浴室窗边,旁边有少量水珠、毛巾和少量绿色植物。主体居中构图,浅景深,顶部柔光和侧面自然光结合,玻璃有真实反射和折射。整体色调干净、清透、柔和,适合高端护肤品牌广告。不要出现杂乱文字、变形瓶身或水印。

(使用 ChatGPT Images 2.0 生成)
第一步:用风格开头,先确定画面的基调
Prompt 的开头非常重要,因为它会影响整张图的生成方向。可以把开头理解为“创作模式选择”。
常见的风格开头例如:
(1)真实摄影风格
真实摄影风格,一张由 iPhone 拍摄的生活随拍照片……
(2)电影感画面
电影感摄影,一名男子独自站在雨夜街头,霓虹灯反射在湿润的地面上……
(3)极简现代设计风格
现代极简风格的海报图,主题是护肤产品介绍……
(4)复古胶片风格
复古 35mm 胶片摄影风格,颗粒感明显,色彩略微褪色……
风格不应该放在提示词末尾随便补一句“高级感、电影感”。最好一开始就明确,因为它会影响模型对整个画面的理解。
第二步:描述主体
主体是画面的核心。
人物类主体可以写年龄、性别、身份、服装、姿态、表情、动作和情绪。
一位 35 岁左右的男性产品经理坐在开放式办公室的电脑前,穿浅灰色衬衫,神情专注,桌上有笔记本电脑、咖啡杯和便签纸
产品类主体可以写品类、材质、形状、颜色、品牌风格、摆放方式、使用场景。
一瓶透明磨砂玻璃精华液放在大理石台面上,浅绿色液体,银色滴管瓶盖,放在浴室窗边的白色大理石台面上,旁边有水珠和柔软毛巾
这类描述能让 AI 知道主体的材质、颜色、空间关系和商业摄影方向。
第三步:补充场景
即使是单一主体,也需要一个合理的环境承托。
例如你写“一位厨师正在摆盘”,这个画面可能出现在家庭厨房、米其林餐厅、户外小摊、电视节目现场。
当你补充场景:
一位专业厨师站在开放式餐厅厨房中,正在用镊子为白色瓷盘里的主菜做最后装饰,背景有不锈钢操作台、暖色灯光和正在忙碌的厨师团队
画面就会变得具体、完整。
场景描述可以包含:
时间:清晨、黄昏、深夜、午后。
地点:咖啡馆、街头、办公室、厨房、卧室、海边、地铁站。
天气:雨天、晴天、雾天、雪后、阴天。
环境元素:窗户、桌面、植物、霓虹灯、货架、人群、车辆、屏幕。
氛围:安静、忙碌、孤独、温暖、紧张、松弛、未来感。
第四步:明确构图
常见构图表达包括:
(1)居中构图
主体位于画面中央,背景简洁,适合产品海报和封面图……
(2)三分法构图
主体位于画面右侧三分之一处,左侧留出大面积空白用于标题文字。
(3)近景 / 中景 / 远景
半身近景,人物从腹部以上入镜,背景轻微虚化。
(4)俯拍
从正上方俯拍桌面,展示咖啡、笔记本、手机和便签纸。
(5)低角度仰拍
低角度拍摄高楼建筑,突出压迫感和未来感。
(6)留白设计
画面左侧保留干净的深色渐变区域,用于后期添加标题。
对于海报、广告图,构图尤其重要。因为这类图片经常需要放文字,如果没有写留白,AI 很可能把整个画面都填满。
第五步:明确光线
很多图片之所以看起来廉价,往往不是因为主体,而是光线太模糊、太平均。
常见光线描述例如:
(1)自然光
不要只写“光线明亮”,可以改成:
柔和的自然光从左侧窗户照入,人物脸部有轻微明暗过渡
(2)电影光
如侧逆光、轮廓光、霓虹反射。
第六步:描述色彩和质感
常见色彩描述:暖色调、冷色调、低饱和、高对比、柔和色彩、复古胶片色彩、黑金配色、蓝紫霓虹、奶油色背景、莫兰迪色系。
常见质感描述:真实皮肤纹理、玻璃反光、金属质感、胶片噪点、浅景深、背景虚化、柔和阴影。
第七步:图片文字要求
AI 生成带文字的图片时,文字的提示词需要非常具体。例如:
画面中央上方有清晰英文霓虹灯文字 “OPEN LATE”,红色发光字,安装在咖啡馆玻璃窗内侧,文字完整、拼写正确、易读
具体文字需要使用双引号,让AI完全遵循引号内的内容生成。
可添加以下文字要素:
位置:左上角、居中、底部、画面右侧。
字体风格:粗体、无衬线、手写体、霓虹灯字、品牌字体感。
第八步:使用负面约束,告诉 AI 不要什么
例如不要多余文字、避免过度磨皮、不要使用拥挤排版。
最后,可以根据需要添加图像比例(如“比例为16:9”)。
对于图像生成来说,最重要的不是堆关键词,而是画面逻辑,可以根据本文的提示词顺序逐个撰写。
本文为readaihub.com原创内容,未经书面授权,禁止转载。如需分享文章,请复制本文链接进行分享。