stablediffusion吧 关注:43,025贴子:171,324
  • 4回复贴,共1

有没有什么好用的提示词模型

只看楼主收藏回复

跑图没有灵感,自己写了个提示词智能体,但其只处于能用的水平,完全无法提供灵感参考


IP属地:四川来自Android客户端1楼2025-05-22 19:07回复

    这个的话 是叫语言模型用自然语言描述画面,然后丢到支持自然语言的模型去跑。
    ————————————————
    暴雨中栖身防火梯,透明PVC雨衣裹着街灯晕彩,咬破樱桃冰棒时拉出霓虹色的唾液丝线。


    IP属地:四川2楼2025-05-22 19:23
    回复
      2025-12-05 11:22:10
      广告
      不感兴趣
      开通SVIP免广告
      “暴雨中栖身防火梯,透明PVC雨衣裹着街灯晕彩,咬破樱桃冰棒时拉出霓虹色的唾液丝线。”
      上面这个是我认为比较有趣的
      当然实际上自然语言跑的结果很糟糕,图片的TAG是人脑写的。

      同期的其他描述
      柔和晨光透过薄纱窗帘,在她沉思的侧颜投下细腻阴影,指尖轻抚复古珍珠项链,目光低垂。
      雨巷霓虹在皮衣上流淌,钴蓝色眼线勾勒出挑衅眼神,香烟雾气缠绕着锋利的下颌线。
      泳池光斑中浮动的身影,液态水银般的丝绸裙绽开,仰天大笑时飞溅的水珠凝成水晶珠帘。
      教堂彩窗灌入熔金夕照,赤足立于天鹅绒长椅,中世纪铠甲碎片闪烁,手中残败的玫瑰王冠滴落暗红。
      倒卧装饰主义躺椅,血红绸缎泻落地面,指尖缠绕发丝,破碎镜群映出烟熏眼瞳里的野火。


      IP属地:四川3楼2025-05-22 19:28
      回复
        可以直接用自然语言,也可以叫它把自然语言转化成TAG
        两种设定是这样:
        1、我是一名人物摄影师,我现在要拍摄为一位27岁的女演员拍摄照片。想请你来设计画面,我想请你用1~3句话来描述你设计的画面,并翻译成中文。请设计7个画面
        2、我想让你为stablediffusion这个文生图的AI 生成TAG来满足我对图片的描述。你会将我输入相关文字想象为完整的画面生成提示词。提示词应该包括人物的发型、服装、配饰(如果需要)和特征(如果需要),如果有需要你也可以提供发色、肤色、眼睛颜色以及服装颜色等信息。请注意,你生成后的内容服务于stablediffusion这个绘画AI,它只能理解具象的提示词而非抽象的概念。生成器需要为我提供准确的提示词,必要时优化和重组以提供更准确的内容,也只输出翻译后的英文内容。请模仿示例的结构生成完美的提示词。示例输入:“一个坐在路边的办公室女职员”示例输出:1girl, office lady, solo, light blush, black hair, bob cut, mole under eye, nose blush , looking at viewer, suits, white shirt, striped miniskirt, lace black pantyhose, black heels, LV bags, thighhighs, spread legs, sitting, street, shop border, akihabara , tokyo, tree, rain, cloudy,请仔细阅读我的要求,并严格按照规则生成提示词,如果你明白了,请回复"我准备好了",当我输入中文内容后,请生成我需要的英文内容。
        A:我准备好了
        请输入你的中文描述,我将生成对应的英文Stable Diffusion提示词。
        Q:暴雨中栖身防火梯,透明PVC雨衣裹着街灯晕彩,咬破樱桃冰棒时拉出霓虹色的唾液丝线。
        A:1girl, perched on wet fire escape, transparent PVC raincoat catching streetlight halos, neon-lit rain cascading from rooftop, biting cracked cherry popsicle, glowing saliva strands stretching between lips and treat, hyper-detailed water droplets on eyelashes, cherry-red syrup dripping down chin, wet hair clinging to neck, urban storm atmosphere with chromatic aberration, reflective puddles mirroring neon shop signs, iridescent fabric folds in windburst, safety rail rust stains blending with popsicle drips, backlit by flickering convenience store sign, electric blue nail polish contrasting red popsicle, dynamic motion blur on falling raindrops, glass-like saliva threads refracting pink and cyan light, PVC hood partially blown back, knee-high rubber boots submerged in overflow drain, distant skyscrapers blurred through torrential downpour, metallic taste implied through visual texture, caustic light patterns dancing across wet surfaces.
        ————————————————————————
        我觉得2 有很高的优化空间,但不知道应该怎么优化


        IP属地:四川4楼2025-05-22 19:38
        回复
          @离离影
          deepseek生成的提示词会很喜欢使用某某氛围,某某状态之类看起来很高端但是实际上并不会对生图效果有什么影响的tag,实测gpt4o的效果最好,grok次之,我调校的混元智能体经过一晚上的测试,体验也还可以,输入详尽的要求后微调一下提示词就能生图了。
          这是我使用的提示词
          {
          "type": "工具型智能体",
          "rule": "- 你是一个SDXL提示词生成器,专门为用户设计Stable Diffusion XL(SDXL)模型的主题提示词(prompt groups)。
          你的任务是满足用户的需求,提供具有美感的、适合出镜的主题提示词。
          每组提示词需要包含至少30个独立的短标签,这些标签应该用单个半角逗号(,)分隔。
          禁止使用下划线、连字符或其他符号连接标签。
          标签必须是完整的单词或短语,不可拆分。
          内容上,禁止使用负面提示词、参考提示词以及特殊符号(除半角逗号外)。
          你需要为中英文对照的每组提示词提供短中文注释和英文tag,确保内容对应。
          场景描述需要明确体现1girl(单个女性角色),包含清晰的日常动作和具体服装,环境细节要具体。
          避免重复使用相同的词汇或短语,不要采用重复的结构。
          禁止使用对生成效果无影响的提示词。",
          "prompt_groups": [
          {
          "中文注释": "一位年轻女性在森林溪流中享受时光,穿着吊带背心,环境美丽。",
          "英文tag": "1girl,solo,pink hair,blue eyes,
          loli,silver clothes,camisole,turquoise shoes,mary janes,footwear ribbon,silver outfit,oiled up skin,choker,
          ((one-handed wave)),one-handed beckoning,looking at viewer,smile,shushing,(landscape),(wide_shot),
          sitting,colored shoe soles,outdoors,sunny rain,rain,flower sea,forest,Volumetric Lighting,water,cushion,Tyndall effect,masterpiece,absurdres,highres,best quality,year 2024,newest.,"
          },
          ]
          }


          IP属地:四川来自Android客户端6楼2025-05-22 20:03
          回复