Prompts und Guides6 Min Lesezeit

Bild-Prompts, die Marken-Visuals liefern

Redaktion brandneo

Bild-Prompts sind eine eigene Sprache. Wer einen LinkedIn-Caption-Prompt schreibt, kann nicht eins zu eins einen Bild-Prompt formulieren. Bild-Modelle reagieren auf andere Strukturen, andere Reihenfolgen, andere Begriffe.

Sub-Disziplin 1: Produkt-Hero-Bilder

Empfohlene Modelle: Imagen 4 (Text im Bild), Flux 2 (Foto-Realismus), Adobe Firefly 3 (kommerzielle Sicherheit).

text
Beschreibung: Studio-Foto eines [PRODUKT-BESCHREIBUNG],
auf [HINTERGRUND-OBERFLÄCHE], beleuchtet mit [LICHT-SETUP],
fotografiert aus [WINKEL].

Tonalität: clean, editorial, [STIMMUNGS-NOTIZ].
Stil-Referenz: [REFERENZ, z.B. „Apple Product Photography",
„Bauhaus Editorial“].

Technische Details:
- Schärfe: scharf in der Mitte, dezenter Bokeh am Rand.
- Farben: [BRAND-FARBPALETTE].
- Aufnahme-Modus: 50mm-Objektiv-Look.

Negative Hinweise: keine Personen, keine Reflexionen
mit Logos Dritter, kein zusätzlicher Text im Bild.

Fallstrick. Modelle generieren oft zusätzliche Elemente, die nicht im Brief stehen. Negativ-Hinweise sind entscheidend.

Sub-Disziplin 2: Plakatmotive mit Text

Empfohlene Modelle: Ideogram (höchste Text-Genauigkeit), Imagen 4 (zweite Wahl).

text
Beschreibung: Plakat-Komposition für [KAMPAGNE].

Hauptmotiv: [BILD-MOTIV, zwei Sätze].
Text-Element: „[GENAUER WORTLAUT]“
Typografie-Hinweis: [SCHRIFT-CHARAKTER, z.B. „serifenlos,
geometrisch, gewichtet 500“].

Komposition: [TEXT-POSITION].
Farbpalette: [BRAND-FARBEN].
Format: [PLAKAT-FORMAT].

Negative Hinweise: keine sekundären Text-Elemente,
keine Tippfehler, kein zusätzliches Logo.

Fallstrick. Auch Ideogram kann bei langen Wortlauten Buchstaben verschieben. Maximum 6-8 Wörter pro Text-Element, alles andere nachträglich im Design-Tool.

Sub-Disziplin 3: Editorial-Stilisierung

Empfohlene Modelle: Midjourney V7 (Stilisierung Marktführer), Flux 2 (Alternative).

text
Beschreibung: Editorial-Coverbild für [MAGAZIN/THEMA].

Hauptmotiv: [MOTIV, ein bis zwei Sätze].
Stil-Referenz: [REFERENZ, z.B. „1970s German Magazine
Editorial“, „British Vogue 2010s“].

Komposition: [BILD-KOMPOSITION].
Stimmung: [STIMMUNG].
Farben: [FARB-NOTIZEN].

Technische Details:
- Format: 4:5 für Magazin-Format.
- Korn: leichter analoger Look.
- Bildschärfe: knapp, nicht überscharf.

Fallstrick. Midjourney kann Stil-Referenzen so stark übernehmen, dass die Marken-Identität verloren geht. Stil-Referenzen mischen.

Sub-Disziplin 4: Konsistente Brand-Visuals

Empfohlene Modelle: Flux 2 (granular kontrollierbar), Midjourney V7 (mit Image-Reference-Funktion).

text
Aufgabe: Erzeuge fünf Variationen desselben Brand-Visuals.

Basis-Visual: [BESCHREIBUNG, drei Sätze].
Konsistenz-Anker:
- Gleiche Komposition.
- Gleiche Farbpalette.
- Gleiche Bildstimmung.
- Gleiches Licht-Setup.

Variation pro Bild:
1. [VARIANTE 1]
2. [VARIANTE 2]
3. [VARIANTE 3]
4. [VARIANTE 4]
5. [VARIANTE 5]

Fallstrick. Wer 100-prozentige Konsistenz braucht, arbeitet mit Image-Reference-Funktionen (Midjourney sref, Flux reference), nicht nur mit Text-Prompts.

Sub-Disziplin 5: Posts mit Text-im-Bild

Empfohlene Modelle: Ideogram (90-95% Text-Genauigkeit), Imagen 4 (zweite Wahl).

text
Aufgabe: Social-Post-Visual mit lesbarem Text.

Bild-Motiv: [MOTIV, ein Satz].
Text-Element: „[WORTLAUT, max 8 Wörter]“
Typografie: [SCHRIFT-CHARAKTER].
Format: [PLATTFORM-FORMAT].

Komposition: [WO SITZT TEXT, WO BILD].
Brand-Hinweis: [LOGO-PLATZIERUNG, optional].

Fallstrick. Text-im-Bild wird unzuverlässig, wenn der Wortlaut komplex wird. Schlüssel-Text in Modell, ergänzender Text nachträglich.

Modell-Wahl-Übersicht

DisziplinBestes ModellZweite Wahl
Produkt-HeroImagen 4 / Flux 2Adobe Firefly 3
Plakat mit TextIdeogramImagen 4
Editorial-StilisierungMidjourney V7Flux 2
Konsistente VariationenFlux 2 / Midjourney srefHiggsfield Multi-Modell
Posts mit Text-im-BildIdeogramImagen 4

Take

Bild-Prompts sind technischer als Text-Prompts. Stil-Referenzen, Negativ-Hinweise, technische Details, Image-References. Wer das verstanden hat, arbeitet treffsicherer. Wer es ignoriert, generiert Stockfoto-Lookalikes.

Showcase: Fünf Modelle, fünf Briefings

Fünf Marketing-Bild-Briefings durch Midjourney V7, Flux 2, Imagen 4, Adobe Firefly 3 und Ideogram. Produziert über Higgsfield als Multi-Modell-Bridge plus Adobe Firefly direkt. Identische Prompts, Default-Settings, keine Iteration. Stand Mai 2026.

Briefing 1: Produkt-Hero-Bild

ModellBrief-TreueFoto-RealismusStilisierungLizenz-SicherheitEditierbar
Midjourney V7hochhochsehr hochmittelhoch
Flux 2sehr hochsehr hochhochmittelhoch
Imagen 4sehr hochsehr hochhochhochhoch
Adobe Firefly 3hochhochhochsehr hochsehr hoch
Ideogrammittelmittelmittelmittelmittel

Verdict. Imagen 4 und Flux 2 dominieren in Foto-Realismus. Adobe Firefly 3 ist die kommerziell sicherste Option (Indemnification). Midjourney V7 mit stärkster Stilisierung, weicherer Brief-Treue. Ideogram nicht die richtige Wahl für Produkt-Hero.

Featured · Nano Banana ProProdukt-Hero Premium-Kopfhörer, generiert mit Nano Banana Pro
Slightly elevated frontal-Perspektive sauber getroffen, weiches Streiflicht, Bauhaus-Look.
Featured · Flux 2 ProProdukt-Hero Premium-Kopfhörer, generiert mit Flux 2 Pro
Flat-Lay-Editorial mit dramatischem Schattenwurf auf Betonplatte. Perspektive abweichend, stilistisch eigenständig.
Vergleich · Seedream 4.5Produkt-Hero Premium-Kopfhörer, generiert mit Seedream 4.5
Frontalansicht in 4K, Material-Detail (Stoff-Pads), stilistisch statisch.
Anti-Beispiel · GPT Image 2Produkt-Hero Premium-Kopfhörer, generiert mit GPT Image 2
Perspektive ignoriert (Top-Down statt elevated frontal), kompositorisch sauber aber generisch.

Briefing 2: Plakat mit lesbarem Text

ModellBrief-TreueText-im-BildKompositionLizenz-SicherheitEditierbar
Midjourney V7mittelniedrighochmittelhoch
Flux 2hochmittelhochmittelhoch
Imagen 4sehr hochhochhochhochhoch
Adobe Firefly 3hochmittelhochsehr hochsehr hoch
Ideogramsehr hochsehr hochmittelmittelhoch

Verdict. Text-im-Bild ist Ideogram-Territorium. Imagen 4 nah dran. Midjourney versagt im Text häufig (Tippfehler, fehlende Buchstaben). Firefly kommerziell sicher bei akzeptabler Text-Qualität.

Briefing 3: Editorial-Cover

ModellBrief-TreueStilisierungStimmungLizenz-SicherheitEditierbar
Midjourney V7sehr hochsehr hochsehr hochmittelhoch
Flux 2hochhochhochmittelhoch
Imagen 4hochmittelmittelhochhoch
Adobe Firefly 3mittelmittelmittelsehr hochsehr hoch
Ideogramniedrigniedrigniedrigmittelmittel

Verdict. Editorial-Stilisierung ist Midjourney-Territorium. Flux 2 zweite Wahl. Imagen und Firefly sauber, selten überraschend. Ideogram nicht die richtige Wahl für stilistische Aufgaben.

Editorial-Showcase: Re-Run mit expliziter No-Text-Anweisung

Dasselbe Briefing in 3:4, 70s-Editorial-Stil, mit harter No-Text-Anweisung. Drei Modelle liefern, eines belegt eine zentrale Lektion.

Featured · Flux 2 ProEditorial-Cover ohne Text, generiert mit Flux 2 Pro
Frau im beigen Mantel von hinten, Kopfsteinpflaster, Morgenlicht. Atmosphärisch, melancholisch.
Featured · Nano Banana ProEditorial-Cover ohne Text, generiert mit Nano Banana Pro
Vintage osteuropäische Stadt, brauner Mantel mit Kopftuch, Straßenbahn im Hintergrund.
Featured · Soul CinematicEditorial-Cover ohne Text, generiert mit Soul Cinematic
Paris-Anmutung, klassischer 70s-Editorial-Look. Stilistisch am konsequentesten.
Anti-Beispiel · Seedream 4.5Seedream 4.5 generiert trotz No-Text-Anweisung ein VOGUE-Cover-Layout
Trotz expliziter No-Text-Anweisung erzwungenes VOGUE-Cover-Layout. Lektion: Negative Prompts gegen starke Trainings-Pattern verlieren regelmäßig.

Didaktischer Vergleich: Original-Briefing mit „magazine cover“

Erstes Briefing war mehrdeutig: „magazine cover“-Hinweis ohne harte No-Text-Klausel. Wann interpretieren Modelle, wann respektieren sie strikte Anweisungen?

Didaktisch · Flux 2 ProFlux 2 Pro generiert ein Magazin-Cover-Layout aus dem Original-Briefing
Aus „magazine cover“ wurde ein vollständiges Cover-Layout interpretiert.
Didaktisch · Nano Banana ProNano Banana Pro generiert ein Edinburgh-Cover-Layout
Auch Cover-Layout, Edinburgh-Anmutung. Konsistente Interpretation.
Text-Marktführer · GPT Image 2GPT Image 2 generiert ein vollständiges Cover mit lesbarem Text
Vollständiges Cover mit „LIFESTYLE, SILENCE IN THE CITY, Solitude IS NOT Loneliness“. Beleg für GPT als Text-im-Bild-Marktführer.

Briefing 4: Brand-Variations-Reihe

ModellBrief-TreueBrand-ConsistencyStilisierungLizenz-SicherheitEditierbar
Midjourney V7 (mit sref)hochsehr hochsehr hochmittelhoch
Flux 2 (Image-Reference)sehr hochsehr hochhochmittelhoch
Imagen 4hochmittelmittelhochhoch
Adobe Firefly 3hochhochhochsehr hochsehr hoch

Verdict. Brand-Consistency ist eine Image-Reference-Frage. Midjourney mit sref und Flux mit Reference-Input liefern die saubersten Reihen. Imagen ohne Reference variiert deutlich. Firefly sicher, in stilistischer Tiefe nicht auf Midjourney-Niveau.

Briefing 5: Social-Post mit Text-im-Bild

ModellBrief-TreueText-im-BildStimmungLizenz-SicherheitEditierbar
Midjourney V7hochniedrigsehr hochmittelhoch
Flux 2sehr hochmittelhochmittelhoch
Imagen 4sehr hochhochhochhochhoch
Adobe Firefly 3hochmittelhochsehr hochsehr hoch
Ideogrammittelsehr hochmittelmittelhoch

Verdict. Zwei-Schritt-Pipeline empfohlen: Imagen oder Midjourney für das Motiv, Text in Figma oder Photoshop. Reine ein-Modell-Lösung: Ideogram für Text-Garantie bei schwächerer Bild-Qualität.

Übergreifende Beobachtungen

  • Spezialisierung dominiert. Kein „bestes“ Bild-Modell 2026. Pro Disziplin gewinnt ein anderes. Multi-Modell-Setup ist Pflicht.
  • Midjourney bleibt bei Stilisierung vorne. Editorial, Lifestyle, emotionale Aufgaben.
  • Imagen 4 und Flux 2 dominieren in Foto-Realismus. Wenn ein Bild „echt“ wirken soll.
  • Adobe Firefly 3 ist die Lizenz-Wahl. Akzeptable Qualität, höchste rechtliche Sicherheit dank Indemnification.

Verwandt

bild-promptsmidjourneyideogramimagenfluxbrand-visuals