Prompts und Guides6 Min Lesezeit

Bild-Prompts, die Marken-Visuals liefern

Bild-Prompts sind eine eigene Sprache. Wer einen LinkedIn-Caption-Prompt schreibt, kann nicht eins zu eins einen Bild-Prompt formulieren. Bild-Modelle reagieren auf andere Strukturen, andere Reihenfolgen, andere Begriffe.

Sub-Disziplin 1: Produkt-Hero-Bilder

Empfohlene Modelle: Imagen 4 (Text im Bild), Flux 2 (Foto-Realismus), Adobe Firefly 3 (kommerzielle Sicherheit).

text

Beschreibung: Studio-Foto eines [PRODUKT-BESCHREIBUNG],
auf [HINTERGRUND-OBERFLÄCHE], beleuchtet mit [LICHT-SETUP],
fotografiert aus [WINKEL].

Tonalität: clean, editorial, [STIMMUNGS-NOTIZ].
Stil-Referenz: [REFERENZ, z.B. „Apple Product Photography",
„Bauhaus Editorial“].

Technische Details:
- Schärfe: scharf in der Mitte, dezenter Bokeh am Rand.
- Farben: [BRAND-FARBPALETTE].
- Aufnahme-Modus: 50mm-Objektiv-Look.

Negative Hinweise: keine Personen, keine Reflexionen
mit Logos Dritter, kein zusätzlicher Text im Bild.

Fallstrick. Modelle generieren oft zusätzliche Elemente, die nicht im Brief stehen. Negativ-Hinweise sind entscheidend.

Sub-Disziplin 2: Plakatmotive mit Text

Empfohlene Modelle: Ideogram (höchste Text-Genauigkeit), Imagen 4 (zweite Wahl).

text

Beschreibung: Plakat-Komposition für [KAMPAGNE].

Hauptmotiv: [BILD-MOTIV, zwei Sätze].
Text-Element: „[GENAUER WORTLAUT]“
Typografie-Hinweis: [SCHRIFT-CHARAKTER, z.B. „serifenlos,
geometrisch, gewichtet 500“].

Komposition: [TEXT-POSITION].
Farbpalette: [BRAND-FARBEN].
Format: [PLAKAT-FORMAT].

Negative Hinweise: keine sekundären Text-Elemente,
keine Tippfehler, kein zusätzliches Logo.

Fallstrick. Auch Ideogram kann bei langen Wortlauten Buchstaben verschieben. Maximum 6-8 Wörter pro Text-Element, alles andere nachträglich im Design-Tool.

Sub-Disziplin 3: Editorial-Stilisierung

Empfohlene Modelle: Midjourney V7 (Stilisierung Marktführer), Flux 2 (Alternative).

text

Beschreibung: Editorial-Coverbild für [MAGAZIN/THEMA].

Hauptmotiv: [MOTIV, ein bis zwei Sätze].
Stil-Referenz: [REFERENZ, z.B. „1970s German Magazine
Editorial“, „British Vogue 2010s“].

Komposition: [BILD-KOMPOSITION].
Stimmung: [STIMMUNG].
Farben: [FARB-NOTIZEN].

Technische Details:
- Format: 4:5 für Magazin-Format.
- Korn: leichter analoger Look.
- Bildschärfe: knapp, nicht überscharf.

Fallstrick. Midjourney kann Stil-Referenzen so stark übernehmen, dass die Marken-Identität verloren geht. Stil-Referenzen mischen.

Sub-Disziplin 4: Konsistente Brand-Visuals

Empfohlene Modelle: Flux 2 (granular kontrollierbar), Midjourney V7 (mit Image-Reference-Funktion).

text

Aufgabe: Erzeuge fünf Variationen desselben Brand-Visuals.

Basis-Visual: [BESCHREIBUNG, drei Sätze].
Konsistenz-Anker:
- Gleiche Komposition.
- Gleiche Farbpalette.
- Gleiche Bildstimmung.
- Gleiches Licht-Setup.

Variation pro Bild:
1. [VARIANTE 1]
2. [VARIANTE 2]
3. [VARIANTE 3]
4. [VARIANTE 4]
5. [VARIANTE 5]

Fallstrick. Wer 100-prozentige Konsistenz braucht, arbeitet mit Image-Reference-Funktionen (Midjourney sref, Flux reference), nicht nur mit Text-Prompts.

Sub-Disziplin 5: Posts mit Text-im-Bild

Empfohlene Modelle: Ideogram (90-95% Text-Genauigkeit), Imagen 4 (zweite Wahl).

text

Aufgabe: Social-Post-Visual mit lesbarem Text.

Bild-Motiv: [MOTIV, ein Satz].
Text-Element: „[WORTLAUT, max 8 Wörter]“
Typografie: [SCHRIFT-CHARAKTER].
Format: [PLATTFORM-FORMAT].

Komposition: [WO SITZT TEXT, WO BILD].
Brand-Hinweis: [LOGO-PLATZIERUNG, optional].

Fallstrick. Text-im-Bild wird unzuverlässig, wenn der Wortlaut komplex wird. Schlüssel-Text in Modell, ergänzender Text nachträglich.

Modell-Wahl-Übersicht

Disziplin	Bestes Modell	Zweite Wahl
Produkt-Hero	Imagen 4 / Flux 2	Adobe Firefly 3
Plakat mit Text	Ideogram	Imagen 4
Editorial-Stilisierung	Midjourney V7	Flux 2
Konsistente Variationen	Flux 2 / Midjourney sref	Higgsfield Multi-Modell
Posts mit Text-im-Bild	Ideogram	Imagen 4

Take

Bild-Prompts sind technischer als Text-Prompts. Stil-Referenzen, Negativ-Hinweise, technische Details, Image-References. Wer das verstanden hat, arbeitet treffsicherer. Wer es ignoriert, generiert Stockfoto-Lookalikes.

Showcase: Fünf Modelle, fünf Briefings

Fünf Marketing-Bild-Briefings durch Midjourney V7, Flux 2, Imagen 4, Adobe Firefly 3 und Ideogram. Produziert über Higgsfield als Multi-Modell-Bridge plus Adobe Firefly direkt. Identische Prompts, Default-Settings, keine Iteration. Stand Mai 2026.

Briefing 1: Produkt-Hero-Bild

Modell	Brief-Treue	Foto-Realismus	Stilisierung	Lizenz-Sicherheit	Editierbar
Midjourney V7	hoch	hoch	sehr hoch	mittel	hoch
Flux 2	sehr hoch	sehr hoch	hoch	mittel	hoch
Imagen 4	sehr hoch	sehr hoch	hoch	hoch	hoch
Adobe Firefly 3	hoch	hoch	hoch	sehr hoch	sehr hoch
Ideogram	mittel	mittel	mittel	mittel	mittel

Verdict. Imagen 4 und Flux 2 dominieren in Foto-Realismus. Adobe Firefly 3 ist die kommerziell sicherste Option (Indemnification). Midjourney V7 mit stärkster Stilisierung, weicherer Brief-Treue. Ideogram nicht die richtige Wahl für Produkt-Hero.

Produkt-Hero Premium-Kopfhörer, generiert mit Nano Banana Pro — Slightly elevated frontal-Perspektive sauber getroffen, weiches Streiflicht, Bauhaus-Look.

Produkt-Hero Premium-Kopfhörer, generiert mit Flux 2 Pro — Flat-Lay-Editorial mit dramatischem Schattenwurf auf Betonplatte. Perspektive abweichend, stilistisch eigenständig.

Produkt-Hero Premium-Kopfhörer, generiert mit Seedream 4.5 — Frontalansicht in 4K, Material-Detail (Stoff-Pads), stilistisch statisch.

Produkt-Hero Premium-Kopfhörer, generiert mit GPT Image 2 — Perspektive ignoriert (Top-Down statt elevated frontal), kompositorisch sauber aber generisch.

Briefing 2: Plakat mit lesbarem Text

Modell	Brief-Treue	Text-im-Bild	Komposition	Lizenz-Sicherheit	Editierbar
Midjourney V7	mittel	niedrig	hoch	mittel	hoch
Flux 2	hoch	mittel	hoch	mittel	hoch
Imagen 4	sehr hoch	hoch	hoch	hoch	hoch
Adobe Firefly 3	hoch	mittel	hoch	sehr hoch	sehr hoch
Ideogram	sehr hoch	sehr hoch	mittel	mittel	hoch

Verdict. Text-im-Bild ist Ideogram-Territorium. Imagen 4 nah dran. Midjourney versagt im Text häufig (Tippfehler, fehlende Buchstaben). Firefly kommerziell sicher bei akzeptabler Text-Qualität.

Briefing 3: Editorial-Cover

Modell	Brief-Treue	Stilisierung	Stimmung	Lizenz-Sicherheit	Editierbar
Midjourney V7	sehr hoch	sehr hoch	sehr hoch	mittel	hoch
Flux 2	hoch	hoch	hoch	mittel	hoch
Imagen 4	hoch	mittel	mittel	hoch	hoch
Adobe Firefly 3	mittel	mittel	mittel	sehr hoch	sehr hoch
Ideogram	niedrig	niedrig	niedrig	mittel	mittel

Verdict. Editorial-Stilisierung ist Midjourney-Territorium. Flux 2 zweite Wahl. Imagen und Firefly sauber, selten überraschend. Ideogram nicht die richtige Wahl für stilistische Aufgaben.

Editorial-Showcase: Re-Run mit expliziter No-Text-Anweisung

Dasselbe Briefing in 3:4, 70s-Editorial-Stil, mit harter No-Text-Anweisung. Drei Modelle liefern, eines belegt eine zentrale Lektion.

Editorial-Cover ohne Text, generiert mit Flux 2 Pro — Frau im beigen Mantel von hinten, Kopfsteinpflaster, Morgenlicht. Atmosphärisch, melancholisch.

Editorial-Cover ohne Text, generiert mit Nano Banana Pro — Vintage osteuropäische Stadt, brauner Mantel mit Kopftuch, Straßenbahn im Hintergrund.

Editorial-Cover ohne Text, generiert mit Soul Cinematic — Paris-Anmutung, klassischer 70s-Editorial-Look. Stilistisch am konsequentesten.

Seedream 4.5 generiert trotz No-Text-Anweisung ein VOGUE-Cover-Layout — Trotz expliziter No-Text-Anweisung erzwungenes VOGUE-Cover-Layout. **Lektion:** Negative Prompts gegen starke Trainings-Pattern verlieren regelmäßig.

Didaktischer Vergleich: Original-Briefing mit „magazine cover“

Erstes Briefing war mehrdeutig: „magazine cover“-Hinweis ohne harte No-Text-Klausel. Wann interpretieren Modelle, wann respektieren sie strikte Anweisungen?

Flux 2 Pro generiert ein Magazin-Cover-Layout aus dem Original-Briefing — Aus „magazine cover“ wurde ein vollständiges Cover-Layout interpretiert.

Nano Banana Pro generiert ein Edinburgh-Cover-Layout — Auch Cover-Layout, Edinburgh-Anmutung. Konsistente Interpretation.

GPT Image 2 generiert ein vollständiges Cover mit lesbarem Text — Vollständiges Cover mit „LIFESTYLE, SILENCE IN THE CITY, Solitude IS NOT Loneliness“. Beleg für GPT als Text-im-Bild-Marktführer.

Briefing 4: Brand-Variations-Reihe

Modell	Brief-Treue	Brand-Consistency	Stilisierung	Lizenz-Sicherheit	Editierbar
Midjourney V7 (mit sref)	hoch	sehr hoch	sehr hoch	mittel	hoch
Flux 2 (Image-Reference)	sehr hoch	sehr hoch	hoch	mittel	hoch
Imagen 4	hoch	mittel	mittel	hoch	hoch
Adobe Firefly 3	hoch	hoch	hoch	sehr hoch	sehr hoch

Verdict. Brand-Consistency ist eine Image-Reference-Frage. Midjourney mit sref und Flux mit Reference-Input liefern die saubersten Reihen. Imagen ohne Reference variiert deutlich. Firefly sicher, in stilistischer Tiefe nicht auf Midjourney-Niveau.

Briefing 5: Social-Post mit Text-im-Bild

Modell	Brief-Treue	Text-im-Bild	Stimmung	Lizenz-Sicherheit	Editierbar
Midjourney V7	hoch	niedrig	sehr hoch	mittel	hoch
Flux 2	sehr hoch	mittel	hoch	mittel	hoch
Imagen 4	sehr hoch	hoch	hoch	hoch	hoch
Adobe Firefly 3	hoch	mittel	hoch	sehr hoch	sehr hoch
Ideogram	mittel	sehr hoch	mittel	mittel	hoch

Verdict. Zwei-Schritt-Pipeline empfohlen: Imagen oder Midjourney für das Motiv, Text in Figma oder Photoshop. Reine ein-Modell-Lösung: Ideogram für Text-Garantie bei schwächerer Bild-Qualität.

Übergreifende Beobachtungen

Spezialisierung dominiert. Kein „bestes“ Bild-Modell 2026. Pro Disziplin gewinnt ein anderes. Multi-Modell-Setup ist Pflicht.
Midjourney bleibt bei Stilisierung vorne. Editorial, Lifestyle, emotionale Aufgaben.
Imagen 4 und Flux 2 dominieren in Foto-Realismus. Wenn ein Bild „echt“ wirken soll.
Adobe Firefly 3 ist die Lizenz-Wahl. Akzeptable Qualität, höchste rechtliche Sicherheit dank Indemnification.

Verwandt

Generative KI Urheberrecht Grundlagen-Prompting

bild-promptsmidjourneyideogramimagenfluxbrand-visuals