Nano Banana: Googles neue Bild-KI in der Kantine
Wie Gemini 2.5 Flash Image Bilder verändert – ohne dass der Rest sich bewegt.
17.09.2025 7 min
Zusammenfassung & Show Notes
In dieser Folge der KI Kantine spricht Buschi mit seinem Kollegen über „Nano Banana“, Googles neue Bild-KI auf Basis von Gemini 2.5 Flash Image. Was zunächst nach Obst klingt, entpuppt sich als ein mächtiges Tool: Bilder können erzeugt und bearbeitet werden, ohne dass sich der unveränderte Teil verändert. Buschi erklärt, warum das für Designer, Comiczeichner oder Produktmockups ein echter Durchbruch ist – und warum die Technik gleichzeitig Risiken birgt, etwa für Deepfakes. Zum Schluss bleibt die Erkenntnis: Nano Banana ist mehr als Spielerei, aber nicht frei von Skepsis.
Mahlzeit aus der Kantine!
Diesmal servieren wir kein Obst, sondern ein frisches Stück KI-News: Nano Banana – Googles Bildmodell „Gemini 2.5 Flash Image“. Buschi erklärt, warum Nano Banana mehr kann als herkömmliche Bild-KIs:
- Gesichter und Figuren bleiben erkennbar, auch nach Bearbeitung.
- Lokales Editieren macht es möglich, nur kleine Teile auszutauschen, ohne dass das ganze Bild verrutscht.
- Bildfusion & Stiltransfer erlauben neue kreative Kombinationen – vom Urlaubsfoto im Van-Gogh-Stil bis hin zum Schmuck-Mockup.
- Doch bei aller Begeisterung bleiben die Risiken: Deepfakes und Missbrauch sind so einfach wie nie. Nano Banana markiert seine Werke zwar mit sichtbaren und unsichtbaren Wasserzeichen, aber das schützt nicht vor Fehlgebrauch.
Zum Schluss bleibt die Frage: Wo hört die Spielerei auf, wo beginnt der produktive Einsatz? Und wie lange können wir noch unterscheiden zwischen echter Banane und Nano Banana?
Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Transkript
(Transkribiert von TurboScribe.ai. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit.
Mahlzeit.
Sag mal, hast du schon mal was von
Nanobanana gehört?
Nö, ich bin nur Bananarama.
Aha, das ist so eine Bild-KI von
Google.
Die nennt sich auch Google Gemini 2.5
Flash Image.
Und die hat Google so anonym unter dem
Namen Nanobanana gelauncht und dort kam das sehr
gut an.
Dann gab es die ersten Vermutungen, dass das
vielleicht von Google ist.
Und dann haben ein paar Google-Menschen angefangen,
bei Twitter irgendwelche Bananenbilder zu posten.
Und dann wurde es schon immer eindeutiger.
Aha, aber es gibt doch schon so viele
Bild-KIs.
Das stimmt.
Aber Google hat es jetzt zum ersten Mal
geschafft, dass so ein Bild auch nach der
Bearbeitung eigentlich noch genauso aussieht, bis auf das,
was du ändern wolltest.
Bisher hast du immer das Problem gehabt, dass
sich alles ein bisschen verändert hat, sobald du
auch nur eine Kleinigkeit ändern wolltest am Bild.
Du kannst also bei Nanobanana sagen, bitte mach
aus der Brille eine Sonnenbrille.
Und dann wirst du da mit ziemlicher Sicherheit
eine Sonnenbrille sehen.
Der Rest des Gesichts des Mannes oder der
Frau bleiben komplett gleich.
Interessant.
Und das ist schon das richtig Gute, weil
wenn du mit Nanobanana Gesichter oder Figuren wiedererkennbar
halten kannst, dann kannst du daraus natürlich eine
Menge machen.
Ein Selfie hochladen, sagen, mach mir mal mich
in einen Astronautenanzug oder pack mich mal ins
Mittelalter.
Du wirst danach immer noch merken, dass es
so aussieht wie du.
Also bei dir sicher eher Mittelalter als Astronaut.
Ja, ja, sehr witzig.
Und das ist natürlich total hilfreich, wenn du
jetzt zum Beispiel einen Comic machen willst.
Oder du möchtest ein Model haben, das verschiedene
Klamotten trägt, aber es soll halt immer die
gleiche Person sein.
Aber dadurch, dass das so konsistent bleibt, kannst
du eine Iteration des Bildes nicht nur mit
einem großen Prompt machen, sondern du kannst es
schrittweise verändern.
Für die Prompts bei der Bilderzeugung nutzt man
ja so eine gewisse Struktur.
Was soll denn auf dem Bild drauf sein?
Was soll das, was auf dem Bild ist,
denn tun?
Wie sieht denn die Umgebung aus?
Welchen Stil benutzt du da?
Wie ist die Beleuchtung?
Gibt es noch irgendwelche anderen Details, die man
erwähnen muss?
Und auch wenn das häufig sinnvoll ist, kann
man hier Einzelaspekte, das eben genannten, auch in
einem nächsten Schritt ändern oder erst damit gezielt
anfangen.
Ich kann den kompletten Hintergrund ändern.
Ich will nicht mehr hier in der Kantine
sitzen, sondern ich möchte im Büro sitzen oder
ich möchte im Wald sitzen.
Und dann kannst du das in einem Prompt
beschreiben und Nano Banana behält dann alles andere
gleich.
Zum Beispiel wir am Tisch sitzen, aber wir
sitzen auf einmal im Wald.
Also erspart ihr dir quasi das Freistellen, was
man sonst so in Photoshop oder wo auch
immer machen musste.
Und früher wäre das auch schon gegangen, aber
wir wären halt immer mehr nicht mehr wir
selbst gewesen.
Mit jeder Iteration hätten wir uns weiter verändert.
Es gibt so einen tollen Beitrag, den ich
mal gesehen habe, wo die Person ein Foto
von sich genommen hat und es bei Chachibitty
reingegeben hat und gesagt hat, bitte erzeuge das
Bild neu, verändere aber nichts daran.
Und dann hat er daraus so einen Film
gemacht, so einen Zeichentrickfilm mit 20 Bildern hintereinander.
Und es sieht aus, als würde man sich
in so ein Monster verwandeln, schrittweise.
Das ist hier dann nicht mehr der Fall.
Du kannst zum Beispiel jetzt auch mehrere Bilder
zusammenfügen in ein großes Bild.
Du nimmst ein Urlaubsfoto und ein Gemälde von
Van Gogh und kannst daraus dein Urlaubsfoto im
Stile von Van Gogh machen.
Und das klingt zwar jetzt so, als wäre
es Spielerei, aber es gibt eine Menge Einsatzgebiete,
wo das überhaupt keine Spielerei mehr ist.
Zum Beispiel für Designer.
Wenn man Prototypen erstellen will oder Varianten, kann
man ganz schnell von irgendwas erzeugen lassen.
Oder so Mock-Ups.
Du hast ein Logo designt und willst das
Logo auf einer Tasse mal sehen, auf einem
Kissen mal sehen oder wo auch immer drauf.
Das kannst du jetzt schnell machen.
Weil sich das eben nicht verändert, dein Logo.
Oder du hast Schmuck und möchtest sehen, wie
es an den Ohren von einem Model aussieht.
Dann nimmst du den Schmuck, nimmst ein Foto
von einem Model und sagst dem Nano-Banana,
bitte pack die beiden Bilder zusammen.
Und dann hat das Model die Ohrringe.
Du kannst Einrichtungen verändern.
Du kannst sagen, guck mal hier, dieses Wohnzimmer
gefällt mir nicht mehr.
Wie wäre es denn, wenn wir eine andere
Farbe von der Couch reinstellen?
Oder wenn man es anders tapeziert.
Tapetenmuster hinmachen, die Wohnung fotografieren und sagen, tapezieren
wir diese Wohnung jetzt so.
Das kann Nano-Banana.
Interessant.
Aber alles was so toll klingt, hat natürlich
auch enorme Nachteile.
Weil du kannst ja schon Deepfakes machen.
Du kannst es total missbrauchen.
Du kannst dich mit Cristiano Ronaldo auf dem
Fußballplatz darstellen und sagen, hey, der hat mich
gelobt.
Da kann man also ganz schön Schindluder mit
treiben.
Und das geht auch.
Früher hat die KI gesagt, sowas mache ich
nicht, das ist ein Promi.
Das habe ich bei Chet Chibiti öfters erlebt,
dass der gesagt hat, das Bild darf ich
nicht nehmen.
Also bei Nano-Banana, bisher zumindest, hast du
da nicht so viele Einschränkungen.
Das einzige Versteckte ist das Nano-Banana-Wasserzeichen.
Sichtbar und unsichtbar im Bild versteckt.
Das sind die sogenannten Synth-IDs.
Damit lässt sich technisch erkennen, dass das ein
KI-Bild ist.
Aha.
Und jetzt wird man denken, ist eine teure
Sache, aber ist kostenlos.
Du kannst es in der Gemini-App aufrufen
oder bei Google AI Studio.
Und dort gibt es zur Zeit noch keine
Beschränkungen.
In der Gemini-App musst du aber aufpassen,
wenn du das einfach so in das Prompfeld
da reinschreibst, dann wird er sagen, ich kann
keine Bilder erstellen.
Du musst unten noch so ein extra Button
drücken, wo Bild daneben steht.
Dann geht er in den Bildmodus.
Aha.
Also ich finde Nano-Banana ziemlich geil.
Ich habe nur auch nicht so viele Anwendungsfälle,
die über das Spielen hinausgehen.
Das ist bei fast allen Bildmodellen bisher so
gewesen, dass mir dann kein praktischer Bezug einfällt.
Aber das ist eine persönliche Sache.
Wie gesagt, Designer usw.
haben einen Riesenvorteil.
Was man auch machen kann, ist z.B.
sich Webdesign erstellen lassen.
Das will ich jetzt mal demnächst probieren.
Weißt du, was ich jetzt mal probieren will?
Mein Cordon Bleu.
Können wir jetzt in Limo essen?
Die KI-Kantine ist ein Projekt von Michael
Busch, der auch beim nächsten Mal wieder ein
frisches KI-Gericht auftischt mit einer Prise Ponz
und einer Beilage Skepsis.
Wir sitzen in der KI-Kantine.
Hier ist die KI-Kantine.