Die KI Kantine - Der Podcast

Michael Busch

Nano Banana: Googles neue Bild-KI in der Kantine

Wie Gemini 2.5 Flash Image Bilder verändert – ohne dass der Rest sich bewegt.

17.09.2025 7 min

Zusammenfassung & Show Notes

In dieser Folge der KI Kantine spricht Buschi mit seinem Kollegen über „Nano Banana“, Googles neue Bild-KI auf Basis von Gemini 2.5 Flash Image. Was zunächst nach Obst klingt, entpuppt sich als ein mächtiges Tool: Bilder können erzeugt und bearbeitet werden, ohne dass sich der unveränderte Teil verändert. Buschi erklärt, warum das für Designer, Comiczeichner oder Produktmockups ein echter Durchbruch ist – und warum die Technik gleichzeitig Risiken birgt, etwa für Deepfakes. Zum Schluss bleibt die Erkenntnis: Nano Banana ist mehr als Spielerei, aber nicht frei von Skepsis. 

Mahlzeit aus der Kantine! 
Diesmal servieren wir kein Obst, sondern ein frisches Stück KI-News: Nano Banana – Googles Bildmodell „Gemini 2.5 Flash Image“. Buschi erklärt, warum Nano Banana mehr kann als herkömmliche Bild-KIs: 
  • Gesichter und Figuren bleiben erkennbar, auch nach Bearbeitung.
  • Lokales Editieren macht es möglich, nur kleine Teile auszutauschen, ohne dass das ganze Bild verrutscht.
  • Bildfusion & Stiltransfer erlauben neue kreative Kombinationen – vom Urlaubsfoto im Van-Gogh-Stil bis hin zum Schmuck-Mockup.
  • Doch bei aller Begeisterung bleiben die Risiken: Deepfakes und Missbrauch sind so einfach wie nie. Nano Banana markiert seine Werke zwar mit sichtbaren und unsichtbaren Wasserzeichen, aber das schützt nicht vor Fehlgebrauch.
Zum Schluss bleibt die Frage: Wo hört die Spielerei auf, wo beginnt der produktive Einsatz? Und wie lange können wir noch unterscheiden zwischen echter Banane und Nano Banana?
 

Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.

Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.

Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.

📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de

Alle Folgen & mehr: https://ki-kantine.letscast.fm/

Transkript

(Transkribiert von TurboScribe.ai. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit. Mahlzeit. Sag mal, hast du schon mal was von Nanobanana gehört? Nö, ich bin nur Bananarama. Aha, das ist so eine Bild-KI von Google. Die nennt sich auch Google Gemini 2.5 Flash Image. Und die hat Google so anonym unter dem Namen Nanobanana gelauncht und dort kam das sehr gut an. Dann gab es die ersten Vermutungen, dass das vielleicht von Google ist. Und dann haben ein paar Google-Menschen angefangen, bei Twitter irgendwelche Bananenbilder zu posten. Und dann wurde es schon immer eindeutiger. Aha, aber es gibt doch schon so viele Bild-KIs. Das stimmt. Aber Google hat es jetzt zum ersten Mal geschafft, dass so ein Bild auch nach der Bearbeitung eigentlich noch genauso aussieht, bis auf das, was du ändern wolltest. Bisher hast du immer das Problem gehabt, dass sich alles ein bisschen verändert hat, sobald du auch nur eine Kleinigkeit ändern wolltest am Bild. Du kannst also bei Nanobanana sagen, bitte mach aus der Brille eine Sonnenbrille. Und dann wirst du da mit ziemlicher Sicherheit eine Sonnenbrille sehen. Der Rest des Gesichts des Mannes oder der Frau bleiben komplett gleich. Interessant. Und das ist schon das richtig Gute, weil wenn du mit Nanobanana Gesichter oder Figuren wiedererkennbar halten kannst, dann kannst du daraus natürlich eine Menge machen. Ein Selfie hochladen, sagen, mach mir mal mich in einen Astronautenanzug oder pack mich mal ins Mittelalter. Du wirst danach immer noch merken, dass es so aussieht wie du. Also bei dir sicher eher Mittelalter als Astronaut. Ja, ja, sehr witzig. Und das ist natürlich total hilfreich, wenn du jetzt zum Beispiel einen Comic machen willst. Oder du möchtest ein Model haben, das verschiedene Klamotten trägt, aber es soll halt immer die gleiche Person sein. Aber dadurch, dass das so konsistent bleibt, kannst du eine Iteration des Bildes nicht nur mit einem großen Prompt machen, sondern du kannst es schrittweise verändern. Für die Prompts bei der Bilderzeugung nutzt man ja so eine gewisse Struktur. Was soll denn auf dem Bild drauf sein? Was soll das, was auf dem Bild ist, denn tun? Wie sieht denn die Umgebung aus? Welchen Stil benutzt du da? Wie ist die Beleuchtung? Gibt es noch irgendwelche anderen Details, die man erwähnen muss? Und auch wenn das häufig sinnvoll ist, kann man hier Einzelaspekte, das eben genannten, auch in einem nächsten Schritt ändern oder erst damit gezielt anfangen. Ich kann den kompletten Hintergrund ändern. Ich will nicht mehr hier in der Kantine sitzen, sondern ich möchte im Büro sitzen oder ich möchte im Wald sitzen. Und dann kannst du das in einem Prompt beschreiben und Nano Banana behält dann alles andere gleich. Zum Beispiel wir am Tisch sitzen, aber wir sitzen auf einmal im Wald. Also erspart ihr dir quasi das Freistellen, was man sonst so in Photoshop oder wo auch immer machen musste. Und früher wäre das auch schon gegangen, aber wir wären halt immer mehr nicht mehr wir selbst gewesen. Mit jeder Iteration hätten wir uns weiter verändert. Es gibt so einen tollen Beitrag, den ich mal gesehen habe, wo die Person ein Foto von sich genommen hat und es bei Chachibitty reingegeben hat und gesagt hat, bitte erzeuge das Bild neu, verändere aber nichts daran. Und dann hat er daraus so einen Film gemacht, so einen Zeichentrickfilm mit 20 Bildern hintereinander. Und es sieht aus, als würde man sich in so ein Monster verwandeln, schrittweise. Das ist hier dann nicht mehr der Fall. Du kannst zum Beispiel jetzt auch mehrere Bilder zusammenfügen in ein großes Bild. Du nimmst ein Urlaubsfoto und ein Gemälde von Van Gogh und kannst daraus dein Urlaubsfoto im Stile von Van Gogh machen. Und das klingt zwar jetzt so, als wäre es Spielerei, aber es gibt eine Menge Einsatzgebiete, wo das überhaupt keine Spielerei mehr ist. Zum Beispiel für Designer. Wenn man Prototypen erstellen will oder Varianten, kann man ganz schnell von irgendwas erzeugen lassen. Oder so Mock-Ups. Du hast ein Logo designt und willst das Logo auf einer Tasse mal sehen, auf einem Kissen mal sehen oder wo auch immer drauf. Das kannst du jetzt schnell machen. Weil sich das eben nicht verändert, dein Logo. Oder du hast Schmuck und möchtest sehen, wie es an den Ohren von einem Model aussieht. Dann nimmst du den Schmuck, nimmst ein Foto von einem Model und sagst dem Nano-Banana, bitte pack die beiden Bilder zusammen. Und dann hat das Model die Ohrringe. Du kannst Einrichtungen verändern. Du kannst sagen, guck mal hier, dieses Wohnzimmer gefällt mir nicht mehr. Wie wäre es denn, wenn wir eine andere Farbe von der Couch reinstellen? Oder wenn man es anders tapeziert. Tapetenmuster hinmachen, die Wohnung fotografieren und sagen, tapezieren wir diese Wohnung jetzt so. Das kann Nano-Banana. Interessant. Aber alles was so toll klingt, hat natürlich auch enorme Nachteile. Weil du kannst ja schon Deepfakes machen. Du kannst es total missbrauchen. Du kannst dich mit Cristiano Ronaldo auf dem Fußballplatz darstellen und sagen, hey, der hat mich gelobt. Da kann man also ganz schön Schindluder mit treiben. Und das geht auch. Früher hat die KI gesagt, sowas mache ich nicht, das ist ein Promi. Das habe ich bei Chet Chibiti öfters erlebt, dass der gesagt hat, das Bild darf ich nicht nehmen. Also bei Nano-Banana, bisher zumindest, hast du da nicht so viele Einschränkungen. Das einzige Versteckte ist das Nano-Banana-Wasserzeichen. Sichtbar und unsichtbar im Bild versteckt. Das sind die sogenannten Synth-IDs. Damit lässt sich technisch erkennen, dass das ein KI-Bild ist. Aha. Und jetzt wird man denken, ist eine teure Sache, aber ist kostenlos. Du kannst es in der Gemini-App aufrufen oder bei Google AI Studio. Und dort gibt es zur Zeit noch keine Beschränkungen. In der Gemini-App musst du aber aufpassen, wenn du das einfach so in das Prompfeld da reinschreibst, dann wird er sagen, ich kann keine Bilder erstellen. Du musst unten noch so ein extra Button drücken, wo Bild daneben steht. Dann geht er in den Bildmodus. Aha. Also ich finde Nano-Banana ziemlich geil. Ich habe nur auch nicht so viele Anwendungsfälle, die über das Spielen hinausgehen. Das ist bei fast allen Bildmodellen bisher so gewesen, dass mir dann kein praktischer Bezug einfällt. Aber das ist eine persönliche Sache. Wie gesagt, Designer usw. haben einen Riesenvorteil. Was man auch machen kann, ist z.B. sich Webdesign erstellen lassen. Das will ich jetzt mal demnächst probieren. Weißt du, was ich jetzt mal probieren will? Mein Cordon Bleu. Können wir jetzt in Limo essen? Die KI-Kantine ist ein Projekt von Michael Busch, der auch beim nächsten Mal wieder ein frisches KI-Gericht auftischt mit einer Prise Ponz und einer Beilage Skepsis. Wir sitzen in der KI-Kantine. Hier ist die KI-Kantine.