GPT-5 ist da – aber warum fühlt es sich dümmer an?
Ein persönlicher Erfahrungsbericht über Modell-Auswahl, versteckte Weichen und den Frust mit GPT-5.
13.08.2025 6 min
Zusammenfassung & Show Notes
In dieser Folge der KI Kantine erzählt Buschi ungefiltert von seinen ersten Tagen mit GPT-5 – und warum ihn das neue Modell zunächst eher enttäuscht hat. Er spricht darüber, wie schwer es ist, das „richtige“ Modell für eine Aufgabe zu wählen, was eigentlich im Hintergrund passiert, wenn man GPT-5 nutzt, und warum OpenAI nach Kritik plötzlich wieder GPT-4o aktiviert hat. Außerdem gibt er praktische Tipps, wie man Modelle zentral über OpenRouter verwalten und sinnvoll vergleichen kann – inklusive seinem aktuellen Lieblings-Tool „Codename Goose“. Eine Folge über Erwartungen, echte Intelligenz und die Frage: Wo steckt eigentlich der Fortschritt?
Wer ernsthaft mit KI arbeitet, muss mehr wissen als nur den Namen des neuesten Modells. Diese Folge liefert praktische Orientierung – und einen ehrlichen Blick hinter die Kulissen.
Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Transkript
(Transkribiert von TurboScribe.ai. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit.
Mahlzeit.
Sag mal, hast du mitbekommen, dass es jetzt
GPT 5 gibt?
Ja, das habe ich mitbekommen.
Ich habe mich am Wochenende mal damit beschäftigt
und geschaut, wo sich mein subjektives Erlebnis verändert
hat.
Und da ist mir eigentlich schnell aufgefallen, dass
ich jetzt nicht das Gefühl einer Verbesserung hatte.
Ich habe mich mit ihm über verschiedene Dinge
unterhalten und es war eigentlich immer das Gleiche.
Er fand es super, was ich vorgeschlagen habe
und hat meinen Gedankengang mehr oder weniger mit
den gleichen Worten wiederholt, so wie ich ihn
geschrieben habe.
Er war dann aber trotzdem wesentlich weniger hilfsbereit
und hat von sich aus eigentlich nichts Neues
vorgeschlagen.
Das habe ich früher anders erlebt.
Ich hatte immer das Gefühl, er wartet, dass
ich jetzt das Nächste schreibe.
Bei meiner Frau war das übrigens genauso.
Es lag also jetzt nicht unbedingt nur daran,
dass ich irgendwie anders gefragt habe.
Aha.
Dann habe ich mich mal ein bisschen umgesehen,
wie andere das empfinden.
Wie bei so einer Apple Keynote gab es
eigentlich immer dieselben Fraktionen.
Die einen lehnen es ab und verbringen Stunden
damit, zu beweisen, wie schlecht es ist.
Der klassische Fall ist so, wie viele S
sind in Mississippi?
Das macht er wohl öfters falsch.
Andere heben es halt brutal in den Himmel
und dann kommt immer das Klassische.
Das ändert alles.
Aber es gibt dann halt auch welche, die
das ein bisschen konstruktiver besprechen.
Und OpenAI war von ihrem neuen Flaggschiff so
bezeugt, dass sie das auch als einziges Modell
bereitgestellt haben.
Interessant.
Wie ist das?
Die wahre Intelligenzleistung von GPT-5 soll darin
liegen, dass es genau erkennt, welches Modell es
für welche Aufgabe braucht.
Also im Hintergrund laufen noch die alten Modelle
und das ist sowas wie eine schlaue Weiche.
Aha.
Dann stellt sich aber heraus, dass diese schlaue
Weiche gar nicht so schlau ist.
Denn es gibt so unterschiedliche Formen von Anfragen,
dass es eben nicht immer die richtige Entscheidung
trifft, welches Modell man im Hintergrund nimmt.
Interessant.
Und dann wurde der Shitstorm doch ein bisschen
lauter und dann haben sich die von OpenAI
kurzerhand entschlossen, okay, das GPT-4.0, das
bieten wir jetzt noch weiterhin an.
Das kann man also auswählen.
Das habe ich auch gemacht.
Interessant.
Es ist aber auch wirklich nicht einfach, das
richtige Modell für die richtige Aufgabe zu finden
und dann auch immer auf dem neuesten Stand
zu bleiben.
Es gibt ja ständig neue Modelle und ich
muss immer wieder überprüfen, ist das vielleicht sogar
noch besser für meine Aufgabe geeignet.
So gesehen ist es bei GPT-5 auch
der richtige Weg.
Wenn ich programmiere, dann nervt mich zum Beispiel,
wenn ich das Gemini Klee benutze, dass es
recht schnell von der Gemini 2.5 Pro
auf die Gemini 2.5 Flash runterstuft und
das ist ein spürbarer Qualitätsrückschritt.
Und da suche ich dann immer wieder, ob
es nicht Alternativen gibt, die vielleicht auch wenig
oder gar nichts kosten.
Du probierst ja immer irgendwelche neuen KI-Modelle
aus.
Wie kannst du auf die überhaupt zugreifen?
Wo finde ich die denn?
Man kann sich bei den einzelnen KI-Anbietern,
so wie OpenAI, Cloud, Google, überall registrieren.
Und dort kann man dann so einen API
-Key erzeugen und den gibst du dann in
den Entwicklertools an.
Aber das wird ja mehr und mehr Verwaltungsaufwand,
diese ganzen Keys sich zu merken.
Man darf auch nicht vergessen, dass wenn man
die API nutzt, also diese Schnittstelle nutzt, dann
muss man in der Regel dort Credits kaufen.
Das heißt, irgendwie hast du überallhin Geld überwiesen
und du weißt gar nicht mehr, wie überall
der Kontostand ist.
Es gibt aber auch so etwas wie OpenRouter.
Und dort kannst du zentral deine Credits kaufen
und auch dort so ziemlich alle Modelle auswählen.
Und wesentlich teurer sind die auch nicht, als
wenn du es direkt bei den einzelnen Anbietern
machst.
Aha.
Und ich finde es dort auch wirklich sehr
übersichtlich.
Da kann man immer sehen, was gibt es
denn für neue Modelle.
Man sieht auch sofort, was die Kosten für
die Abfrage dieses Modells sind, wie der Kontext
ist.
Und dann kann man auch schön sehen, für
was diese Modelle andere nutzen.
Da gibt es so ein Ranking.
Dann kannst du also gucken, was für ein
Modell wird denn am meisten im Marketing eingesetzt
oder in Finance oder eben beim Programming.
Und an diesen Charts und an diesen Tags
orientiere ich mich auch.
Gibt es da auch ein Programm, mit dem
ich die Modelle alle benutzen kann?
Ja, da gibt es eine ganze Reihe.
Und ich habe echt schon alle möglichen ausprobiert.
Zurzeit ist mein Favorit CodeNameGoose.
Da kannst du deinen OpenRouter-AP-Key hinterlegen
und alle Modelle auswählen und ausprobieren.
Und ich will jetzt mal ausprobieren, ob unser
Gulasch schon kalt ist.
Können wir jetzt endlich mal essen?
Die KI-Kantine ist ein Projekt von Michael
Busch, der auch beim nächsten Mal wieder ein
frisches KI-Gericht auftischt mit einer Prise Ponz
und einer Beilage Skepsis.
Ja.