Die KI Kantine - Der Podcast

Michael Busch

Wenn KI plötzlich teurer wird: Tool-Hopping statt Abo-Falle

Warum sich Entwickler nicht mehr auf ein KI-Tool verlassen sollten – und wie man mit Alternativen und Strategien flexibel bleibt

29.04.2026 8 min

Zusammenfassung & Show Notes

In dieser Folge der KI Kantine geht es um eine Entwicklung, die viele überrascht hat: Möglicherweise wird der Funktionsumfang von KI-Programmiertools wie Claude Code künftig aus günstigen Abos verschwinden. Buschi spricht darüber, was hinter solchen A/B-Tests steckt, warum Limits zunehmend zum Problem werden und wie Entwickler darauf reagieren können. 
Er zeigt praxisnah, wie man sich unabhängiger aufstellt – etwa durch den Einsatz von OpenRouter, Ollama oder offenen Alternativen. Dabei wird klar: Wer produktiv mit KI entwickeln will, kommt um eine flexible Tool-Strategie nicht mehr herum. 
Außerdem geht es um Kostenvergleiche zwischen Modellen, sinnvolles Tool-Hopping im Alltag und warum günstige Modelle wie Kimi aktuell besonders spannend sind. Eine Folge für alle, die KI nicht nur ausprobieren, sondern ernsthaft in ihren Workflow integrieren wollen.  

Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.

Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.

Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.

📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de

Alle Folgen & mehr: https://ki-kantine.letscast.fm/

Transkript

(Transkribiert von TurboScribe. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit! Mahlzeit! Sag mal, wolltest du nicht auch ClotCode abonnieren? Ja, ich hab zumindest mal drüber nachgedacht. Da musst du dich vielleicht ranhalten. Denn es könnte sein, dass ClotCode bald nicht mehr in dem Pro, also das für 20 Dollar, enthalten ist. Aha. Das ist Leuten bei TwitterX aufgefallen. Und die haben so einen Screenshot gemacht. Und tatsächlich hat Anthropic reagiert und gesagt, ja, das war ein Versuch. Das war so ein A-B-Test. Mal gucken, verkaufen wir vielleicht vergleichbar viele Hunderter. Vielleicht sind die Leute sowieso nicht so scharf drauf, das mit 20 Dollar zu machen. Aber wenn die das entscheiden, dann kannst du für die 20 Dollar nicht mehr die ganze Programmierfunktion benutzen. Also dieses ClotCode. Interessant. Und da bist du ja jetzt schon immer schlechter mit bedient. Denn so im Hintergrund haben die das Limit immer weiter angezogen. Es gibt ja so 5-Stunden-Fenster. Ein gewisses Limit für 5 Stunden. Und dann wird es wieder zurückgesetzt. Und dann darfst du wieder 5 Stunden machen. Aber wenn du das intensiv nutzt und ein bisschen mit Agenten rummachst und so weiter, bist du in einer halben Stunde eigentlich schon an deinem Limit. Und dann musst du 4,5 Stunden warten. Und dann ist es wieder zurückgesetzt. Jetzt sind die pfiffigen Leute, weißt du, was die gemacht haben? Die fangen eine kurze Anfrage an. Hallo Clot, bist du da? Und dann antwortet der. Und damit beginnt dein Zeitfenster. Und dann wissen sie bereits, dass sie in den nächsten 3 Stunden gar nichts machen wollen. Und fangen dann halt erst danach an. Dann gibt es einen fließenden Übergang. Das heißt, sie arbeiten dann bis das Fenster abgeschlossen ist. Dann gibt es aber den Reset und sie können dann nochmal arbeiten. Das heißt, sie haben eine größere Spielwiese für die Limits. Interessant. Das ist ja schon ganz pfiffig. Aber eigentlich ist es auch ziemlich nervig, wenn du dich um den Kram noch kümmern musst. Und es gibt eigentlich auch mittlerweile ganz vernünftige Alternativen. Also du kannst natürlich einmal mit ein paar Tricks Clot auf Open Router umleiten, sodass du dein eigenes Modell daran hängen kannst. Dann ist es eben nicht mehr Opus 4 .6 oder irgendwas, sondern dann entscheidest du das. Du kannst aber auch Clot mit Olama betreiben. Olama hat eine... Also einmal kannst du das natürlich lokal irgendwelche Modelle laufen lassen, irgendwelche LLMs. Aber ganz ehrlich, das geht in der Regel in die Knie. Aber die haben auch eine Cloud-Funktion. Und es ist gar nicht so schlecht, das Kontingent. Und es ist halt kostenlos. Damit kannst du eine Menge machen. Irgendwann läufst du da auch ins Limit. Aber es war vorher halt auch kostenlos. Dann musst du einfach nur... Also kannst du auch nachgucken. Olama, Clot, irgendwas. Und hinten schreibst du dann noch das Modell hintendran, wenn das Olama bei dir installiert wird. Das ist schon ziemlich cool. Habe ich schon mitgearbeitet. Und dann gibt es Open Clot. Das fühlt sich so an wie Open Clot, aber es ist halt Open. Es bietet dir sogar, wenn du dich dort registrierst und einen API-Key nimmst, hast du auch den Zugriff auf freie Modelle. Das verändert sich halt dauernd. Aber dort gibt es ein paar ganz coole, starke Modelle, die du benutzen kannst. Klar, jetzt wo es das ChatGPT 5.5 gibt, hast du noch einen weiteren Player, den du zurzeit kostenlos benutzen kannst. Also Codex ging normalerweise auch nur, wenn du ein Bezahlkunde bist. Im Moment kannst du es aber auch mit dem kostenlosen Account nutzen. Und das Schöne an ChatGPT 5.5 ist, es wird nicht so viel geschwafelt wie bei Clot. Also ich habe das Gefühl, man kommt schneller zum Punkt. Wenn du jetzt Clot vergleichst mit Codex im Sinne von eine Million Token Usage, dann ist Codex teurer. Aber das ist nicht so ein ganz fairer Vergleich, weil es ja auch um die Qualität der Antwort geht. Und wenn du schneller zum Ziel kommst, dann ist es natürlich unterm Strich wieder billiger. Bei Codex. 5.5 finde ich jetzt, ist ein ganz schöner Schritt nach vorne. Und wenn du ein bisschen weißt, was du tust, im Sinne von Programmieren, dann ist so ein LLM-Hopping oder ein Tool-Hopping gar nicht so falsch. Es gibt Dinge, die sind kompliziert, wo man Plan braucht. Da benutze ich eigentlich ganz gerne Clot. Oder jetzt Codex. Wobei der Codex schlechtere Pläne macht als Clot. Aber manchmal gibt es halt so ziemlich einfache Verbesserungen, Veränderungen. Und da kann ich schon sehr gezielt sagen, in dieser Datei machst du mir mal bitte eine Anpassung. Und dann ist das mit Open Code genauso gut. Und wenn ich viel von meinen Dateien sehen muss, dann benutze ich halt auch noch Anti -Gravity. Alles andere funktioniert ja im Terminal. Und da ist es immer ein bisschen schwerer, den Überblick zu bewahren. Bei Anti-Gravity kann ich dann alles sehen. Aber dort bist du ratzfatz in irgendwelchen Limits. Da kannst du ja auch auf Clot, Code zugreifen. Das geht auch ganz schnell den Berg runter. Gemini-Modelle sind auch echt dauernd, hängen die und dann heißt es, ja, wir haben gerade zu viel Last auf dem Server. Und weil du ja, das steht da nicht mehr, aber weil du ja so ein Billigheimer bist und unsere kostenlose Version benutzt, musst du jetzt mal warten. Wenn ich dann also bei diesen ganzen Quotas blockiert bin, dann versuche ich das mit einem Modell, das ich über Open Router verlinke, zu kompensieren. Und manchmal muss man dann halt auch bezahlen, weil die ganzen Free-Sachen öfters überlastet sind. Dann ist Kimi-K 2.6 zur Zeit das, was die Leute am meisten nutzen. Das kostet, ich glaube, 75 Cent Input für ein Megabyte Tokens und knapp 5 Euro Output. Wenn du überlegst, dass es allein 5 Euro Input und 30 Euro Output bei Codex ist, ist das eine enorme Differenz. Und es ist trotzdem ähnlich leistungsstark. Und wie ist es dann bei OpenClaw? Ja, bei OpenClaw kannst du dich ja auch nicht mehr mit deinem Clode-Account anmelden. Und weil das ja schon relativ unberechenbar ist, der arbeitet ja auch mal selbstständig, wird es hier Sinn machen, kein zu teures Modell erst mal zu setzen. Ich finde, die Olama-Lösung funktioniert ja auch wunderbar. Da kannst du also dann Olama, OpenClaw usw. aufrufen. Da habe ich erzählt, es gibt diese kostenlosen Kontingente und damit klappt das ganz gut. Wobei ich dir sagen muss, ich habe mich von OpenClaw sowieso komplett verabschiedet. Das hat mich echt fertig gemacht. Jedes Update hat dazu geführt, dass wieder er mich vergessen hat und vieles hat nicht mehr funktioniert. Ich bin jetzt übergegangen und nutze Hermes Agents. Da habe ich jetzt noch nicht so viel Erfahrung, aber die Installation war schon mal viel einfacher. Und ich kann auch immer mit ihm per Telegram kommunizieren. Er gibt mir auch immer Antwort. Das war bei OpenClaw dauernd nicht der Fall. Da ist halt nichts passiert. Du lässt dir deinen OpenClaw oder Hermes in der Regel auf einem Mac Mini laufen, auf einem separaten. Bei mir ist es z.B. auch ein separater Mac Mini. Da macht es ja dann Sinn, dass du z.B. wenn du Olama benutzen willst, dir einen weiteren Olama-Account anlegst. Dann frisst du dir halt nicht das Kontingent weg. Ich fresse dir aber gleich deine Spaghetti weg. Können wir jetzt endlich mal essen? Das ist die KI-Kantine. Wir sitzen in der KI-Kantine. Die KI-Kantine ist ein Projekt von Michael Busch, der auch beim nächsten Mal wieder ein frisches KI-Gericht auftischt mit einer Prise Pommes und einer Beilage Skepsis. Wir sitzen in der KI-Kantine. Hier ist die KI-Kantine.