Wenn KI plötzlich teurer wird: Tool-Hopping statt Abo-Falle
Warum sich Entwickler nicht mehr auf ein KI-Tool verlassen sollten – und wie man mit Alternativen und Strategien flexibel bleibt
29.04.2026 8 min
Zusammenfassung & Show Notes
In dieser Folge der KI Kantine geht es um eine Entwicklung, die viele überrascht hat: Möglicherweise wird der Funktionsumfang von KI-Programmiertools wie Claude Code künftig aus günstigen Abos verschwinden. Buschi spricht darüber, was hinter solchen A/B-Tests steckt, warum Limits zunehmend zum Problem werden und wie Entwickler darauf reagieren können.
Er zeigt praxisnah, wie man sich unabhängiger aufstellt – etwa durch den Einsatz von OpenRouter, Ollama oder offenen Alternativen. Dabei wird klar: Wer produktiv mit KI entwickeln will, kommt um eine flexible Tool-Strategie nicht mehr herum.
Außerdem geht es um Kostenvergleiche zwischen Modellen, sinnvolles Tool-Hopping im Alltag und warum günstige Modelle wie Kimi aktuell besonders spannend sind. Eine Folge für alle, die KI nicht nur ausprobieren, sondern ernsthaft in ihren Workflow integrieren wollen.
Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Transkript
(Transkribiert von TurboScribe. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit!
Mahlzeit!
Sag mal, wolltest du nicht auch ClotCode abonnieren?
Ja, ich hab zumindest mal drüber nachgedacht.
Da musst du dich vielleicht ranhalten.
Denn es könnte sein, dass ClotCode bald nicht
mehr in dem Pro, also das für 20
Dollar, enthalten ist.
Aha.
Das ist Leuten bei TwitterX aufgefallen.
Und die haben so einen Screenshot gemacht.
Und tatsächlich hat Anthropic reagiert und gesagt, ja,
das war ein Versuch.
Das war so ein A-B-Test.
Mal gucken, verkaufen wir vielleicht vergleichbar viele Hunderter.
Vielleicht sind die Leute sowieso nicht so scharf
drauf, das mit 20 Dollar zu machen.
Aber wenn die das entscheiden, dann kannst du
für die 20 Dollar nicht mehr die ganze
Programmierfunktion benutzen.
Also dieses ClotCode.
Interessant.
Und da bist du ja jetzt schon immer
schlechter mit bedient.
Denn so im Hintergrund haben die das Limit
immer weiter angezogen.
Es gibt ja so 5-Stunden-Fenster.
Ein gewisses Limit für 5 Stunden.
Und dann wird es wieder zurückgesetzt.
Und dann darfst du wieder 5 Stunden machen.
Aber wenn du das intensiv nutzt und ein
bisschen mit Agenten rummachst und so weiter, bist
du in einer halben Stunde eigentlich schon an
deinem Limit.
Und dann musst du 4,5 Stunden warten.
Und dann ist es wieder zurückgesetzt.
Jetzt sind die pfiffigen Leute, weißt du, was
die gemacht haben?
Die fangen eine kurze Anfrage an.
Hallo Clot, bist du da?
Und dann antwortet der.
Und damit beginnt dein Zeitfenster.
Und dann wissen sie bereits, dass sie in
den nächsten 3 Stunden gar nichts machen wollen.
Und fangen dann halt erst danach an.
Dann gibt es einen fließenden Übergang.
Das heißt, sie arbeiten dann bis das Fenster
abgeschlossen ist.
Dann gibt es aber den Reset und sie
können dann nochmal arbeiten.
Das heißt, sie haben eine größere Spielwiese für
die Limits.
Interessant.
Das ist ja schon ganz pfiffig.
Aber eigentlich ist es auch ziemlich nervig, wenn
du dich um den Kram noch kümmern musst.
Und es gibt eigentlich auch mittlerweile ganz vernünftige
Alternativen.
Also du kannst natürlich einmal mit ein paar
Tricks Clot auf Open Router umleiten, sodass du
dein eigenes Modell daran hängen kannst.
Dann ist es eben nicht mehr Opus 4
.6 oder irgendwas, sondern dann entscheidest du das.
Du kannst aber auch Clot mit Olama betreiben.
Olama hat eine...
Also einmal kannst du das natürlich lokal irgendwelche
Modelle laufen lassen, irgendwelche LLMs. Aber ganz ehrlich,
das geht in der Regel in die Knie.
Aber die haben auch eine Cloud-Funktion.
Und es ist gar nicht so schlecht, das
Kontingent.
Und es ist halt kostenlos.
Damit kannst du eine Menge machen.
Irgendwann läufst du da auch ins Limit.
Aber es war vorher halt auch kostenlos.
Dann musst du einfach nur...
Also kannst du auch nachgucken.
Olama, Clot, irgendwas.
Und hinten schreibst du dann noch das Modell
hintendran, wenn das Olama bei dir installiert wird.
Das ist schon ziemlich cool.
Habe ich schon mitgearbeitet.
Und dann gibt es Open Clot.
Das fühlt sich so an wie Open Clot,
aber es ist halt Open.
Es bietet dir sogar, wenn du dich dort
registrierst und einen API-Key nimmst, hast du
auch den Zugriff auf freie Modelle.
Das verändert sich halt dauernd.
Aber dort gibt es ein paar ganz coole,
starke Modelle, die du benutzen kannst.
Klar, jetzt wo es das ChatGPT 5.5
gibt, hast du noch einen weiteren Player, den
du zurzeit kostenlos benutzen kannst.
Also Codex ging normalerweise auch nur, wenn du
ein Bezahlkunde bist.
Im Moment kannst du es aber auch mit
dem kostenlosen Account nutzen.
Und das Schöne an ChatGPT 5.5 ist,
es wird nicht so viel geschwafelt wie bei
Clot.
Also ich habe das Gefühl, man kommt schneller
zum Punkt.
Wenn du jetzt Clot vergleichst mit Codex im
Sinne von eine Million Token Usage, dann ist
Codex teurer.
Aber das ist nicht so ein ganz fairer
Vergleich, weil es ja auch um die Qualität
der Antwort geht.
Und wenn du schneller zum Ziel kommst, dann
ist es natürlich unterm Strich wieder billiger.
Bei Codex.
5.5 finde ich jetzt, ist ein ganz
schöner Schritt nach vorne.
Und wenn du ein bisschen weißt, was du
tust, im Sinne von Programmieren, dann ist so
ein LLM-Hopping oder ein Tool-Hopping gar
nicht so falsch.
Es gibt Dinge, die sind kompliziert, wo man
Plan braucht.
Da benutze ich eigentlich ganz gerne Clot.
Oder jetzt Codex.
Wobei der Codex schlechtere Pläne macht als Clot.
Aber manchmal gibt es halt so ziemlich einfache
Verbesserungen, Veränderungen.
Und da kann ich schon sehr gezielt sagen,
in dieser Datei machst du mir mal bitte
eine Anpassung.
Und dann ist das mit Open Code genauso
gut.
Und wenn ich viel von meinen Dateien sehen
muss, dann benutze ich halt auch noch Anti
-Gravity.
Alles andere funktioniert ja im Terminal.
Und da ist es immer ein bisschen schwerer,
den Überblick zu bewahren.
Bei Anti-Gravity kann ich dann alles sehen.
Aber dort bist du ratzfatz in irgendwelchen Limits.
Da kannst du ja auch auf Clot, Code
zugreifen.
Das geht auch ganz schnell den Berg runter.
Gemini-Modelle sind auch echt dauernd, hängen die
und dann heißt es, ja, wir haben gerade
zu viel Last auf dem Server.
Und weil du ja, das steht da nicht
mehr, aber weil du ja so ein Billigheimer
bist und unsere kostenlose Version benutzt, musst du
jetzt mal warten.
Wenn ich dann also bei diesen ganzen Quotas
blockiert bin, dann versuche ich das mit einem
Modell, das ich über Open Router verlinke, zu
kompensieren.
Und manchmal muss man dann halt auch bezahlen,
weil die ganzen Free-Sachen öfters überlastet sind.
Dann ist Kimi-K 2.6 zur Zeit
das, was die Leute am meisten nutzen.
Das kostet, ich glaube, 75 Cent Input für
ein Megabyte Tokens und knapp 5 Euro Output.
Wenn du überlegst, dass es allein 5 Euro
Input und 30 Euro Output bei Codex ist,
ist das eine enorme Differenz.
Und es ist trotzdem ähnlich leistungsstark.
Und wie ist es dann bei OpenClaw?
Ja, bei OpenClaw kannst du dich ja auch
nicht mehr mit deinem Clode-Account anmelden.
Und weil das ja schon relativ unberechenbar ist,
der arbeitet ja auch mal selbstständig, wird es
hier Sinn machen, kein zu teures Modell erst
mal zu setzen.
Ich finde, die Olama-Lösung funktioniert ja auch
wunderbar.
Da kannst du also dann Olama, OpenClaw usw.
aufrufen.
Da habe ich erzählt, es gibt diese kostenlosen
Kontingente und damit klappt das ganz gut.
Wobei ich dir sagen muss, ich habe mich
von OpenClaw sowieso komplett verabschiedet.
Das hat mich echt fertig gemacht.
Jedes Update hat dazu geführt, dass wieder er
mich vergessen hat und vieles hat nicht mehr
funktioniert.
Ich bin jetzt übergegangen und nutze Hermes Agents.
Da habe ich jetzt noch nicht so viel
Erfahrung, aber die Installation war schon mal viel
einfacher.
Und ich kann auch immer mit ihm per
Telegram kommunizieren.
Er gibt mir auch immer Antwort.
Das war bei OpenClaw dauernd nicht der Fall.
Da ist halt nichts passiert.
Du lässt dir deinen OpenClaw oder Hermes in
der Regel auf einem Mac Mini laufen, auf
einem separaten.
Bei mir ist es z.B. auch ein
separater Mac Mini.
Da macht es ja dann Sinn, dass du
z.B. wenn du Olama benutzen willst, dir
einen weiteren Olama-Account anlegst.
Dann frisst du dir halt nicht das Kontingent
weg.
Ich fresse dir aber gleich deine Spaghetti weg.
Können wir jetzt endlich mal essen?
Das ist die KI-Kantine.
Wir sitzen in der KI-Kantine.
Die KI-Kantine ist ein Projekt von Michael
Busch, der auch beim nächsten Mal wieder ein
frisches KI-Gericht auftischt mit einer Prise Pommes
und einer Beilage Skepsis.
Wir sitzen in der KI-Kantine.
Hier ist die KI-Kantine.