HTML statt Markdown? Warum KI-Agenten plötzlich wieder Webseiten lieben
Claude-Ingenieure verabschieden sich von Markdown-Dateien – und entdecken HTML als flexibles Arbeitsformat für KI-Agenten neu.
13.05.2026 6 min
Zusammenfassung & Show Notes
Markdown galt lange als das perfekte Format für KI-Systeme: kompakt, einfach und token-effizient. Doch mit immer größeren Kontextfenstern und komplexeren KI-Agenten verschiebt sich die Priorität. In dieser Folge der KI Kantine spricht Buschi darüber, warum Entwickler bei Anthropic zunehmend HTML statt Markdown nutzen – und weshalb HTML für KI-Agenten plötzlich enorme Vorteile bietet.
Es geht um interaktive Exploration-Dokumente, visuelle Entscheidungsräume, dynamische Interfaces und die Frage, warum menschenlesbare Ergebnisse heute wichtiger werden als reine Token-Effizienz. Außerdem zeigt die Folge, wie HTML zu einer Art universeller Schnittstelle zwischen Mensch und KI werden könnte.
Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Transkript
(Transkribiert von TurboScribe. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit.
Mahlzeit.
Sag mal, du kannst dich doch noch erinnern,
dass ich dir was über Markdown erzählt habe,
oder?
Ja, das war doch diese sehr einfache Beschreibungssprache,
mit der die KI immer die Pläne geschrieben
hat.
Ja, ganz genau.
Ich kann sagen, dass das bald schon wieder
komplett überfällig ist.
Aha.
Ich habe einen Artikel gelesen von dem Leiter
des Engineering-Teams bei Claude Cote.
The Unreasonable Effectiveness of HTML.
Und in dem Artikel schreibt er, dass quasi
die gesamte Abteilung bei Claude Cote aufgehört hat,
Markdown-Files zu benutzen.
Und sie sind wieder zurückgegangen oder nach vorne
gegangen, wie man das auch sehen will, HTML
-Dateien zu benutzen.
Und wie er ja schon richtig sagt, haben
wir uns eigentlich daran gewöhnt, dass die KI
-Agenten mit Markdown kommunizieren.
Der Grund dafür ist natürlich, dass wenig Context
benutzt wird, oder weniger Kontext benutzt wird, weil
es ein Minimum an Steuerzeichen gibt dafür.
Mittlerweile haben wir Kontextfenster in Millionenhöhe, Millionen Tokens,
und auch die Agenten werden natürlich immer komplexer.
Und jetzt kommt man zu so einem Punkt,
wo man merkt, so ein Markdown ist eigentlich
doch sehr eingeschränkt.
Interessant.
Und dieser Tariq beschreibt, dass er echt auch
aufgehört hat, Markdown-Dateien, die 100 Zeilen haben,
überhaupt noch zu lesen.
Das kenne ich auch.
Also du kriegst dann so einen Plan von
der KI, das ist so eine Wall of
Text, die sieht so gleichförmig aus.
Klar, du hast Überschriften und so weiter, das
ist schon einigermaßen nett, aber ich lese mir
das doch nicht mehr ganz durch.
Da habe ich echt überhaupt keine Lust mehr
drauf.
Es ist halt irgendwie so uncharmant.
Du hast keine Hierarchien, also visuelle Hierarchien, und
du hast auch keine Farben und auch keine
Diagramme, die man jetzt wirklich als Diagramm erkennen
kann.
Farben, die in Markdown dargestellt werden, werden halt
mit so Unicode-Zeichen dargestellt.
Also das sind quasi so Emojis als Farbpalette.
Oder sogar ASCII-Code als Architekturdiagramme.
Und das sieht halt so ein bisschen aus,
als ich in meiner ersten Begegnung mit Computern
war, der Vater hat in einem Rechenzentrum gearbeitet,
das war irgendwann Mitte der 80er.
Oh ne, es war sogar Mitte der 70er,
genau genommen.
Und der hatte solche Ausdrucke von irgendwelchen Disney
-Figuren in ASCII, da haben sie also so
Endlospapier von Druckern bedrucken lassen.
Ja, und so macht das Markdown jetzt für
gewisse Diagramme auch wieder.
Aber HTML, im Gegensatz dazu, kann natürlich, jede
Webseite wird mit HTML dargestellt, kann natürlich ganz
tolle Diagramme und alles sehr schön machen.
Man kann also HTML als universelles Ausgabeformat für
Agenten benutzen.
Da kannst du zum Beispiel tabellarische Daten als
echte Tabelle rendern.
Oder du kannst Style Sheets einbetten.
Designentscheidungen kannst du auch direkt visuell kommunizieren.
Du kannst JavaScript einbetten für irgendwelche Interaktivität, Bilder,
alles in einer Datei machen.
Und es gibt kaum eine Information, die Claude
nicht lesen kann, die nicht effektiv im HTML
dargestellt werden kann.
Aha.
In der Praxis, stell dir mal vor, du
willst ein neues Feature erstellen.
Claude schreibt dir halt so einen Markdown-Plan,
wie es das immer macht.
Das sind dann 200 Zeilen, du scrollst einfach
drüber und sagst, ja, das ist okay.
Aber wenn du Claude sagst, mach mir ein
HTML-Dokument.
Du kannst zum Beispiel sagen, mach mir ein
Exploration-Dokument mit sechs verschiedenen Ansätzen für das
Onboarding nebeneinander.
So als Grid.
Und schreib mir auch direkt unten drunter, was
ist der Vorteil und der Nachteil von dieser
Lösung.
Und dann hast du eine Seite, eine HTML
-Seite, die du einfach aufrufen kannst.
Und dort hast du sechs Vorschläge mit Begründungen
unten drunter.
Das ist ja was anderes, als so als
Fleece-Text alle möglichen Ansätze dir beschreiben zu
lassen.
In Markdown dann.
Aha.
Schön fand ich auch einen anderen Ansatz, den
der Typ da beschrieben hat.
Das ist so ein Custom-Editing-Interface.
Das ist so ein Wegwerf-Editor, den du
nur einmal brauchst für die konkrete Aufgabe.
Also jetzt mal als Beispiel hat er genannt,
du hast eine Liste von Aufgaben, die du
priorisieren willst.
Die du aber auch priorisieren willst und die
nicht die KI priorisieren soll.
Wenn die Liste groß ist, ist das natürlich
schon schwer zu handeln.
Und wenn du das mit der KI zusammen
irgendwie entwickeln willst, ist es schwierig.
Und die lassen sich dann einfach eine Seite
kreieren, die so Tickets hat mit Track &
Drop, die du nach oben und unten ziehen
kannst.
Die du auch einordnen kannst, in irgendwelche Bereiche
ziehen kannst als jetzt, jetzt oder später oder
gar nicht.
Du kannst ja dazu gleich noch von Claude
Einschätzungen dazu machen lassen.
Und dann gibt es einen Button und das
ist immer ganz wichtig.
Bei den ganzen Sachen haben die einen Button,
der heißt dann Copy as Markdown.
So ganz kriegst du Markdown also nicht los.
Am Ende ist dann nämlich in diese Markdown
zusammengefiltert genau das, was du als Entscheidung über
diese interaktive HTML-Seite kreiert hast.
Das gibst du dann in einem neuen Chat
dem Claude wieder und er hat eine sehr
schöne vorgefertigte Aufgabe.
Bisher war ja immer das Kontextfenster, das Bottleneck.
Solange die Tokens knapp waren, war halt die
Kompaktheit sehr wichtig.
Aber jetzt, wo du eine Million Tokens hast,
verschiebt sich ja die Frage.
Nicht mehr, wie spare ich Tokens, sondern wie
kriege ich die Menschen dazu, das Ergebnis wirklich
zu lesen und zu nutzen.
Und da gewinnt HTML eindeutig.
Ich habe das Gefühl, beim Essen bist du
aber das Bottleneck.
Können wir jetzt in Limo essen?
Das ist die KI-Kantine.
Wir sitzen in der KI-Kantine.
Die KI-Kantine ist ein Projekt von Michael
Busch, der auch beim nächsten Mal wieder ein
frisches KI-Gericht auftischt mit einer Prise Pommes
und einer Beilage Skepsis.
Wir sitzen in der KI-Kantine.
Hier ist die KI-Kantine.