Atlas & Comet – die neue Generation der KI-Browser
Wie Browser plötzlich selbst denken, klicken und schreiben
29.10.2025 7 min
Zusammenfassung & Show Notes
Buschi erinnert sich an die alten Zeiten des Internets – von Mosaic über Netscape bis Chrome – und entdeckt, dass sich das Browser-Rad wieder neu dreht. Diesmal heißen die Konkurrenten nicht Firefox oder Edge, sondern Atlas (von OpenAI) und Comet (von Perplexity). Sie gehören zur neuen Generation der agentischen Browser, die nicht nur anzeigen, sondern selbst handeln: Aktionscodes suchen, Formulare ausfüllen, E-Mails umformulieren oder Videos punktgenau finden. Buschi erzählt, welche Anwendungen wirklich nützlich sind, wo er noch skeptisch bleibt und warum Google mit Chrome hier bald ins Schwitzen kommen könnte.
Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.
Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.
📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Alle Folgen & mehr: https://ki-kantine.letscast.fm/
Transkript
(Transkribiert von TurboScribe.ai. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit!
Sag mal, kannst du dich noch an diesen
Netscape-Browser erinnern?
Klar, ich kenne sogar noch den Mosaic-Browser.
Du bist ja ein echter Digital Native hier,
cool!
Aus diesem Mosaic-Browser wurde ja dann der
Internet Explorer von Microsoft.
Die haben da eine Lizenz gekauft.
Und irgendwann hatte der bei Microsoft ja 99
% Marktanteil.
Und dann gab es ein Kartellverfahren gegen Microsoft.
Und als Gegengewicht zu Microsoft gab es ja
dann diese Mozilla-Organisation.
Die ist wiederum aus dem Netscape entstanden.
Das führte dann zum Firefox.
Und jetzt gibt es halt Chrome.
Und der hat wieder so eine Monopol-ähnliche
Größe erreicht.
Jetzt hat Chrome dieses Kartellverfahren am Hals gehabt,
weil die auch wieder über 90% Marktanteil
hatten.
Aber hier hat der Richter im Prinzip die
Chromes vom Haken wieder gelassen.
Weil der hat auch gesehen, dass sich die
Welt gerade wieder weiterdreht und es jetzt halt
KI-Browser gibt.
Aha.
Und mit zwei von diesen KI-Browsern habe
ich mich jetzt mal ein bisschen beschäftigt.
Das ist einmal der Komet von Perplexity und
Atlas von OpenAI.
Und diese neue Generation von Browsern, die bezeichnen
man da als Agentic-Browser.
Und über diese KI-Agenten haben wir ja
nun schon oft genug geredet.
Ich habe ja auch gesagt, dass ich mir
echt schwer tue, praktische Anwendungsfälle zu finden, bei
denen ich jetzt persönlich dauerhaften Vorteil davon habe.
Und das nicht nur einfach mal so ein
bisschen Tech-Demo ist und ein bisschen rumspielen.
Aber in solchen KI-Browsern, da gibt es
tatsächlich eine Menge interessante Use Cases.
Ich würde dir gerne mal also den einen
oder anderen aufzählen, wenn du so lange noch
mit Mittagessen warten kannst.
Wegen mir, wenn es unbedingt sein muss.
Also der Agent, der surft ja sozusagen mit
und kann genauso auf der Webseite agieren, wie
du das mit der Maus machst.
Du kannst also zum Beispiel in einem Shop
sagen, lieber Agent, find doch mal heraus, ob
es für diesen Shop einen gültigen Aktionscode gibt.
Und dann sucht er im Hintergrund auf den
ganzen Seiten nach einem Aktionscode.
Testet den auch, ob der auch wirklich gilt,
weil wie oft findest du so Aktionscodes, die
dann eben nicht mehr gelten.
Und kann das für dich einlösen.
Oder was ich auch echt gut finde, der
kann auf so eine Behördenseite gehen und häufig
suchst du ja ein Formular.
Und dann musst du dich ja durch diese
nicht besonders intelligent strukturierten Verzeichnisse durchhangeln, um ein
Formular zu finden, das du als PDF runterladen
kannst, um es dann auszufüllen.
Das kann der für dich machen.
Interessant.
Ich hatte den Fall, dass ich so einen
Aktienscreener benutzt habe und dort eine lange Liste
von Aktien rauskam, die aber weder sortierbar waren,
noch irgendwie filterbar waren.
Und es waren halt viel zu viele.
Und dann habe ich dem KI-Browser gesagt,
ich möchte nur diejenigen haben, deren Preis über
5 Dollar ist, um so die Penny Stocks
rauszuholen.
Und ich hätte auch gerne, dass das Handelsvolumen
mindestens eine Million an dem Tag war.
Und dann hat er mir die rausgesucht und
ohne dass ich das gewollt habe, hat er
das noch alle in ein großes Chartbild reingepackt.
Das war schon echt überzeugend.
Cool.
Und über einen anderen Anwendungsfall habe ich gelesen,
da hat einer die Lieder, die in einer
Radiostation gespielt werden, die wollte er gerne umwandeln
in eine Playlist bei Spotify.
Und dann hat er das dem Agent beschrieben,
hat ihm auch ermöglicht, sich in seinen Spotify
-Account einzuloggen.
Und dann ist er auf die Suche gegangen,
wo ist denn diese Playlist in der Radiostation?
Und hat die jetzt alle rausgesucht, hat die
bei Spotify rausgesucht und daraus eine Playlist generiert.
Ich habe zwar immer ein bisschen Probleme mit
seinen ganzen Zugangsdaten und so weiter, wenn man
das der KI gibt, bin ich da nicht
so glücklich, aber das wollen wir hier mal
außen vor lassen.
Technisch finde ich das schon ziemlich geil.
Auch so ganz profane Dinge sind jetzt viel
einfacher.
Wenn ich eine Mail schreibe, dann kann ich
den Mailtext markieren und das erkennt der Browser
sofort, dass da was markiert ist und er
schlägt dir dann vor, soll ich den Text
umformulieren.
Das kann auch mal ganz hilfreich sein.
Und weil es ja direkt im Browser passiert
und jetzt sagen wir mal in Gmail, direkt
im Browser passiert, hast du nicht mehr diese
Copy und Paste Thematik.
Finde ich echt vereinfachend.
Cool.
Was du zum Beispiel auch machen kannst, nach
Videos oder Video Ausschnitten zu suchen.
Also ich habe so ein Demo gesehen, wo
der die Aufgabe gegeben hat, such mir den
Ausschnitt der Mondlandung heraus und spule genau zu
dem Satz, den da Nils Armstrong gesagt hat
mit den kleinen Schritten, großen Schritten.
Das hat sogar funktioniert.
Was mich allerdings wundert ist, wieso das nicht
schon alles im Chrome selber drin ist.
Also die haben doch auch Gemini, die sind
doch auch ganz vorne dabei bei dem ganzen
KI Thema.
Aber im Chrome findest du das alles nicht.
Deshalb kann es schon sein, dass da Marktanteile
verloren gehen an Atlas, Komet oder wie sie
alle heißen.
Aber vielleicht ist auch Google gar nicht so
unrecht im Hinblick auf diese Kartellklage.
Wenn ich aber meine ganzen Mails, die bei
Gmail sind, eigentlich nur über Open AI sinnvoll
auswerten kann, dann finde ich schon, ist das
irgendwie ein Schritt zu viel.
Und welcher ist jetzt der bessere von den
beiden KI Browsern?
Das ist gar nicht so einfach zu sagen.
Der Komet von Perplexity, den finde ich eigentlich
praktischer.
Irgendwie fühlt sich das runder an.
Du bist doch dauerhaft in diesem Agentic Mode.
Beim Atlas musst du das erst immer wieder
anschalten.
Dann machst du einen neuen Chat und dann
musst du wieder sagen, bitte jetzt hier, Handle
als Agent.
Andererseits bin ich natürlich zahlender Kunde bei Open
AI und habe da diesen Chat-GPT-Plus
-Vertrag.
Und dadurch habe ich da natürlich ein paar
Vorteile.
Zusätzlich dazu ist auch alles, was ich in
dieser Chat-GPT-Desktop App habe, habe ich
auch in dem Browser.
Also ein anderes Tab ist das.
Und dadurch habe ich natürlich weniger Apps, die
ich gleichzeitig benutzen muss.
Und das macht es natürlich schon noch ein
bisschen einfacher.
Ich finde ja, ohne Humer ist auch vieles
einfacher.
Können wir jetzt in Limo essen?
Die KI-Kantine ist ein Projekt von Michael
Busch, der auch beim nächsten Mal wieder ein
frisches KI-Gericht auftischt mit einer Prise Bronze.
Und einer Beilage Skepsis.