Die KI Kantine - Der Podcast

Michael Busch

Atlas & Comet – die neue Generation der KI-Browser

Wie Browser plötzlich selbst denken, klicken und schreiben

29.10.2025 7 min

Zusammenfassung & Show Notes

Buschi erinnert sich an die alten Zeiten des Internets – von Mosaic über Netscape bis Chrome – und entdeckt, dass sich das Browser-Rad wieder neu dreht. Diesmal heißen die Konkurrenten nicht Firefox oder Edge, sondern Atlas (von OpenAI) und Comet (von Perplexity). Sie gehören zur neuen Generation der agentischen Browser, die nicht nur anzeigen, sondern selbst handeln: Aktionscodes suchen, Formulare ausfüllen, E-Mails umformulieren oder Videos punktgenau finden. Buschi erzählt, welche Anwendungen wirklich nützlich sind, wo er noch skeptisch bleibt und warum Google mit Chrome hier bald ins Schwitzen kommen könnte.

Die KI-Kantine ist ein Projekt von Michael Busch – Entwickler, Unternehmer und neugieriger Kantinenphilosoph.

Hier geht’s regelmäßig zur Mittagspause um Künstliche Intelligenz im echten Entwickleralltag – verständlich, praxisnah und mit einer Prise Skepsis.

Neue Folgen erscheinen regelmäßig – meistens genau dann, wenn du dir eh gerade ein Tablett schnappst.

📬 Fragen, Feedback oder eigene KI-Erlebnisse? Schreib mir an podcast@ki-kantine.de

Alle Folgen & mehr: https://ki-kantine.letscast.fm/

Transkript

(Transkribiert von TurboScribe.ai. Upgrade auf Unbegrenzt, um diese Nachricht zu entfernen.) Mahlzeit! Sag mal, kannst du dich noch an diesen Netscape-Browser erinnern? Klar, ich kenne sogar noch den Mosaic-Browser. Du bist ja ein echter Digital Native hier, cool! Aus diesem Mosaic-Browser wurde ja dann der Internet Explorer von Microsoft. Die haben da eine Lizenz gekauft. Und irgendwann hatte der bei Microsoft ja 99 % Marktanteil. Und dann gab es ein Kartellverfahren gegen Microsoft. Und als Gegengewicht zu Microsoft gab es ja dann diese Mozilla-Organisation. Die ist wiederum aus dem Netscape entstanden. Das führte dann zum Firefox. Und jetzt gibt es halt Chrome. Und der hat wieder so eine Monopol-ähnliche Größe erreicht. Jetzt hat Chrome dieses Kartellverfahren am Hals gehabt, weil die auch wieder über 90% Marktanteil hatten. Aber hier hat der Richter im Prinzip die Chromes vom Haken wieder gelassen. Weil der hat auch gesehen, dass sich die Welt gerade wieder weiterdreht und es jetzt halt KI-Browser gibt. Aha. Und mit zwei von diesen KI-Browsern habe ich mich jetzt mal ein bisschen beschäftigt. Das ist einmal der Komet von Perplexity und Atlas von OpenAI. Und diese neue Generation von Browsern, die bezeichnen man da als Agentic-Browser. Und über diese KI-Agenten haben wir ja nun schon oft genug geredet. Ich habe ja auch gesagt, dass ich mir echt schwer tue, praktische Anwendungsfälle zu finden, bei denen ich jetzt persönlich dauerhaften Vorteil davon habe. Und das nicht nur einfach mal so ein bisschen Tech-Demo ist und ein bisschen rumspielen. Aber in solchen KI-Browsern, da gibt es tatsächlich eine Menge interessante Use Cases. Ich würde dir gerne mal also den einen oder anderen aufzählen, wenn du so lange noch mit Mittagessen warten kannst. Wegen mir, wenn es unbedingt sein muss. Also der Agent, der surft ja sozusagen mit und kann genauso auf der Webseite agieren, wie du das mit der Maus machst. Du kannst also zum Beispiel in einem Shop sagen, lieber Agent, find doch mal heraus, ob es für diesen Shop einen gültigen Aktionscode gibt. Und dann sucht er im Hintergrund auf den ganzen Seiten nach einem Aktionscode. Testet den auch, ob der auch wirklich gilt, weil wie oft findest du so Aktionscodes, die dann eben nicht mehr gelten. Und kann das für dich einlösen. Oder was ich auch echt gut finde, der kann auf so eine Behördenseite gehen und häufig suchst du ja ein Formular. Und dann musst du dich ja durch diese nicht besonders intelligent strukturierten Verzeichnisse durchhangeln, um ein Formular zu finden, das du als PDF runterladen kannst, um es dann auszufüllen. Das kann der für dich machen. Interessant. Ich hatte den Fall, dass ich so einen Aktienscreener benutzt habe und dort eine lange Liste von Aktien rauskam, die aber weder sortierbar waren, noch irgendwie filterbar waren. Und es waren halt viel zu viele. Und dann habe ich dem KI-Browser gesagt, ich möchte nur diejenigen haben, deren Preis über 5 Dollar ist, um so die Penny Stocks rauszuholen. Und ich hätte auch gerne, dass das Handelsvolumen mindestens eine Million an dem Tag war. Und dann hat er mir die rausgesucht und ohne dass ich das gewollt habe, hat er das noch alle in ein großes Chartbild reingepackt. Das war schon echt überzeugend. Cool. Und über einen anderen Anwendungsfall habe ich gelesen, da hat einer die Lieder, die in einer Radiostation gespielt werden, die wollte er gerne umwandeln in eine Playlist bei Spotify. Und dann hat er das dem Agent beschrieben, hat ihm auch ermöglicht, sich in seinen Spotify -Account einzuloggen. Und dann ist er auf die Suche gegangen, wo ist denn diese Playlist in der Radiostation? Und hat die jetzt alle rausgesucht, hat die bei Spotify rausgesucht und daraus eine Playlist generiert. Ich habe zwar immer ein bisschen Probleme mit seinen ganzen Zugangsdaten und so weiter, wenn man das der KI gibt, bin ich da nicht so glücklich, aber das wollen wir hier mal außen vor lassen. Technisch finde ich das schon ziemlich geil. Auch so ganz profane Dinge sind jetzt viel einfacher. Wenn ich eine Mail schreibe, dann kann ich den Mailtext markieren und das erkennt der Browser sofort, dass da was markiert ist und er schlägt dir dann vor, soll ich den Text umformulieren. Das kann auch mal ganz hilfreich sein. Und weil es ja direkt im Browser passiert und jetzt sagen wir mal in Gmail, direkt im Browser passiert, hast du nicht mehr diese Copy und Paste Thematik. Finde ich echt vereinfachend. Cool. Was du zum Beispiel auch machen kannst, nach Videos oder Video Ausschnitten zu suchen. Also ich habe so ein Demo gesehen, wo der die Aufgabe gegeben hat, such mir den Ausschnitt der Mondlandung heraus und spule genau zu dem Satz, den da Nils Armstrong gesagt hat mit den kleinen Schritten, großen Schritten. Das hat sogar funktioniert. Was mich allerdings wundert ist, wieso das nicht schon alles im Chrome selber drin ist. Also die haben doch auch Gemini, die sind doch auch ganz vorne dabei bei dem ganzen KI Thema. Aber im Chrome findest du das alles nicht. Deshalb kann es schon sein, dass da Marktanteile verloren gehen an Atlas, Komet oder wie sie alle heißen. Aber vielleicht ist auch Google gar nicht so unrecht im Hinblick auf diese Kartellklage. Wenn ich aber meine ganzen Mails, die bei Gmail sind, eigentlich nur über Open AI sinnvoll auswerten kann, dann finde ich schon, ist das irgendwie ein Schritt zu viel. Und welcher ist jetzt der bessere von den beiden KI Browsern? Das ist gar nicht so einfach zu sagen. Der Komet von Perplexity, den finde ich eigentlich praktischer. Irgendwie fühlt sich das runder an. Du bist doch dauerhaft in diesem Agentic Mode. Beim Atlas musst du das erst immer wieder anschalten. Dann machst du einen neuen Chat und dann musst du wieder sagen, bitte jetzt hier, Handle als Agent. Andererseits bin ich natürlich zahlender Kunde bei Open AI und habe da diesen Chat-GPT-Plus -Vertrag. Und dadurch habe ich da natürlich ein paar Vorteile. Zusätzlich dazu ist auch alles, was ich in dieser Chat-GPT-Desktop App habe, habe ich auch in dem Browser. Also ein anderes Tab ist das. Und dadurch habe ich natürlich weniger Apps, die ich gleichzeitig benutzen muss. Und das macht es natürlich schon noch ein bisschen einfacher. Ich finde ja, ohne Humer ist auch vieles einfacher. Können wir jetzt in Limo essen? Die KI-Kantine ist ein Projekt von Michael Busch, der auch beim nächsten Mal wieder ein frisches KI-Gericht auftischt mit einer Prise Bronze. Und einer Beilage Skepsis.