Werbung



NewsKITellerrand

Google macht Gemini zur Agenten-Plattform: Neue Modelle, Tools und KI-Erlebnisse

Google Gemini Agenten

Werbung



Google stellt auf der Entwicklerkonferenz I/O seine KI-Strategie neu auf. Statt reiner Chatbots rücken autonome Agenten, multimodale Modelle und tief integrierte Produktfunktionen in den Mittelpunkt.

Gemini 3.5 Flash, Antigravity 2.0 und Spark: KI-Agenten für Code, Arbeit und Alltag

Mit Gemini 3.5 Flash führt Google ein neues KI-Modell ein, das laut Unternehmen besonders für Programmierung und autonome Agenten optimiert ist. Flash kann eigenständig Coding-Pipelines ausführen, Forschungsprojekte managen und hat in internen Tests ein Betriebssystem von Grund auf gebaut. Das Modell soll die bisherige Spitzengeneration Gemini 3.1 Pro bei Code, Agenten-Aufgaben und multimodaler Argumentation übertreffen und dabei bis zu viermal schneller sein, in einer optimierten Variante sogar zwölfmal schneller bei gleicher Qualität.

Parallel dazu erscheint Antigravity 2.0 als Desktop-App mit Kommandozeilenwerkzeug und SDK. Nutzer:innen können darin mehrere Agenten gleichzeitig orchestrieren, Subagenten-Workflows entwerfen und Hintergrundaufgaben planen. Die Integration mit Google AI Studio, Android und Firebase sowie native Sprachbefehle sollen den Einsatz im Entwicklungsalltag erleichtern. Antigravity setzt stark auf Gemini 3.5 Flash und dient auch als Grundlage für Agentenfunktionen in der Suche.

Mit Gemini Spark kündigt Google einen persönlichen 24/7-Agenten mit enger Workspace-Anbindung an. Spark basiert auf Gemini und Antigravity, läuft auf dedizierten virtuellen Maschinen in der Google Cloud und soll langlaufende Aufgaben mit wenig Aufsicht übernehmen. Der Agent ist direkt mit Gmail, Docs und weiteren Workspace-Diensten verknüpft, kann per eigener Gmail-Adresse angesprochen werden und über Chrome im Web agieren. Auf Android lässt sich der Fortschritt über das neue Halo-System verfolgen. Spark wird zunächst für Google-AI-Ultra-Abonnent:innen getestet und soll später breiter ausgerollt werden.

Suche, Gmail und Workspace: Google verwebt KI-Agenten mit Alltagsdiensten

Die klassische Trefferliste in der Google-Suche tritt in den Hintergrund. Ein neu gestaltetes, KI-basiertes Suchfeld ermöglicht längere, gesprächsartige Anfragen und schlägt komplexere Suchformulierungen vor. KI-Überblicke lassen sich in einem speziellen Modus mit Rückfragen vertiefen. Künftig können Nutzer:innen in der Suche eigene „Informationsagenten“ anlegen, die rund um die Uhr Entwicklungen im Netz verfolgen, auswerten und bei erfüllten Bedingungen mit kompakten Berichten und weiterführenden Links informieren.

Suchergebnisse werden mit einem generativen Nutzerinterface angereichert, das dynamische Layouts, interaktive Visualisierungen und persistente Projektbereiche erzeugt. Über Antigravity lassen sich in der Suche zudem kleine, zustandsbehaftete Mini-Apps erstellen, etwa für Mahlzeitenplanung auf Basis des eigenen Kalenders oder individuelle Fitnessziele. Diese Funktionen bauen auf Gemini Flash 3.5 und Antigravity auf und sollen im Sommer kostenlos für alle Suchnutzer:innen starten, während Mini-Apps und Informationsagenten zuerst für AI-Pro- und Ultra-Abos vorgesehen sind.

In Gmail erweitert Google die KI-Erfahrung mit „Gmail Live“, einer sprach- und chatbasierten Schicht auf Basis von Gemini. Statt Schlagwörter einzugeben, könnt ihr natürlich formulierte Fragen zu Inhalten in eurem Posteingang stellen, Rückfragen stellen oder Themen wechseln. Die KI erkennt feine Bedeutungsunterschiede, zieht Detailinformationen wie Zimmernummern aus Mails und kann aus dem Kontext erschließen, auf welche Personen sich eine Frage bezieht. Gmail erhält außerdem Funktionen für fertige Entwürfe, schnellen Dateizugriff und Aufgabenverwaltung, während die bereits eingeführte „AI Inbox“ von Ultra- auf Pro- und Plus-Abos ausgeweitet wird. Gmail Live startet im Sommer zunächst exklusiv für AI-Ultra-Abonnent:innen.

Zusätzlich bringt Google Sprachsteuerung in Docs und Keep. In Docs lassen sich mit der Stimme Entwürfe erstellen, Informationen aus Drive und E-Mails zusammenführen und innerhalb einer Eingabe mehrere Änderungswünsche äußern. In Keep verwandelt KI gesprochene Notizen in strukturierte Einträge oder Listen. Die gleichen Sprachfunktionen ziehen auch in Gmail ein, um komplexe Abfragen an Gemini per Sprache zu ermöglichen.

Neue KI-Erlebnisse: Street-View-Simulation, Design-App, Video-KI und Shopping-Agenten

Mit Genie 3 verknüpft Google sein Weltmodell nun direkt mit Street View. Auf Basis von rund 280 Milliarden Bildern aus 110 Ländern können Ultra-Nutzer:innen in den USA erste Simulationen realer Straßenumgebungen erzeugen, etwa mit veränderter Witterung oder seltenen Lichtsituationen. Das System dient sowohl Menschen als auch Robotern als Trainingsumgebung, etwa für autonome Fahrzeuge von Waymo, die damit extrem seltene Ereignisse testen können. Die Simulationen sind derzeit eher videogameartig, nicht fotorealistisch, und noch nicht physikbewusst, entwickeln aber bereits eine räumlich konsistente Umgebung.

Für Designaufgaben startet Google die KI-App Pics in Workspace. Aus Texteingaben generiert Pics Grafiken, Einladungen, Marketingmaterialien und Mockups und erlaubt anschließend gezielte Bearbeitungen einzelner Bildelemente per Klick, Kommentar oder direkter Änderung. Die Anwendung basiert auf Nano Banana 2 und ist eng in Workspace integriert, um gemeinsame Bearbeitung und Freigaben zu unterstützen. Pics wird zunächst mit Tester:innen erprobt und im Sommer für AI-Ultra-Abonnent:innen freigeschaltet.

Mit Gemini Omni führt Google eine neue Familie multimodaler Modelle ein, die Inhalte aus Text, Bildern, Audio und Video erzeugen können. Die erste Variante, Gemini Omni Flash, erstellt kurze Videos von rund zehn Sekunden Länge und kann dabei physikalische Zusammenhänge und Fakten berücksichtigen. Nutzer:innen können Fotos per Textanweisung bearbeiten und persönliche Video-Avatare erzeugen, die nach einem Onboarding-Prozess verfügbar bleiben. Alle generierten Videos tragen ein SynthID-Wasserzeichen. Omni Flash wird in der Gemini-App, in YouTube Shorts und im Kreativstudio Flow eingesetzt, weitere Modelle wie Omni Pro sollen folgen und per API zugänglich werden.

Für Shopping bündelt Google mit Universal Cart Einkäufe über Suche, Gemini, YouTube und Gmail hinweg. Produkte lassen sich aus verschiedenen Quellen in einen zentralen Warenkorb legen, Rabatte und Preisverläufe werden verfolgt, und KI kann etwa Inkompatibilitäten bei PC-Komponenten aufdecken oder Sparmöglichkeiten mit Google Wallet und Punkten aufzeigen. Über das offene Universal-Commerce-Protokoll ist Checkout direkt bei Google oder auf Händlerseiten möglich. Universal Cart startet in den USA und kommt im Sommer in die Gemini-App, weitere Dienste sowie zusätzliche Länder und Kategorien folgen.

Parallel dazu entwickelt Google mit dem Agent-Payments-Protokoll AP2 eine Infrastruktur, über die KI-Agenten innerhalb klarer Grenzen eigenständig Zahlungen auslösen können. Nutzer:innen können Marken, Produkte und Ausgabelimits definieren; erfüllt ein Agent diese Bedingungen, führt er den Kauf automatisch aus. AP2 setzt auf verschlüsselte, nachvollziehbare Verknüpfungen zwischen Nutzer:in, Händler und Zahlungsdienst sowie fälschungssichere Protokolle für Reklamationen.

Via: techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com · techcrunch.com

Den Beitrag in unserem Forum kommentieren

Werbung



Tags: Pics, Android, Universal Cart, Google, Google-Suche, Gemini, KI-Agenten, Gmail, Antigravity, Gemini Omni

Ähnliche Artikel

Werbung



Einkaufstipps
Beliebte Artikel

Werbung