Aktualisieren:Heute ist Google I/O. Folgen Sie unserenLive-Blog zur Google I/O 2024für alle wichtigen Neuigkeiten, sobald sie passieren.
Google veranstaltet am Dienstag (14. Mai) Google I/O 2024, und während des jährlichen Entwickler-Events wird es zwar neue Updates für Mobil-, Heim- und tragbare Geräte geben, aber die KI wird im Mittelpunkt stehen.
Google Gemini ist die Familie künstlicher Intelligenzmodelle des Suchgiganten, die bei allem, was Google macht, zunehmend eine zentrale Rolle spielt – vom Ersatz des Assistant auf Android bis hin zur Unterstützung der Analyse von Suchergebnissen.
Was wir bei I/O wahrscheinlich sehen werden, ist eine neue Version von Gemini, eine weitere Integration über noch mehr Produkte hinweg und multimodale Funktionen für den Gemini-Chatbot, die ihm erstmals die Möglichkeit geben, Sprache, Code, Musik und Videos zu verarbeiten. (Was Google ankündigt, können Sie selbst in unserem Leitfaden zum Streamen der Google I/O-Keynote nachlesen.)
Gerüchten zufolge könnte Gemini auch einige der bekannteren Funktionen des Konkurrenten OpenAI ChatGPT übernehmen, darunter den persistenten Speicher für alle Konversationen. Doch da OpenAI sein neues Modell GPT-4o mit integriertem Sprachassistenten und Bildverarbeitungsfunktionen vorstellt, muss Google aufholen.
Was Sie von den Gemini-Modellen erwarten können

Google verwirrt die Leute gern – oder zumindest fühlt es sich manchmal so an. Der Name Gemini bezieht sich auf die zugrunde liegenden großen Sprachmodelle, den Assistant-Ersatz auf Android, den Chatbot und die KI-Autovervollständigung im Arbeitsbereich.
Um die Sache noch verwirrender zu machen, gibt es drei Versionen von Gemini. Die erste ist Nano, die auf Telefonen und kleinen Geräten läuft, Pro, das in der Cloud läuft und den Assistenten und die kostenlose Version des Gemini-Chatbots antreibt. Ultra ist das leistungsstärkste Modell – zumindest auf dem Papier – und es treibt das 20 $/Monat teure Gemini Advanced an.
Anfang des Jahres stellte Google Gemini Pro 1.5 vor. Dies war ein großes Upgrade gegenüber der vorherigen Generation von Gemini, da es besseres Verständnis, Musik- und Videoeingabe sowie ein riesiges Kontextfenster mit einer Million Token hinzufügte – so viele Daten kann es aus einer einzelnen Konversation speichern und referenzieren.
Gemini Pro 1.5 ist weiterhin nur für Entwickler und Forscher verfügbar. Es verfügt zwar nicht über die gleiche Funktionalität wie Gemini Ultra, ist aber in vielerlei Hinsicht leistungsfähiger.
Ich vermute, dass wir bei Google I/O eine gewisse Korrektur dieser Situation sehen werden, indem wir für jedes der kostenlosen Modelle der Familie Versions-Upgrades der Version 1.5 herausbringen. Sie werden wahrscheinlich auch für den Gemini-Chatbot und den Android Assistant verfügbar gemacht.
Neue KI-Funktionen bei Google I/O
Google hat bereits eine neue Version von Gemini vorgestellt, die Googles Sprachassistenten und Videofunktionen nutzt, um zu beschreiben, was im Blickfeld Ihrer Kamera passiert, und Hilfestellung zu leisten. Wir erwarten, noch viel mehr über diese Funktion zu erfahren.
Gemini kann viel mehr, als derzeit über Chat- oder Sprachschnittstellen möglich ist. Dazu gehört auch die Aufnahme von Video- und Musikinhalten. Ich vermute, dass beide aktualisiert werden, um diese neuen Eingabeoptionen bei I/O hinzuzufügen.
Ich denke, wir werden auch eine Integration mit anderen Google-Produkten und -Diensten erleben, die Fotos, Dokumenten und Präsentationen mehr generative KI-Funktionen verleihen. Diese werden auch enger in den Gemini Assistant und den Chatbot integriert.
Einer der nützlicheren Aspekte von Gemini gegenüber ChatGPT ist seine tiefe Integration in das Google-Ökosystem. Es ist über Erweiterungen zugänglich und umfasst den Zugriff auf die Suche, Flugkarten, alle Ihre Dokumente und natürlich YouTube. Sogar YouTube Music wird dieser Erweiterungsliste hinzugefügt – allerdings nur in der Android-Assistentenversion von Gemini.
Obwohl es unwahrscheinlich ist, könnte es sein, dass Google Drittanbieter zur Erweiterungsliste hinzufügt. Dies würde die Funktionalität widerspiegeln, die in ChatGPT und Microsoft Copilot verfügbar ist. Wenn Google dies tatsächlich integriert, könnten Unternehmen wie Uber und Kayak auf Gemini zugreifen. In Assistant könnten Sie beispielsweise eine Reise planen und alle Buchungen direkt im Chat verwalten, wenn dies passieren würde.
Google gegen die KI-Konkurrenz

In Sachen KI bewegt sich die Welt weg vom Text und hin zur Sprache. Dies zeigt sich daran, dass jedes KI-Labor an synthetischen Sprachlösungen arbeitet.
Außerdem bewegen wir uns weg vom Chat und hin zu Agenten, bei denen Sie die KI anweisen, eine Reihe von Aufgaben in Ihrem Namen auszuführen, anstatt nur ein freundliches Gespräch zu führen.
Das ist etwas, was wir bereits von OpenAI sehen. Apple soll dies auch als Ansatz für Siri 2.0 betrachten, das wir nächsten Monat auf der WWDC 2024 erwarten. Und in gewissem Maße macht Google Versionen davon mit dem Gemini Assistant auf Android.
- Google Pixel 8a im Praxistest: Gleicher niedriger Preis, intelligentere KI
- Vorschau auf Google I/O 2024: Alles, was wir ankündigen werden
- 7 Ideen für Google Gemini-Eingabeaufforderungen, die Sie sofort ausprobieren können