Google flasht alle – das neue Gemini Flash 1.5 nimmt es mit GPT-4o auf

blank
Von
Jugo Mobile
Jugo Mobile ist eine Plattform, die sich hochwertigem Inhalt in den Bereichen Gaming, Sport und Technik widmet. Engagieren Sie sich mit hochwertigem Inhalt und vernetzen Sie...
4 Minuten Lesezeit

Google hat ein neues Mitglied der Gemini-Familie künstlicher Intelligenzmodelle auf den Markt gebracht. Gemini Flash liegt zwischen dem geräteinternen Nano und dem cloudbasierten Pro und ist für Chats, komplexe Aufgaben, die eine schnelle Reaktion erfordern, sowie die Verarbeitung von Bildern, Videos und Sprache konzipiert.

Gemini Flash 1.5 wurde auf der jährlichen Google I/O-Entwicklerveranstaltung vorgestellt und ist ein natives multimodales Modell, das dem kürzlich vorgestellten GPT-4o von OpenAI ähnelt und auf Geschwindigkeit ausgelegt ist, was es für Echtzeitgespräche nützlich macht.

Das neue Modell ist derzeit weltweit für Entwickler zur Verwendung in ihren eigenen Anwendungen verfügbar, sodass wir bald eine Reihe von Live-Chat-Apps von Drittanbietern sehen könnten, die mit Gemini Flash 1.5 erstellt wurden.

Wir haben auch ein Upgrade auf Gemini Pro 1.5 gesehen, das Anfang des Jahres erstmals veröffentlichte Modell, und die Nachricht, dass es nun den Premium-Chatbot Gemini Advanced unterstützen wird.

Was macht Gemini Flash 1.5 anders?

Gemini Flash 1.5

(Bildnachweis: Google)

Gemini Flash 1.5 liegt in der Größenhierarchie knapp über Nano und knapp unter Pro und was es nicht nur von seinen Geschwistern, sondern auch von anderen KI-Modellen unterscheidet, ist die Kombination aus Geschwindigkeit und Agilität.

Flash 1.5 ist nicht nur schnell und beeindruckend in der Fähigkeit, Text, Bilder, Videos und Sprache zu verstehen, sondern auch günstig – zumindest im Vergleich zu Pro, das 20-mal teurer ist.

„Aus dem Feedback der Nutzer wissen wir, dass einige Anwendungen eine geringere Latenz und geringere Bereitstellungskosten benötigen“, sagte Demis Hassabis, CEO von Google DeepMind. „Das hat uns zu weiteren Innovationen inspiriert“, fügte er hinzu und stellte Flash als „ein Modell vor, das leichter als 1.5 Pro ist und schnell und effizient für den Einsatz in großem Maßstab konzipiert ist.“

Ein guter Vergleich, zumindest was die Geschwindigkeit betrifft, ist das kürzlich angekündigte GPT-4o-Modell von OpenAI. Es ist sehr schnell, nativ multimodal und für die Interaktion in Echtzeit konzipiert. Allerdings scheint Gemini Flash 1.5 in Bezug auf die Argumentation ein weniger leistungsfähiges Modell zu sein.

Was ist mit dem riesigen Kontextfenster?

Gemini 1.5 Flash-Token

(Bildnachweis: Google)

Wie andere Modelle der Gemini-Familie verfügt Flash 1.5 über ein riesiges Kontextfenster mit einer Million Token und das Versprechen, es tatsächlich vollständig nutzen zu können. Im Vergleich dazu hat GPT-4o ein Inhaltsfenster von 128.000 Token und Claude 3 liegt bei 200.000 Token.

Was ein großes Kontextfenster so wichtig macht, ist die Fähigkeit, innerhalb einer einzigen Konversation eine große Menge an Informationen im Gedächtnis zu speichern. Dies ist von entscheidender Bedeutung, wenn es um die Analyse von Nicht-Text-Inhalten geht, denn ein Bild sagt mehr als 1.000 Worte und ein Video sogar noch mehr.

Es wurde auch von seinem großen Bruder Gemini Pro 1.5 trainiert. Hassabis sagte, dies sei „durch einen Prozess namens ‚Destillation‘ geschehen, bei dem die wesentlichsten Kenntnisse und Fähigkeiten eines größeren Modells auf ein kleineres, effizienteres Modell übertragen werden.“

„1.5 Flash zeichnet sich durch Zusammenfassungen, Chat-Anwendungen, Bild- und Videountertitel, Datenextraktion aus langen Dokumenten und Tabellen und mehr aus“, sagte er als Ergebnis dieses Prozesses.

Da diese Modelle, einschließlich der schnelleren, aber kleineren Modelle wie Flash, die Fähigkeit erlangen, mehr als nur Text zu verstehen, wird das vergrößerte Kontextfenster noch wichtiger.

  • Vorschau auf Google I/O 2024: Alles, was wir als Ankündigung erwarten
  • Google testet generative KI in seinen Hauptsuchergebnissen – das wissen wir
  • Apple AI kommt – und es könnte sich auf diese drei Dinge konzentrieren
Diesen Artikel teilen
Folgen
Jugo Mobile ist eine Plattform, die sich hochwertigem Inhalt in den Bereichen Gaming, Sport und Technik widmet. Engagieren Sie sich mit hochwertigem Inhalt und vernetzen Sie sich mit anderen Enthusiasten und Experten. Entdecken Sie die neuesten Trends und Innovationen in unserer lebendigen Community. Treten Sie uns bei und erleben Sie die Zukunft noch heute!