Google Machte Gemini Zu Einem „übervorsichtigen“ Mittleren Manager – Was Zu Ungenauen Bildern Und Gegenreaktionen Führte

Inhalt

Was ist bei Zwillingen schief gelaufen?
Was sind die Auswirkungen?
Was kann Google tun, um das Problem zu beheben?

Google wurde diese Woche von Beschwerden und Gegenreaktionen von Nutzern heimgesucht, nachdem sein Gemini AI-Chatbot begann, in der Vergangenheit ungenaue Bilder von Menschen zu erstellen.

Die KI weigerte sich außerdem, bestimmte Bilder zu erstellen, in denen es um Rassenzugehörigkeit ging, was dazu führte, dass der Suchriese Geminis Fähigkeit deaktivierte, jedes Bild einer Person zu erstellen: lebend, tot oder fiktiv.

Es gibt bereits Beschränkungen hinsichtlich dessen, was Zwillinge schaffen können, einschließlich Beschränkungen für die Darstellung realer Menschen. Das Problem ist, dass diese Beschränkungen offenbar zu streng festgelegt sind und dies zu erheblichen Gegenreaktionen geführt hat.

Google sagt, dass das Problem gelöst werden wird und derzeit nach einer sicheren Möglichkeit gesucht wird, die Anweisungen anzupassen.

Was ist bei Zwillingen schief gelaufen?

Zwillinge selbst erschaffen die Bilder nicht wirklich. Der Chatbot verhält sich wie ein mittlerer Manager, der die Anfragen entgegennimmt, seine eigene Interpretation in die Eingabeaufforderung einstreut und sie an Imagen 2 weiterleitet, den Bildgenerator mit künstlicher Intelligenz, der vom DeepMind AI-Labor von Google entwickelt wurde.

Die Probleme scheinen aus dieser mittleren, spröden Phase zu kommen. Gemini verfügt über eine Reihe von Kernanweisungen, die zwar nicht von Google bestätigt wurden, aber wahrscheinlich als Diversitätsfilter für jede Anfrage einer Person fungieren, die eine alltägliche Aufgabe erledigt – aus irgendeinem Grund wurde dies auf alle Personenbilder angewendet.

Yishan Wong, ehemaliger Reddit-CEO und Gründer des Klimawandel-Aufforstungsunternehmens Terraformation schrieb auf X dass das Problem mit den historischen Zahlen Google wahrscheinlich überrascht hat.

„Das ist nicht unvernünftig, wenn man bedenkt, dass sie ein globales Publikum haben“, sagte er über den Diversity-Filter. „Vielleicht sind Sie damit nicht einverstanden, aber es ist nicht unvernünftig. Google hat das höchstwahrscheinlich nicht vorhergesehen oder beabsichtigt.“ Das Ergebnis ist, dass historische Persönlichkeiten vernünftigerweise weiß sein sollten.“

Was sind die Auswirkungen?

Ryan Carrier, CEO der KI-Zertifizierungs- und Sicherheitsagentur for Humanity, sagte gegenüber Jugo Mobile, dass in den Gemini-Anweisungen wahrscheinlich ein „fest codierter Diversitätsfilter“ enthalten sei. Er sagte, dies sei „ähnlich einer positiven Aktion für Bilder“ und könne illegal sein.

Er sagte gegenüber Jugo Mobile: „Angesichts der jüngsten Gerichtsurteile, dass positive Maßnahmen einer umgekehrten Diskriminierung gleichkommen, steht dieser ‚Vielfalt‘-Filter auf der falschen Seite des Gesetzes, ganz zu schweigen von einer bedeutsamen Abweichung von der Genauigkeit.“

Ich habe versucht, einige der Eingabeaufforderungen zu reproduzieren, etwa Bilder von Menschen aus dem mittelalterlichen England zu erstellen, und zwar mit ImageFX, dem KI-Bildtool von Google Labs, das ebenfalls auf Imagen 2 aufbaut. Dadurch wird der Diversitätsfilter in Gemini effektiv umgangen und das Modell direkt abgefragt .

Es spiegelte die historische Realität korrekt wider, anstatt einen Farb- oder Rassenfilter auf die Bilder anzuwenden und alle „positiven Diskriminierungs“-Regeln zu erfüllen, die bei Zwillingen gelten.

„Dieses Ereignis ist bedeutsam, weil es ein eindrucksvoller Beweis dafür ist, dass jemand einem LLM eine Reihe von Anweisungen gibt und die Ergebnisse überhaupt nicht das sind, was er vorhergesagt hat“, erklärte Wong.

Was kann Google tun, um das Problem zu beheben?

Es handelt sich nicht unbedingt um ein Problem des mittleren Managers. ChatGPT funktioniert beim Senden von Anfragen an das DALL-E 3-Modell auf ähnliche Weise, und sowohl Sora als auch die neuen Stable Diffusion 3-Modelle verwenden bei der Generierung von Bildern eine Transformatorarchitektur und Filter.

Das Problem scheint eng mit den Beschränkungen verbunden zu sein, die Google Gemini auferlegt hat und die der Suchriese nach eigenen Angaben beheben wird. und erklärte, dass es „das Ziel verfehlt“ habe.

„Die KI-Bildgenerierung von Gemini generiert tatsächlich ein breites Spektrum an Menschen. Und das ist im Allgemeinen gut so, weil Menschen auf der ganzen Welt es nutzen. Aber hier verfehlt es das Ziel“, sagte Jack Krawczyk, Senior Director von Gemini Experiences, am Mittwoch.

Krawczyk war nach der Gegenreaktion gezwungen, auf X privat zu bleiben und seine Tweets vor der Mehrheit der Nutzer zu verbergen, sagte aber zunächst: „Wir arbeiten daran, diese Art von Darstellungen sofort zu verbessern.“

Chrome-Benutzer können jetzt KI nutzen, um beim Schreiben von Texten zu helfen – so funktioniert es
Google Gemini: Alles, was wir über das fortschrittliche KI-Modell wissen
Ich teste beruflich KI – deshalb ist Google Gemini eine große Sache

Google machte Gemini zu einem „übervorsichtigen“ mittleren Manager – was zu ungenauen Bildern und Gegenreaktionen führte

Was ist bei Zwillingen schief gelaufen?

Was sind die Auswirkungen?

Was kann Google tun, um das Problem zu beheben?

Folge uns

Wir wählen dich

Top-Kategorien

Schnellzugriffe

Was ist bei Zwillingen schief gelaufen?

Was sind die Auswirkungen?

Was kann Google tun, um das Problem zu beheben?

Melden Sie sich für den täglichen Newsletter an

leiben Sie auf dem Laufenden! Erhalten Sie die neuesten Schlagzeilen direkt in Ihr Postfach.

Folge uns

Wir wählen dich

Das könnte Ihnen auch gefallen