Google machte Gemini zu einem „übervorsichtigen“ mittleren Manager – was zu ungenauen Bildern und Gegenreaktionen führte

blank
Von
Jugo Mobile
Jugo Mobile ist eine Plattform, die sich hochwertigem Inhalt in den Bereichen Gaming, Sport und Technik widmet. Engagieren Sie sich mit hochwertigem Inhalt und vernetzen Sie...
5 Minuten Lesezeit

Google wurde diese Woche von Beschwerden und Gegenreaktionen von Nutzern heimgesucht, nachdem sein Gemini AI-Chatbot begann, in der Vergangenheit ungenaue Bilder von Menschen zu erstellen.

Die KI weigerte sich außerdem, bestimmte Bilder zu erstellen, in denen es um Rassenzugehörigkeit ging, was dazu führte, dass der Suchriese Geminis Fähigkeit deaktivierte, jedes Bild einer Person zu erstellen: lebend, tot oder fiktiv.

Es gibt bereits Beschränkungen hinsichtlich dessen, was Zwillinge schaffen können, einschließlich Beschränkungen für die Darstellung realer Menschen. Das Problem ist, dass diese Beschränkungen offenbar zu streng festgelegt sind und dies zu erheblichen Gegenreaktionen geführt hat.

Google sagt, dass das Problem gelöst werden wird und derzeit nach einer sicheren Möglichkeit gesucht wird, die Anweisungen anzupassen.

Was ist bei Zwillingen schief gelaufen?

Google Gemini erstellt keine Bilder von Menschen

(Bildnachweis: Google)

Zwillinge selbst erschaffen die Bilder nicht wirklich. Der Chatbot verhält sich wie ein mittlerer Manager, der die Anfragen entgegennimmt, seine eigene Interpretation in die Eingabeaufforderung einstreut und sie an Imagen 2 weiterleitet, den Bildgenerator mit künstlicher Intelligenz, der vom DeepMind AI-Labor von Google entwickelt wurde.

Die Probleme scheinen aus dieser mittleren, spröden Phase zu kommen. Gemini verfügt über eine Reihe von Kernanweisungen, die zwar nicht von Google bestätigt wurden, aber wahrscheinlich als Diversitätsfilter für jede Anfrage einer Person fungieren, die eine alltägliche Aufgabe erledigt – aus irgendeinem Grund wurde dies auf alle Personenbilder angewendet.

Yishan Wong, ehemaliger Reddit-CEO und Gründer des Klimawandel-Aufforstungsunternehmens Terraformation schrieb auf X dass das Problem mit den historischen Zahlen Google wahrscheinlich überrascht hat.

„Das ist nicht unvernünftig, wenn man bedenkt, dass sie ein globales Publikum haben“, sagte er über den Diversity-Filter. „Vielleicht sind Sie damit nicht einverstanden, aber es ist nicht unvernünftig. Google hat das höchstwahrscheinlich nicht vorhergesehen oder beabsichtigt.“ Das Ergebnis ist, dass historische Persönlichkeiten vernünftigerweise weiß sein sollten.“

Was sind die Auswirkungen?

Google ImageFX kann Bilder generieren

(Bildnachweis: Google)

Ryan Carrier, CEO der KI-Zertifizierungs- und Sicherheitsagentur for Humanity, sagte gegenüber Jugo Mobile, dass in den Gemini-Anweisungen wahrscheinlich ein „fest codierter Diversitätsfilter“ enthalten sei. Er sagte, dies sei „ähnlich einer positiven Aktion für Bilder“ und könne illegal sein.

Er sagte gegenüber Jugo Mobile: „Angesichts der jüngsten Gerichtsurteile, dass positive Maßnahmen einer umgekehrten Diskriminierung gleichkommen, steht dieser ‚Vielfalt‘-Filter auf der falschen Seite des Gesetzes, ganz zu schweigen von einer bedeutsamen Abweichung von der Genauigkeit.“

Ich habe versucht, einige der Eingabeaufforderungen zu reproduzieren, etwa Bilder von Menschen aus dem mittelalterlichen England zu erstellen, und zwar mit ImageFX, dem KI-Bildtool von Google Labs, das ebenfalls auf Imagen 2 aufbaut. Dadurch wird der Diversitätsfilter in Gemini effektiv umgangen und das Modell direkt abgefragt .

Es spiegelte die historische Realität korrekt wider, anstatt einen Farb- oder Rassenfilter auf die Bilder anzuwenden und alle „positiven Diskriminierungs“-Regeln zu erfüllen, die bei Zwillingen gelten.

„Dieses Ereignis ist bedeutsam, weil es ein eindrucksvoller Beweis dafür ist, dass jemand einem LLM eine Reihe von Anweisungen gibt und die Ergebnisse überhaupt nicht das sind, was er vorhergesagt hat“, erklärte Wong.

Was kann Google tun, um das Problem zu beheben?

Es handelt sich nicht unbedingt um ein Problem des mittleren Managers. ChatGPT funktioniert beim Senden von Anfragen an das DALL-E 3-Modell auf ähnliche Weise, und sowohl Sora als auch die neuen Stable Diffusion 3-Modelle verwenden bei der Generierung von Bildern eine Transformatorarchitektur und Filter.

Das Problem scheint eng mit den Beschränkungen verbunden zu sein, die Google Gemini auferlegt hat und die der Suchriese nach eigenen Angaben beheben wird. und erklärte, dass es „das Ziel verfehlt“ habe.

„Die KI-Bildgenerierung von Gemini generiert tatsächlich ein breites Spektrum an Menschen. Und das ist im Allgemeinen gut so, weil Menschen auf der ganzen Welt es nutzen. Aber hier verfehlt es das Ziel“, sagte Jack Krawczyk, Senior Director von Gemini Experiences, am Mittwoch.

Krawczyk war nach der Gegenreaktion gezwungen, auf X privat zu bleiben und seine Tweets vor der Mehrheit der Nutzer zu verbergen, sagte aber zunächst: „Wir arbeiten daran, diese Art von Darstellungen sofort zu verbessern.“

  • Chrome-Benutzer können jetzt KI nutzen, um beim Schreiben von Texten zu helfen – so funktioniert es
  • Google Gemini: Alles, was wir über das fortschrittliche KI-Modell wissen
  • Ich teste beruflich KI – deshalb ist Google Gemini eine große Sache

Diesen Artikel teilen
Folgen
Jugo Mobile ist eine Plattform, die sich hochwertigem Inhalt in den Bereichen Gaming, Sport und Technik widmet. Engagieren Sie sich mit hochwertigem Inhalt und vernetzen Sie sich mit anderen Enthusiasten und Experten. Entdecken Sie die neuesten Trends und Innovationen in unserer lebendigen Community. Treten Sie uns bei und erleben Sie die Zukunft noch heute!