Ich habe 9 KI-Videogeneratoren gebeten, mir wahres Glück zu zeigen – das Gute, das Schlechte und das Gruselige

blank
Von
Jugo Mobile
Jugo Mobile ist eine Plattform, die sich hochwertigem Inhalt in den Bereichen Gaming, Sport und Technik widmet. Engagieren Sie sich mit hochwertigem Inhalt und vernetzen Sie...
11 Minuten Lesezeit

Glück ist subjektiv und schwer zu fassen. Wenn Sie 100 Künstler bitten würden, ein Bild des puren Glücks zu schaffen, oder 100 Dichter, über das Thema zu schreiben, würden Sie lange auf das Ergebnis warten, aber Sie würden auch 200 verschiedene Interpretationen erhalten.

Ich beschloss herauszufinden, wie gut künstliche Intelligenz mit dem Konzept des reinen Glücks umgeht, insbesondere KI-Videogeneratoren. Es gibt Dutzende davon auf dem Markt, die sich in ihrer Vollständigkeit und Leistungsfähigkeit unterscheiden, daher habe ich sie alle gleich aufgefordert.

Zusätzlich zu den offensichtlich größeren Plattformen wie Runway und Pika Labs habe ich Stable Diffusion-basierte Generatoren von Leonardo und NightCafe sowie Discord-basierte neue Modelle wie Assistive Video und PixVerse einbezogen, um zu sehen, wie sie alle im Vergleich abschneiden. Allerdings noch kein Sora von OpenAI; Es soll später in diesem Jahr erscheinen.

Die Interpretationen waren alle unterschiedlich und überraschend ähnlich. Ich habe mich entschieden, LTX Studio nicht einzubeziehen, da es sich um eine andere Art von KI-Videoplattform handelt und daher nicht mit den kürzeren One-Shot-Generatoren vergleichbar ist. Aber als Referenz wurden Sonnenblumen erzeugt, insbesondere eine Frau und ihr Hund, die durch ein Sonnenblumenfeld gingen.

Kann KI pures Glück zeigen?

Wir stellen Sora vor – das Text-zu-Video-Modell von OpenAI – YouTube


Schau weiter

Meine erste Aufgabe bestand darin, eine Eingabeaufforderung zu erstellen, die nicht spezifizierte, wie wahres Glück aussieht, sich um einen langen Satz drehte, da einige der Videogeneratoren Wortbeschränkungen haben, und nicht allzu viel erwartete, da nur eine einzige Szenenaufnahme davon erstellt wurde ein paar Sekunden lang.

Ich habe mir Folgendes ausgedacht: „Eine visuelle Darstellung der Essenz puren Glücks, die das Gefühl durch Symbolik, Metapher und Atmosphäre einfängt.“

Die Idee dahinter ist, dass es die KI dazu zwingt, zu interpretieren, was es bedeutet, anstatt nur den Anweisungen zu folgen, die ich ihr gegeben habe. Frühere Experimente mit einer direkteren Eingabeaufforderung führten zu geringeren Abweichungen zwischen den KI-Modellen.

Die Herausforderung einrichten

Für diese Herausforderung habe ich ausschließlich Dienste genutzt, die Text-to-Video anbieten und dabei auch ihre Bilderzeugungsfähigkeiten testen und wie sie das Konzept des reinen Glücks interpretieren.

Andernfalls wäre es ein Test des Verständnisses eines KI-Bildgenerators für pures Glück und dann ein Blick darauf, wie verschiedene KI-Videotools dieses Bild animieren, und wir haben uns letzte Woche Bildtools angesehen.

Da jedes KI-Videotool einen anderen Ansatz für Einstellungen und Feinabstimmung hat, habe ich alles auf den Standardeinstellungen belassen. Ich habe die Eingabeaufforderung eingegeben und auf „Generieren ohne Anpassung“ geklickt. Die einzige Einstellungsänderung, die ich bei Bedarf vorgenommen habe, bestand darin, sicherzustellen, dass ich möglichst ein 16:9-Bild erhalte.

Wie bei früheren Tests von KI-Bildgeneratoren habe ich das erste Bild in jedem Satz ausgewählt. Dies liegt daran, dass verschiedene Tools standardmäßig eine unterschiedliche Anzahl von Bildern liefern. Deshalb wähle ich immer das erste Bild aus, auch wenn es nicht unbedingt das beste der erstellten Bilder ist.

1. Haiper

Video eines Kindes, das zwischen den Blumen tanzt, mit einem Sonnenuntergang im Hintergrund

(Bildnachweis: Von Haiper/Future AI generiertes Bild)

Haiper ist ein relativer Neuling, aber auch sehr mächtig. Sein Modell ist unglaublich leistungsfähig und in der Lage, aus nur einer Textaufforderung sowohl subtile als auch realistische Bewegungen zu erzeugen. Während die größeren Plattformen mehr Optionen zur Anpassung bieten, folgt Haiper einer Aufforderung genauer.

Es entstand eine märchenhafte Umgebung mit Luftballons, Blumen und einem blühenden Baum. In der Mitte steht ein kleines Kind mit wehenden Haaren und aufgeregt im Wind flatternden Armen. Ich denke, dass dies von allen Videos möglicherweise am ehesten dazu kommt, mich zum Lächeln zu bringen.

2. Leonardo

Video zeigt lächelndes Mädchen, das aus einem Zug schaut

(Bildnachweis: Leonardo AI-Video von Future)

Im Kern Leonardo ist eine KI-Bilderzeugungsplattform, die auf fein abgestimmten und angepassten Versionen der verschiedenen auf stabiler Diffusion basierenden Modelle basiert. Ich habe die Photoreal v2-Funktion verwendet, da sie bereits aktiviert war, als ich die Eingabeaufforderung eingegeben habe. Es verwendet stabile Videodiffusion, um Bilder zu animieren.

Leonardo hat vier Optionen geschaffen und ich glaube nicht, dass die erste die beste war. Andere zeigten ein Kind, das in einem Sonnenblumenfeld spielte, und ein anderes zeigte jemanden, der in den Nachthimmel blickte. Es handelte sich jedoch um ein rundum gutes, sehr realistisch wirkendes Bild eines jungen Mädchens, das aus dem Zugfenster die vorbeiziehende Welt beobachtete.

3. Hilfsvideo

KI-Video, das eine Frau in einem weißen Kleid auf einem Feld zeigt

(Bildnachweis: Assistive Video/AI-Video Future)

Hilfsvideo ist Teil einer größeren Reihe von Funktionen, die rund um die Chat-Oberfläche von Assistive aufgebaut sind. Ich habe dies in Discord verwendet und es war sowohl überraschend schnell als auch einfach zu verwenden, da es über eine einfache Eingabeaufforderung funktioniert, ohne dass weitere Details angegeben werden müssen.

Dies war das einzige Video, das einen Erwachsenen zeigte. Es scheint eine Frau in einem Hochzeitskleid zu zeigen, die bei Sonnenuntergang buchstäblich durch ein Feld gleitet, während sich Blumen über ihrem Kopf wölben. Es scheint, dass man die Vorstellung bekommt, dass Glück von einem Anlass herrührt.

4. Landebahn

Video von Cupcakes. Weiße Cupcakes auf einem Tisch mit weißer Tischdecke

(Bildnachweis: Runway/Future AI Video)

Runway ist mit Abstand der Marktführer für generative KI-Videos. Es verfügt über Partnerschaftsverträge mit einer Reihe von Organisationen und ein fotorealistisches und flexibles Modell in Gen-2.

Seine Interpretation des Konzepts des reinen Glücks brachte mich sowohl zum Lachen als auch zur Überraschung. Für Runway liegt das pure Glück im Essen. Speziell in weißen Cupcakes.

5. Nachtcafé

KI-Video, das eine Ballonfahrt über einer Burg zeigt

(Bildnachweis: NightCafe AI-Video/Future)

Wie Leonardo Nachtcafé ist eine KI-Bildplattform, die auf Stable Diffusion-Modellen aufbaut, aber da beide ihre eigenen angepassten und fein abgestimmten Versionen verwenden, habe ich beide in diesen Test einbezogen. NightCafe hat kürzlich auch Stable Core eingeführt, das eine bessere sofortige Adhärenz bietet.

Seine Interpretation war wieder die von Luftballons, aber anstelle von Menschen handelte es sich um ein wunderschönes altes Schloss mit einem hellen, riesigen Mond im Hintergrund und einer sehr natürlichen Szene. Ich bin mir nicht sicher, ob es mich glücklich macht, aber es vermittelt ein Gefühl der Ruhe.

6. PixVerse

Video eines Mädchens, das sich im Sonnenlicht sonnt

(Bildnachweis: PixVerse/Future AI-Video)

Derzeit nur in Discord verfügbar – wie alle großen KI-Videogeneratoren irgendwann einmal – PixVerse ist ein interessantes Modell, da Sie damit auch Stil und Bewegung festlegen können.

Darin ist ein kleines Kind zu sehen, das sich in den wärmenden Sonnenstrahlen sonnt und mit ausgestreckten Armen jeden Moment der Wärme und Freude aufnimmt. Es ist ein sehr fröhliches Bild, obwohl das Gesicht des Mädchens während der Animation etwas verzerrt aussieht.

7. Pika Labs

Video eines Mädchens, das als Blume gekleidet lächelt

(Bildnachweis: Pika Labs/Future AI-Video)

Pika Labs ist eines meiner liebsten KI-Videotools. Dank seiner einfachen Benutzeroberfläche, der Übernahme anderer Technologien wie Soundeffekten und Lippensynchronisation sowie der Inpainting-Funktion eignet es sich hervorragend für den direkten Einstieg in ein neues Projekt.

Seine Interpretation von reinem Glück entsprach eher dem, was ich von den KI-Modellen erwartet hatte. Es zeigte ein lächelndes Kind, das in einer hellen, farbenfrohen Szene wie eine Blume gemalt war.

8. FinalFrame

Video, das ein Mädchen zeigt, das vor die Sonne springt

(Bildnachweis: Final Frame/AI-Video von Future)

Ich liebe FinalFrame. Es handelt sich um eine sehr leistungsstarke KI-Plattform, die schnell auf neue Technologien umsteigen und diese integrieren kann, beispielsweise Lippensynchronisation, Bearbeitung und Sounds. Es verfügt außerdem über eine Editoransicht für den Timeline-Typ, die das Zusammenfügen von Clips für längere Generationen erleichtert.

Wenn Sie Text-zu-Video umwandeln, erstellt es zunächst eine Reihe von Bildern, aus denen Sie auswählen können, und erstellt dann das Video basierend auf dem Bild. Ich habe das erste in der Liste ausgewählt und es war irgendwie magisch, es zeigte eine märchenhafte Szene eines springenden Mädchens mit einer Lasershow hinter sich. Das war seltsam, hatte aber auch das Gefühl, dass es ihre Freude einfing, wenn auch nicht völlig reines Glück.

9. MetaAI Imagine

KI-Video, das einen Kern und davon fliegende Objekte zeigt

(Bildnachweis: MetaAI Imagine/Future AI generiert)

Meta Imagine, das kürzlich im neuen MetaAI-Chatbot aktualisiert wurde, verfügt nun über die Möglichkeit, alle von ihm generierten Bilder zu animieren. Es bietet nur quadratische Videos mit niedriger Auflösung und ist eher wie ein GIF animiert als wie etwas, das für eine Videoproduktion gedacht ist.

Seine Interpretation der Aufforderung war die einzige, die nichts mit Menschen zu tun hatte. Es ist überraschend digitaler Natur und verfälscht die Technologie nicht zu sehr, sodass sich dieser Clip am ehesten wie aus einer KI-Perspektive anfühlt.

Welcher KI-Generator hat gewonnen?

Ideogrammbild, das ein leuchtend gelbes, sonnenähnliches Objekt zeigt, umgeben von wirbelndem Mysterium

Ideogrammbild, das ein leuchtend gelbes, sonnenähnliches Objekt zeigt, umgeben von wirbelndem Nebel (Bildnachweis: Ideogramm/Future AI generiert)

Sie waren alle interessant und ich glaube nicht, dass einer von ihnen „reines Glück“ wirklich so einfängt, wie es in der Aufforderung beabsichtigt war. Als Referenz habe ich die gleiche Aufforderung an Ideogram gegeben, das den letzten Test wie diesen gewonnen hat, den ich festgelegt habe, und es hat etwas aus dem Quantenbereich geschaffen!

Was die Videogeneratoren betrifft, bin ich als dicker Mann, der Kuchen mag, versucht, den Preis an Runway für seine Andersartigkeit zu vergeben, aber ich denke, dass Haiper das Konzept des puren Glücks am besten eingefangen hat.

Ich denke, dass mir das Meta-Bild am wenigsten und am meisten gefallen hat. Nicht weil es entweder schlecht oder gut war, sondern weil es so außergewöhnlich war. Sein Konzept basierte eher auf einer KI-Idee von Glück als auf einem Menschen, aber es hat den Kürzeren gezogen, da Meta noch keine Breitbild-Clips erstellen kann.

  • 7 Ideen für Google Gemini, die Sie dieses Wochenende ausprobieren sollten
  • Dieses KI-Tool kann die Auflösung jedes Fotos erhöhen – Leonardos „magischer Upscaler“ eignet sich hervorragend zum Bewahren von Erinnerungen
  • Der Leonardo AI-Bildgenerator fügt einen neuen Videomodus hinzu – so funktioniert es
Diesen Artikel teilen
Folgen
Jugo Mobile ist eine Plattform, die sich hochwertigem Inhalt in den Bereichen Gaming, Sport und Technik widmet. Engagieren Sie sich mit hochwertigem Inhalt und vernetzen Sie sich mit anderen Enthusiasten und Experten. Entdecken Sie die neuesten Trends und Innovationen in unserer lebendigen Community. Treten Sie uns bei und erleben Sie die Zukunft noch heute!