Wir haben Dream Machine ausprobiert, die KI, die Videos erstellt, und es ist unglaublich

Wir haben Dream Machine ausprobiert, die KI, die Videos erstellt, und es ist unglaublich
Wir haben Dream Machine ausprobiert, die KI, die Videos erstellt, und es ist unglaublich

Während Technikbegeisterte (und nicht nur) auf den erweiterten Start von Sora warten, ist künstliche Intelligenz, die fotorealistische Videos erzeugen kann, bereits angekommen und über zwei direkte „Konkurrenten“ des OpenAI-Tools verfügbar: Im Juni 2024 werden tatsächlich zwei KI-Modelle verfügbar sein bereits veröffentlicht, das von Benutzern verwendet werden kann, die das von Sam Altman und Mitarbeitern in Frage stellen. Wir beziehen uns vor allem auf Luma-Traummaschinedas in unserem Bereich bereits per Login mit einem Google-Konto genutzt werden kann, aber auch dazu Kling-KI.
Während Sie darauf warten, das Potenzial von Sora aus erster Hand zu erleben, erfahren Sie hier, was mit künstlicher Intelligenz im Bereich der Videogenerierung bereits erreicht werden kann.

Von Luma Dream Machine bis Kling AI

Luma Dream Machine präsentiert sich als ein Dienst, der Generierung verspricht 5-Sekunden-Video mit flüssigen Bewegungen und filmische Szenen. Das Ziel ist der Fotorealismus, obwohl es in diesem Sinne noch Einschränkungen gibt.
Abgesehen von der Tatsache, dass Sora von OpenAI in der Lage sein wird, Videos mit einer Länge von bis zu einer Minute zu erzeugen, also viel länger als Dream Machine, ist dies erwähnenswert wir befinden uns noch in einer experimentellen Phase dieser Text-zu-Video-Lösungen.

Die Dream Machine-Entwickler selbst warnen vor möglichen Problemen etwa bei der Generierung von Textelementen im Video sowie Bewegungsfehlern, die bei bestimmten Eingabeaufforderungen auftreten können. Ganz zu schweigen davon Halluzinationen, zum Beispiel diejenigen, die sich auf die „on-the-fly“-Transformation eines Objekts in ein unaufgefordertes Objekt beziehen. Trotz dieser Einschränkungen ist es überraschend, dass es sich bei Dream Machine um einen kostenlosen Dienst handelt, der das Generieren ermöglicht bis zu 30 mit Wasserzeichen versehene Videos pro Monat.
Der Dienst bietet auch die Möglichkeit, ein Abonnement zu bezahlen, um Einschränkungen aufzuheben. Dies ist also ein wichtiger Fortschritt im Vergleich zu bereits bekannten Lösungen wie z Kaiber.aidie stattdessen nur eine schnelle erste kostenlose Testversion anbieten.

Darüber hinaus steht Dream Machine genau wie ein Soras Rivalewenn man bedenkt, dass das beabsichtigte Ziel darin besteht, fotorealistische Videos zu erstellen.
Alles interessant, aber wie funktioniert es in der Praxis? Nachdem Sie sich mit Ihrem Google-Konto angemeldet haben, erscheint sofort die Leiste auf dem Bildschirm, in der Sie Ihren Textbefehl eingeben können: In diesem Feld können Sie Folgendes tun Geben Sie eine Texteingabe ein oder laden Sie ein Referenzbild hoch zu animieren. Wir empfehlen Ihnen, die Option aktiviert zu lassen Eingabeaufforderung verbessernum es dem Dienst zu ermöglichen, die Eingabeaufforderung zu verbessern, um eine bessere Chance zu haben, ein Ergebnis zu erhalten, das den Erwartungen entspricht.

1718550953_150_Wir-haben-Dream-Machine-a

Während unseres Tests, der zu Beginn durchgeführt wurde, als sich die Nachricht von der Veröffentlichung des KI-Modells verbreitete, mussten wir eine Weile in der Schlange warten, bis die Videos generiert wurden. Dies ist auf die hohe Nachfrage zurückzuführen, aber es könnte Sie interessieren, dass die tatsächliche Erstellung eines KI-Videos mit Dream Machine erfolgt dauert 120 Sekunden.

Auf jeden Fall haben wir für unseren ersten Test eine Eingabeaufforderung auf Englisch verwendet und die KI gebeten, sich ein Video eines Bloggers vorzustellen, der vor dem Kolosseum am Computer tippt und dabei ein kaltes Getränk trinkt. Das Ergebnis, sobald die Phase vorbei ist TräumendEs war interessant, aber es gab einige Ungenauigkeiten bei den Bewegungen und insbesondere bei der Reproduktion der Hände. Nachdem wir einige allgemeine Tests durchgeführt hatten, wollten wir noch einen Schritt weitergehen und versuchten, eine Eingabeaufforderung auf Italienisch einzugeben: „Ein Panda paradiert auf dem roten Teppich und begrüßt die Fotografen“. Nach Abschluss der Dreaming-Phase entsprach das Ergebnis korrekt unseren Anforderungen. Das von Luma Dream Machine erstellte Video finden Sie unter diesem Link. Es gibt einige UnvollkommenheitenAusgehend davon, dass im Video statt einer einfachen Begrüßung die Hand des Pandas zu einer Art Kamera wird, mit der das Tier beginnt, Fotos zu machen. Das ist nur eines der Probleme: Wenn beispielsweise der Arm mit der Kamera gesenkt wird, wird aus der Pfote eine Hand, beim Blick hinter den Panda bemerkt man ein Morphing-Problem, also die ungewollte Verwandlung der Menschen im Hintergrund. Wie bereits erwähnt, befindet sich der Dienst noch in der experimentellen Phase.

1718550953_256_Wir-haben-Dream-Machine-a

Obwohl das KI-Modell nicht direkt auf Italienisch zu „denken“ scheint, führt es also eine „hinter den Kulissen“-Übersetzung vom Italienischen ins Englische durch, wie man deutlich sehen kann Tatsächlich ist es bereits möglich, Eingabeaufforderungen in unserer Sprache zu verwenden um möglicherweise interessante Ergebnisse zu erhalten. Sie könnten daher daran interessiert sein, Ihrer Kreativität freien Lauf zu lassen, um die unterschiedlichsten Szenarien zu generieren, da das Modell bereits offen und für alle zugänglich ist.

Wenn Sie jedoch besser verstehen möchten, inwieweit diese Modelle halluzinieren können, insbesondere bei Ansagen auf Italienisch, könnte es für Sie von Interesse sein, einen Blick auf die fehlgeschlagenen Tests zum Gameplay eines seelenähnlichen Sets in Mailand und den Hund mit dem zu werfen Italienische Flagge läuft in einer Cyberpunk-Stadt.
Der Cartoon mit dem Kaninchen im Wald ist interessanter, aber das verstehen Sie es ist noch ein langer Weg (Obwohl vieles auch mit der Fähigkeit zusammenhängt, dem Dienst wirksame Eingabeaufforderungen zu geben, wie es bei jedem KI-Dienst mit Selbstachtung der Fall ist).

1718550953_268_Wir-haben-Dream-Machine-a

Über Dream Machine hinaus wurde in dieser Zeit auch Kling AI eingeführt. ein weiteres Modell der künstlichen Intelligenz Ziel ist es, fotorealistische Videos zu erstellen.
Der interessanteste Aspekt dieses anderen Tools ist, dass es bis zu 2 Minuten 1080p-Video mit 30 fps erzeugen kann. Hinter dem Projekt steht der chinesische Technologieriese Kuaishou-Technologie und das Ziel besteht darin, die Physik der realen Welt genau zu simulieren. Dieses Modell steht derzeit in China auf der Warteliste und wir wissen nicht, ob es auch in unseren Teilen verfügbar sein wird, aber auf jeden Fall Der Monat Juni 2024 brachte einige bemerkenswerte Neuigkeiten mit sich im Hinblick auf die Erstellung fotorealistischer KI-Videos.

PREV Grafik und Gameplay werden PS5 und Xbox Series vorantreiben
NEXT Ist das online aufgetauchte Veröffentlichungsdatum von Clockwork Revolution korrekt? Das Xbox-Team antwortet mit einem Meme