Nach Monaten der Vorfreude brachte OpenAI endlich Sora auf den Markt, sein KI-Videogenerator-Tool. Wir haben darauf gewartet, auf Sora zuzugreifen und KI-Videos zu erstellen, um zu sehen, ob es dem Hype gerecht wird. Wir haben Sora nun bei verschiedenen Eingabeaufforderungen getestet und auch die Bild-zu-Video-Funktion genutzt. Sehen Sie sich nun unsere praktischen Erfahrungen mit Sora an, um mehr über seine Fähigkeiten und Grenzen zu erfahren.
Erstellen Sie ein Video einer Person, die Kerzen ausbläst
Um Sora zu testen, begann ich mit einer einfachen Aufforderung, um zu sehen, wie es mit Luftbewegungen und der allgemeinen Physik umgeht. Ich habe die folgende Eingabeaufforderung auf Sora ausgeführt, aber es weigerte sich, ein Video zu generieren. Es stellte sich heraus, dass Sora sich aufgrund des Wortes „Schlag“ in der Aufforderung weigerte, das Video zu erstellen. Also habe ich es in „löscht“ geändert und das Video wurde problemlos erstellt. Es zeigt, dass Sora stark eingeschränkt wurde, um die Erzeugung schädlicher Videos zu verhindern.
Egal, als ich zum generierten Video kam, hat es meine Anweisungen nicht befolgt. Die Person im Video hat die Kerzen nicht ausgeblasen. Nach mehreren Versuchen und dem Verbrennen von über 100 Credits konnte Sora das von mir gewünschte Video nicht erstellen.
Eine Person bläst alle Kerzen auf einer Geburtstagstorte aus
Erstellen Sie ein Video eines Cricket-Spiels
Es zeigt, dass Sora zwar die räumliche Kohärenz gut versteht – das Erstellen konsistenter Einzelbilder –, ihm aber die zeitliche Kohärenz fehlt, also die Fähigkeit, Sequenzen zu generieren, die logischen, zeitbasierten Regeln folgen. Beispielsweise könnte ein Ball mit inkonsistenter Geschwindigkeit fallen, weil das Modell die Schwerkraft oder allgemeiner gesagt die Gesetze der Physik nicht versteht.
Mir ist aufgefallen, dass Sora Schwierigkeiten hat, die zeitliche Kohärenz aufrechtzuerhalten, wenn Menschen involviert sind. Es erinnert mich an die frühen Modelle zur Bilderzeugung, denen es oft nicht gelang, menschliche Merkmale wie Finger, Hände, Augen usw. wiederzugeben.
Indien spielt Cricket gegen Australien
Bild-zu-Video-Generierung
Da Sora Benutzern das Hochladen von Fotos ermöglicht (derzeit nicht von Menschen), habe ich diese Gelegenheit genutzt, um zu testen, wie es statische Bilder in Videos umwandelt. Ich habe ein Bild eines Bergpfades hochgeladen und Sora gebeten, auf Grundlage des Bildes ein Video zu erstellen. Ich fügte eine Aufforderung hinzu, die Sora anwies, herumzuschwenken und die Umgebung zu zeigen.
Wieder einmal missachtete Sora meine Anweisungen. Es wurde eine Art Live-Video aus dem Bild erstellt und die Umgebung überhaupt nicht gezeigt.
Also habe ich eine andere Methode ausprobiert und die Remix-Funktion von Sora verwendet, um auf der Grundlage des generierten Videos etwas Neues zu erstellen. Ich habe Sora gebeten, einen Fluss um den Berg herum hinzuzufügen und habe die Remix-Stärke auf „Mild“ geändert. Während Sora einen fließenden Fluss hinzufügte, veränderte es die Gesamtszene und das Ergebnis sah aus wie ein Aquarellgemälde.
Erstellen Sie ein abstraktes Video
An Soras empfohlene Seitefinden Sie viele visuell beeindruckende Videos, meist abstrakter Natur. Also habe ich versucht, ein abstraktes Video eines verspielten Fuchses in einem Wald zu produzieren. Und Sora hat einen wunderbaren Job gemacht. Es entstand eine magische Szene, die viele Details im Kinolicht zur Geltung brachte. Für solche Videos ist Sora ein tolles Werkzeug. Sie können Ihrer Fantasie freien Lauf lassen und surreale Videos erstellen. Stellen Sie sicher, dass Sie detaillierte Eingabeaufforderungen hinzufügen, um bessere Ergebnisse zu erzielen.
Erstellen Sie ein animiertes Video
Im letzten Test erstellte Sora eine wunderschöne animierte Szene eines Hirsches, der durch einen mystischen Wald rennt. Ich mochte den langsamen Satz und dieses Mal wurde er perfekt und ohne jegliche Verzerrung wiedergegeben. Auch hier gilt: Wenn Sie animierte Szenen generieren möchten, ist Sora ein würdiger KI-Videogenerator.
Da dies das erste von OpenAI veröffentlichte Modell zur Videogenerierung ist, sind einige Unvollkommenheiten zu erwarten. Wir wissen, dass es sich um das Sora-Turbo-Modell handelt, das schneller ist, aber nicht alle Funktionen des größeren Modells bietet. Dennoch handelt es sich um eine vielversprechende Entwicklung im Bereich der generativen KI. Von hier an können wir davon ausgehen, dass es nur noch besser wird.