OpenAI Sora AI Video Generator enttäuscht Erwartungen

OpenAI Sora AI Video Generator enttäuscht Erwartungen

OpenAI hat die Veröffentlichung von Sora fast ein Jahr lang angekündigt und immer wieder verzögert. Am Dienstag stellte das Unternehmen schließlich eine voll funktionsfähige Version des neuen Videogenerationsmodells vor, die für die öffentliche Nutzung bestimmt ist, und trotz der anfänglichen Begeisterung scheinen immer mehr frühe Benutzer der Veröffentlichung nicht sonderlich beeindruckt zu sein. Und ich auch nicht.

Wir stellen Ihnen Sora vor, unser Text-zu-Video-Modell.

Sora kann bis zu 60 Sekunden lange Videos mit äußerst detaillierten Szenen, komplexen Kamerabewegungen und mehreren Charakteren mit lebendigen Emotionen erstellen. https://t.co/7j2JN27M3W

Aufforderung: „Wunderschön, verschneit…“ pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) 15. Februar 2024

Das Unternehmen stellte Sora im vergangenen Februar erstmals vor und erntete große Anerkennung für seine hyperrealistischen Video-Renderings. „Sora kann Videos mit einer Länge von bis zu einer Minute erzeugen und dabei die visuelle Qualität beibehalten und sich an die Aufforderungen des Benutzers halten“, schrieb OpenAI damals in seinem Ankündigungsblog. „Das Modell versteht nicht nur, wonach der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren.“

Empfohlene Videos

OpenAI veröffentlicht immer mehr verrückte Sora-Videos

Diese sind zu 100 % KI-generiert

9 Reality-Bending-Videos

1. Elefant aus Blättern pic.twitter.com/tPsHNGbFPS

— Linus Ekenstam (@LinusEkenstam) 18. März 2024

Das Unternehmen veröffentlichte im März weitere von Sora erstellte Aufnahmen, dieses Mal von einem Elefanten aus Blättern, was die Fähigkeiten des Modells weiter hervorhob. Beim Sora-Programm kam es daraufhin zu einer Reihe von Entwicklungsverzögerungen, die Kevin Weil, Chief Product Officer von OpenAI, kürzlich in einem Bericht verantwortlich machte Reddit AMA über die „Notwendigkeit, das Modell zu perfektionieren, Sicherheit/Identitätswechsel/andere Dinge richtig zu machen und Berechnungen zu skalieren“. Gleichzeitig, Die Informationen berichtete, dass frühe Versionen von Sora unter einer schlechten Leistung litten und Schwierigkeiten hatten, sich auf die Eingabeaufforderungen des Benutzers zu konzentrieren, sodass die Erstellung eines einminütigen Clips bis zu 10 Minuten in der realen Welt erforderte. Das Modell wurde kürzlich auch online von einer Gruppe verärgerter Betatester durchgesickert, die Einwände gegen die „Art-Washing“-Praktiken von OpenAI erhoben hatten. Als Reaktion darauf ließ das Unternehmen jedoch umgehend die nicht autorisierte Benutzeroberfläche der Gruppe aus Hugging Face entfernen.

Während OpenAI die Leistung von Sora optimierte und verfeinerte, aß die Konkurrenz des Unternehmens ihr Mittagessen. Adobes Firefly AI, Runways Gen 3 Alpha, Metas Movie Gen und Kuaishou Technologys Kling (ganz zu schweigen von unzähligen kostenlosen Optionen) verbreiteten sich im vergangenen Jahr im Internet, wobei viele Clips von überlegener Qualität und schnelleren Inferenzzeiten als alles andere boten OpenAI hatte es wiederholt versprochen.

Verwandt :  Künstliche-Intelligenz-Experten warnen vor katastrophalen Auswirkungen von Superintelligenter KI.

Am Dienstag stellte OpenAI offiziell die produktionsreife Version von Sora vor und gab sie für seine Plus- und 200-Dollar-pro-Monat-Plus-Abonnenten (lol) Pro-Abonnenten frei. Zumindest tat das Unternehmen das für ein paar Stunden. Als Technologiekommentator Ed Zitron notiert am Bluesky Wednesday„Nur wenige Stunden – vielleicht sogar weniger – nachdem OpenAI bekannt gegeben hatte, dass Sora draußen war, nahm es keine neuen Kontoregistrierungen mehr an, ohne dass ein klarer Zeitplan bekannt war.“ OpenAI hat die gesamten Tech-Medien angelockt. Dieses Unternehmen kann es sich auf keinen Fall leisten, seinen Videogenerator der Öffentlichkeit zugänglich zu machen.“

Dieses Video ist KI-generiert! SORA-Rezension

Für die Leute, denen es gelang, Zugang zu erhalten, waren die Videos, die Sora erstellt hatte, alles andere als beeindruckend. Wie die YouTube-Persönlichkeit Marques Brownlee in seinem praktischen Video mit dem Modell betonte, dauerte es mehrere Minuten, um einen einzigen 20 Sekunden langen Clip mit einer Auflösung von 1080p zu erstellen, und es gab erhebliche Schwierigkeiten, die Beine und ihre Bewegungen eines Motivs mit Vorder- und Rückseite zu erzeugen Die Hinterbeine wechseln während des gesamten Clips unnatürlich ihre Position. Man muss sich nur das generierte Video unten ansehen, in dem ein Turner im Handumdrehen seine Arme, Beine und seinen Kopf austauscht, während er über eine Matte stolpert, um zu verstehen, was er meinte.

Hier ist ein von Sora erstelltes Gymnastikvideo

Peter Labuza (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z

Bluesky-Nutzer Peter Labuza, der das Turnvideo gepostet hat, hielt sich mit seiner Kritik an dem Modell nicht zurück. Angabe: „Es tut mir leid, aber wenn Sie einen Text-zu-Video-Generator erstellen und ihm sagen: „Lass eine Katze durch ein Feld rennen.“ Und Sie geben ihm das Startbild und die Katze STEHT einfach, Ihr Generator funktioniert nicht.“

Bluesky-Benutzer Chris Offner vertrat eine ähnliche Meinung und bemerkte sarkastisch, dass „Sora eine datengesteuerte Physik-Engine ist“, während er einen absolut verrückten Clip eines Skifahrers teilte, der sich den meisten, wenn nicht allen bekannten Gesetzen der Physik widersetzt.

Der Rand probierte das Modell ebenfalls aus und bemängelte, dass es immer noch nicht auf unschöne Einschlüsse wie „zusätzliche Gliedmaßen oder verzerrte Objekte“ verzichten konnte.

„Sora ist eine datengesteuerte Physik-Engine.“x.com/chrisoffner3…

Chris Offner (@chrisoffner3d.bsky.social) 2024-12-10T12:42:53.674Z

Wohlgemerkt, nicht jeder hasste Sora auf den ersten Blick. X-Benutzer Nathan Shipley zeigte die „Remix“-Funktion des Modells, die es Benutzern ermöglicht, ein generiertes Video mit den Bewegungen von Objekten in einem hochgeladenen Beispiel zu maskieren. In diesem Fall bewegte er den Kopf eines generierten Kranichs auf die gleiche Weise wie eine Schere, die er selbst auf Video filmte.

Verwandt :  So legen Sie ein Video als Anrufklingelton auf einem Android-Telefon fest

Sora Remix-Test: Von der Schere zum Kran

Die Eingabeaufforderung lautete: „Nahaufnahme eines neugierigen Kranichvogels, der sich in einer wunderschönen Naturszene an einem Teich umschaut. Der Kopf des Vogels taucht in die Aufnahme hinein und dann heraus.“ pic.twitter.com/CvAkdkmFBQ

– Nathan Shipley (@CitizenPlain) 10. Dezember 2024

Es gibt noch keine Informationen darüber, wann das Unternehmen die Kontoanmeldungen für interessierte Sora-Benutzer zuverlässig wieder öffnen kann. Ob OpenAI Hollywood mit Sora in seinem aktuellen Zustand umwerben kann, wie es Runway kürzlich getan hat Gen 3 und Lionsgatebleibt ebenfalls abzuwarten.

Eines bleibt sicher: OpenAI wird trotz seines anfänglichen Vorsprungs im KI-Boom schnell vom Rest der Branche überholt, und glanzlose Produktveröffentlichungen wie das, was wir gerade bei Sora gesehen haben, werden dem Ruf des Unternehmens nur noch mehr schaden.

Moyens I/O-Personal. motivierte Sie und gab Ratschläge zu Technologie, persönlicher Entwicklung, Lebensstil und Strategien, die Ihnen helfen werden.