OpenAI verspricht seit Februar die Veröffentlichung seines Videogeneratormodells der nächsten Generation, Sora. Am Montag endlich das Unternehmen eine funktionierende Version gelöscht davon im Rahmen der Veranstaltung „12 Days of OpenAI“.
„Dies ist ein entscheidender Teil unserer AGI-Roadmap“, sagte OpenAI-CEO Sam Altman während des Livestreams des Unternehmens.
Empfohlene Videos
Nach Angaben des OpenAI-Teams wird Sora ab Montagnachmittag für Plus- und Pro-Abonnenten in den USA und auf der ganzen Welt verfügbar sein.
Berichten zufolge erhielt YouTuber Marquis Brownlee frühzeitig Zugriff auf den Videogenerator und veröffentlichte am Montagmorgen eine kurze Rezension auf seinem Kanal. Sora scheint nicht auf GPT-4 zu basieren, wie dies bei praktisch allen anderen generativen Tools von OpenAI der Fall ist. Das Modell ist nicht über die Standard-ChatGPT-Website verfügbar, sondern über Sora.com (das zum Zeitpunkt der Veröffentlichung dieses Beitrags noch nicht online war).
Das Modell ist in der Lage, Videos in Auflösungen von 480p bis 1080p und einer Länge von 5 bis 20 Sekunden zu generieren, entweder aus Textansagen oder Referenzbildern. Es ist auch in der Lage, vorhandene Videoclips zu bearbeiten und zu erweitern. ChatGPT Plus-Abonnenten können bis zu 50 Clip-Generationen mit bis zu 720p pro Monat und weniger Videos mit höherer Auflösung, jeweils fünf Sekunden lang, abspielen. Pro-Benutzern stehen unbegrenzte Generationen mit allen Auflösungen und einer Dauer von bis zu 20 Sekunden zur Verfügung. Zusätzlich zu den Bearbeitungstools bietet Sora auch eine „Storyboard“-Funktion, die es den Erstellern ermöglicht, mehrere Eingabeaufforderungen in einer einzigen Filmszene zu kombinieren.
Brownlee gibt an, dass das Modell „ein paar Minuten“ benötigt, um einen 1080p-Clip zu erstellen, merkt aber an, dass „das auch gerade jetzt so ist, wenn fast niemand sonst es verwendet.“ Ich frage mich, wie lange es noch dauern wird, wenn es einfach für jedermann zugänglich ist.“ Brownlee weist außerdem darauf hin, dass das Modell große Schwierigkeiten damit hat, die Beine und ihre Bewegungen richtig zu erzeugen, da die Vorder- und Hinterbeine auf unnatürliche und unverständliche Weise ihre Position tauschen.
Unser Weihnachtsgeschenk an Sie: Sora ist da. https://t.co/JQKGgLAy6E pic.twitter.com/0c0DLl6Udf
— OpenAI (@OpenAI) 9. Dezember 2024
Im Gegensatz zu Grok 2 wird Sora die Erstellungsmöglichkeiten seiner Benutzer einschränken und die Generierung von urheberrechtlich geschützten Themen, Personen unter 18 Jahren und allem, was Gewalt oder „explizite Themen“ enthält, ausdrücklich ausschließen.
Obwohl OpenAI eine führende Position in der KI-Branche einnimmt, kam es bei Sora bei der Entwicklung zu Verzögerungen, sodass Konkurrenten wie Runways Gen-3 Alpha, Kuaishou Technology’s Kling und Metas Movie Gen-Modelle es auf den Markt bringen konnten. Sora wurde kürzlich (wenn auch nur für kurze Zeit) von einer Gruppe von Betatestern öffentlich durchgesickert, die dem Unternehmen vorwarfen, die Fähigkeiten des Modells „kunstgewaschen“ zu haben.