OpenAI, bekannt als Entwickler von ChatGPT, hat sein neuestes Modell namens „Sora“ vorgestellt. Sora ist ein fortschrittliches Text-zu-Video-Modell, das auf der Grundlage textueller Anweisungen realistische und imaginative Videosequenzen generieren kann.
Sora baut auf den Erfahrungen aus früheren OpenAI-Projekten wie DALL·E und GPT-Modellen auf und verwendet die Recaptions-Technik von DALL-E 3, um hochdeskriptive Bildunterschriften für die Trainingsdaten zu generieren. Das Modell kann komplexe Szenen mit mehreren Charakteren, spezifischen Bewegungsarten und detaillierten Darstellungen von Motiven und Hintergründen erschaffen. Es versteht, wie Objekte in der physischen Welt existieren, und kann Charaktere mit ausdrucksstarken Emotionen erzeugen.
Sora erlaubt es Nutzer:innen, Videos von bis zu einer Minute Länge zu erstellen, die auf ihren geschriebenen Anweisungen basieren. Zu den Demos, die OpenAI veröffentlicht hat, gehören beeindruckende Szenen wie eine Luftaufnahme Kaliforniens während des Goldrausches und eine vermeintliche Zugfahrt durch Tokio. Obwohl einige Demos verräterische Zeichen künstlicher Intelligenz aufweisen, wie beispielsweise sich eigenartig bewegende Objekte, sind die Ergebnisse insgesamt beeindruckend.
Trotz der beeindruckenden Fähigkeiten von Sora gibt OpenAI zu, dass das Modell Schwierigkeiten haben kann, die Physik komplexer Szenen genau zu simulieren. Dies kann zu Fehlinterpretationen bestimmter Ursache-Wirkungs-Zusammenhänge führen. Das Modell ist derzeit nur einer ausgewählten Gruppe von „Red Teamern“ zugänglich, die es auf potenzielle Risiken und Schäden prüfen. Einige Künstler:innen, Designer:innen und Filmemacher:innen erhalten ebenfalls Zugang, um Feedback zu sammeln.
Die rasante Entwicklung der Videotechnologie stellt die KI-Branche vor neue Herausforderungen, insbesondere im Hinblick auf die Erstellung fotorealistischer, KI-generierter Videos, die mit echten Aufnahmen verwechselt werden könnten. OpenAI hat bereits Maßnahmen ergriffen, um die Authentizität seiner KI-Produkte zu gewährleisten, wie die Einführung von Wasserzeichen bei DALL-E 3, obwohl diese leicht entfernt werden können.
Via Anbieter
Vom 9. bis 13. Juni 2025 veranstaltet Apple seine jährliche Worldwide Developers Conference (WWDC). Die rein digitale Konferenz bringt Entwickler:innen…
Die Handelsbeziehungen zwischen China und den USA sind seit Jahren angespannt. Nun gibt es neue Daten, die belegen, wie stark…
Apple hat kürzlich die Signierung von iOS 18.4.1 eingestellt. Dies geschah nur eine Woche nach der Veröffentlichung des Updates auf…
Der Stromsparmodus hilft, die Akkulaufzeit Deines iPhones zu verlängern, wenn der Ladestand sinkt. Doch statt ihn manuell zu aktivieren, kannst…
Die Technologiebranche entwickelt sich rasant. Künstliche Intelligenz (KI) steht dabei im Fokus. Apple, bekannt für sein Innovationsstreben, hat in den…
Apple bereitet sich anscheinend darauf vor, das iPhone-Sortiment mit einem Ultra-Modell zu erweitern. Der Ultra-Zusatz ist mittlerweile kein Fremdwort mehr…
Diese Website benutzt Cookies um Ihr Nutzererlebnis zu verbessern. Wenn Sie diese Website weiter nutzen, gehen wir von Ihrem Einverständnis aus.
Mehr lesen