GenAI zamienia tekst na przekaz wideo
- Janusz Chustecki,
- 16.02.2024, godz. 09:43
Firma OpenAI zaprezentowała kilka dni temu swój następny model GenAI, który zamienia tekst na wideo. Rozwiązanie nosi nazwę Sora i jest w stanie wygenerować przekaz wideo mający rozdzielczość 1080p, który składa się z tła oraz do kilkunastu animowanych postaci czy obiektów.
Narzędzie może też jak to określa OpenAI „rozszerzać” istniejące klipy o nowe obiekty, jak również uzupełniać brakujące szczegóły. Może również renderować gry wideo. Sora wydaje się dość dobrze interpretować tekst i tworzyć niekiedy bardzo interesujące oraz żywe postacie. Co ciekawe model rozumie nie tylko to, o co użytkownik prosi w opisie, ale dodawać do przekazu postacie istniejące w świecie fizycznym.
Strona demonstracyjna opublikowana przez OpenAI zawiera wiele przykładów tego, jak działa narzędzie. Sora może generować filmy mające różne style. Może to być więc bardzo realistyczny film, animowany, czarno-biały czy też kolorowy. Filmy prezentują się przy tym realistycznie i Sora nie generuje różnego rodzaju dziwnych i surrealistycznych przekazów, jak ma miejsce często w przypadku innych narzędzi tego typu.
Zobacz również:
- System MS-DOS wrócił po latach w postaci open source
- Sztuczna inteligencja wkroczyła do aplikacji Speaking Practice
- Canva dokonuje największego przejęcia w pościgu za Adobe
OpenAI informuje, że współpracuje z ekspertami, aby zbadać model pod kątem exploitów i zbudować narzędzia umożliwiające wykrycie, czy film został wygenerowany przez Sorę. Twierdzi również, że jeśli zdecyduje się na wbudowanie modelu w produkt dostępny publicznie, zapewni aby metadane dotyczące pochodzenia były uwzględnione w wygenerowanych wynikach.