Компанијата OpenAI претстави револуционерен модел на вештачка интелигенција што ги претвора текстуалните инструкции во фотореалистични видеа долги до една минута.
OpenAI ја претстави Sora, нивниот најнов модел за генерирање видео со вештачка интелигенција, дизајниран да ги оживее упатствата базирани на текст во фотореалистичните видеа долги до една минута. Sora се истакнува во создавањето сложени сцени со повеќе ликови, специфични движења и прецизни детали за теми и позадини, демонстрирајќи разбирање на предметите во физичкиот свет и способност да интерпретира реквизити додека создава експресивни ликови.
Според OpenAI, Sora може да генерира видеа врз основа на фотографии, да пополнува рамки што недостасуваат во постоечките видеа или да го продолжи нивното времетраење. Иако моделот повремено може да се бори да симулира физика на сложени сцени, резултатите се несомнено импресивни. Значајните демо снимки прикажуваа сцени како воздушен поглед на Калифорнија за време на златната треска и симулирана перспектива од воз во Токио, покажувајќи ги способностите на Sora.
За разлика од неговите претходници, како што е Midjourney, кој се фокусираше на генерирање текст во слика, полето на видеа генерирани со вештачка интелигенција се развива брзо, со модели за генерирање видео како што се Runway, Pika и Lumiere на Google. Lumiere, конкурент на Sora, нуди и можности за текст во видео и им овозможува на корисниците да креираат видеа од фотографии.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Моментално достапна за „црвените тимови“ кои ги проценуваат потенцијалните ризици и штети, Sora е достапна и за визуелни уметници, дизајнери и филмаџии за повратни информации. OpenAI ги препознава потенцијалните предизвици, вклучително и ограничувањата на моделот при прецизно симулирање на сложени сцени и толкување на специфични причинско-последични примери.
OpenAI, исто така, неодамна објави додавање на водени жигови на својата алатка за текст во слика со вештачка интелигенција, DALL-E 3, со предупредување дека овие водени жигови може лесно да се отстранат. Како и со другите производи со вештачка интелигенција, OpenAI е свесен за импликациите на лажните фотореалистични видеа генерирани со вештачка интелигенција да се помешаат со вистинска содржина, нагласувајќи ја потребата за одговорна употреба и разгледување на потенцијалните последици.