
Видео генераторите с изкуствен интелект претърпяха бурно развитие през миналата година. Някои видеа, генерирани с помощта на AI, вече са толкова реалистични, че мнозина се затрудняват да ги различат от истинското, заснето на живо видео. Сякаш единствената бариера за преодоляване остава продължителността на AI клиповете.
Един от водещите AI видео генератори – базиран на текстови подкани, начално изображение или комбинация от тях – остава моделът Sora, създаден от OpenAI, с втората си версия, пусната през есента на 2025 г.
Този генератор е достъпен безплатно в приложението Bing (за оторизация е необходим акаунт в Microsoft) и във фирменото приложение за iOS от средата на годината. Привлекателността му се крие както във възможността да се превърнете в герой на видеото, така и в доброто му разбиране на физиката на реалния свят.
Например, ако видеоклипът е създаден въз основа на изображение на баскетболист, увиснал във въздуха с топка на върха на пръстите си, топката във видеото може да удари директно коша, да отскочи от ръба или да отскочи от таблото, но вероятността тя да премине директно през обръча (както AI видео генераторите често са изобразявали в миналото) е практически нулева.
Sora 2 се справя отлично както с човешките движения, така и с емоциите: не е чудно, че веднага след обявяването му, видеоклип със Сам Алтман, който е хванат, докато се опитва да вземе графична карта от магазин, без да плаща, стана вирусен. В рамките на пет дни приложението Sora беше изтеглено един милион пъти – всъщност, неговите измамни клонинги наводниха App Store, което допълнително потвърждава успеха на модела.
Дори се стигна дотам, че японските власти се обърнаха към OpenAI с настояване да прилага стриктно авторските права на японските създатели върху аниме и манга герои, тъй като генерираните от изкуствен интелект герои бяха неразличими от оригиналите.
Стартирало през ноември само в няколко страни, приложението Sora за Android беше изтеглено половин милион пъти за един ден. В крайна сметка OpenAI беше принудена значително да ограничи броя на наличните генерации поради прекомерното натоварване на сървърите си.
Подобен видео генератор от друг гигант в областта на изкуствения интелект, Google, наречен Veo, привлече вниманието през февруари, когато стана достъпен директно в YouTube за създаване на видеоклипове от текстови описания.
През април достъп до Veo 2 получиха платените потребители на Google Gemini, а през май ерата на „великите неми” в генерирането на изображения с изкуствен интелект по същество приключи: новият модел, Veo 3, се сдоби с възможност едновременно да генерира аудио, докато създава видео.
По това време бяха пуснати и приложения за Android и iOS, поддържащи Veo 3. Тъй като мултимедийният модел е обучен с помощта на съдържание, качено в YouTube (а Google никога не е крил факта, че използва потребителски видеоклипове, за да обучава своя изкуствен интелект), качеството на аудио и видео интеграцията е особено високо.
Потребителите на Gemini вече могат сами да се уверят в това, тъй като Veo 3 им позволява да създават 8-секундни видеоклипове с озвучаване. През септември моделът беше обучен да създава вертикални видеоклипове за социалните медии, а през октомври излезе Veo 3.1 с още по-реалистични изображения и подобрен звук.
