Преди броени дни OpenAI обяви, че DALL-E 3 ще се появи през октомври с някои доста интересни и полезни функции. Те ще позволят на генератора на изображения да разбира значително повече нюанси и детайли от предишните системи.
„Съвременните системи за преобразуване на текст в изображение имат склонност да игнорират думи или описания, принуждавайки потребителите да се учат на т.нар. промпт-инженеринг. DALL-E 3 представлява скок напред в способността ни да генерираме изображения, които точно се придържат към текста, който предоставяте“, отбелязва OpenAI в блог публикация.
„DALL-E 3 е изграден изначално върху ChatGPT, което ви позволява да използвате ChatGPT като партньор за усъвършенстване на своите подкани. Просто попитайте ChatGPT какво искате да видите – с всичко от просто изречение до подробен текст с обем цял параграф“, допълват разработчиците на AI софтуера.
Когато преди около година започнаха да се появяват AI генератори на изображения, базирани на текстови заявки, имаше опасения, че изтича времето на много работни места в творческия сектор. В същото време се появи нова професия – промпт-инженер, коментира ситуацията Джозеф Фоли, редактор в Creative Blog.
„Тъй като резултатите, произвеждани от модели като DALL-E 2, Midjourney и Stable Diffusion, зависят от фините вариации в начина, по който се изписват текстовите подкани, то се появиха и хора, предлагащи да продадат умението си да формулират подкани така, че да се постигнат конкретни резултати. Но такива „професии“ няма да просъществуват дълго“, смята експертът.
Тъй като ChatGPT е много по-добър в разбирането на естествения език, добавянето на чатбота ще направи използването на DALL-E 3 по-естествено, по-разговорно. Потребителят ще може да си каже съвсем човешки какво иска.
Нещо повече. Изглежда, че интеграцията ще работи и в двете посоки. Ще бъде възможно човек да генерира изображение и след това да поиска от ChatGPT да напише текст за картината, например да напише история за даден герой, генериран от изкуствения интелект DALL-E 3.