Нова, подобрена версия на генератора на изображения DALL-E ще бъде интегрирана скоро в ChatGPT, съобщи разработчикът на популярния чатбот с изкуствен интелект – компанията OpenAI.
DALL-E 3 може „значително по-добре да разбира заявките“, да анализира сложни инструкции и да генерира „изключително подробни и точни изображения“ в сравнение със своя предшественик DALL-E 2, твърдят разработчиците.
„Съвременните генератори на изображения са склонни да игнорират думи или описания, принуждавайки потребителите да се учат на промпт-инженерство. DALL-E 3 представлява стъпка напред в способността ни да създаваме изображения, които точно отговарят на заявката”, казват от OpenAI в описание на новия генератор на изображения.
Моделът се справя по-добре и с малки детайли, които принципно са трудни за изкуствения интелект, като например човешки ръце. Дори при едни и същи заявки, резултатите на DALL-E 3 са много по-добри от тези на DALL-E 2, уверяват разработчиците.
DALL-E 3 ще може да покаже точно сцена с конкретни обекти и как те се свързват един с друг, както се вижда от изображенията, генерирани от новия модел с изкуствен интелект.
OpenAI планира да вгради DALL-E 3 в ChatGPT Plus и версията Enterprise на чатбота в близко бъдеще. Комбинирането на езиковите умения на чатбот с генератор на изображения ще позволи на потребителите да създават още по-точни изображения и ще осигури още повече възможности за фина настройка на заявката, ако първият получен резултат не е това, което потребителят очаква.
„При поискване ChatGPT автоматично ще генерира персонализирани, подробни съвети за DALL-E 3, от които да създадете изображение. Ако потребителят харесва полученото изображение, но то не отразява точно заявката, тогава може да направи промени като добави само няколко допълнителни поясняващи думи“, отбелязва OpenAI.
В момента DALL-E 3 е във фаза на предварителен преглед и се очаква да стане достъпен за абонатите на ChatGPT Plus и Enterprise през октомври чрез API. Използването на DALL-E 2 е платено, а месечният абонамент за ChatGPT Plus струва $20.
Понастоящем единственият популярен AI чатбот, който предлага безплатен вграден генератор на изображения, е Bing Chat AI от Microsoft. Между другото, той работи въз основа на мощния езиков модел GPT-4 от OpenAI.
„Както при DALL-E 2, изображенията, генерирани с помощта на DALL-E 3, ще бъдат собственост на потребителя и от него няма да се изискват разрешения за препечатване, продажба или разпространение“, уточнява OpenAI.
DALL-E 3 включва инструменти, които ограничават създаването на определени изображения. Например, генераторът ще отхвърля заявки с имена на публични личности или „вредни пристрастия“, за да намали риска от разпространение на пропаганда и дезинформация.
Разработчиците също тестват класификатор на произхода – инструмент, който ще определи дали изображението е генерирано от невронна мрежа. И накрая, DALL-E няма да генерира изображения в стила на художниците, които творят в момента.