Технология на Google маркира текстове, генерирани от AI

Все повече текст в мрежата се генерира от AI, което стимулира появата на инструменти за идентифицирането му (снимка: CC0 Public Domain)

Google внедрява технология за маркиране и разпознаване на текстове, създадени от генеративни AI модели. Инструментът, наречен SynthID Text, няма да повлияе на качеството и скоростта на генериране на съдържание и ще бъде достъпен напълно безплатно за разработчици и компании.

SynthID Text работи по следния начин. Когато генерира текст, моделът прогнозира кой е следващият “токен” (символ или дума) въз основа на вероятността за появяване на всеки токен и добавя допълнителна информация към разпределението на тези вероятности чрез модулиране на коригираните знаци. В крайна сметка те образуват воден знак, който помага да се определи дали текстът е създаден от AI.

„Окончателният модел на вероятностите за думи, избран от модела, комбиниран с модифицираните оценки на вероятността, ще се счита за воден знак”, обяснява компанията в блог публикация.

Google твърди, че SynthID Text, който беше интегриран в AI модела Gemini през пролетта, не влияе на качеството, точността или скоростта на генериране на текст. Въпреки това текстът, който е бил съкратен, перифразиран или променен, може да бъде обработен малко по-лошо, отбелязва TechCrunch.

Що се отнася до фактите, „отговорите на въпроси, които са твърде конкретни и недвусмислени, предоставят по-малко възможности за коригиране на разпределението на токените, без да се компрометира фактическата точност”, поясняват разработчиците.

Google не е единствената компания, която работи върху технологията за воден знак на текст, генериран от AI. Например OpenAI също разработваше методи за прилагане на водни знаци, но забави пускането им поради технически пречки и търговски съображения.

Ако технологията бъде широко възприета, тя може да преобърне ситуацията с неточните, но все по-популярни „AI детектори”, които погрешно идентифицират студентски работи или есета като генерирани от невронна мрежа.

Някои държави вече предприемат действия по маркиране на AI съдържанието. Например, китайското правителство въведе задължително етикетиране на съдържание, генерирано от AI, а американският щат Калифорния е на път да последва този пример.

Коментар