Plag.bg: изкуствен разум открива плагиатството

Услугата plag.bg е свободно достъпна чрез регистрация и може да се използва напълно безплатно

В коридорите на един университетски факултет в София неотдавна настана смут: секретарката предупреждаваше тихомълком млади научни сътрудници да внимават какви научни публикации готвят, защото „скоро целият архив ще бъде онлайн”. С други думи, „внимавайте откъде и какво преписвате”…

Склонността да се създават научни трудове, анализи, есета и дори поеми с откраднати чужди текстове е бич за всички автори, особено в ерата на интернет. Най-актуалният инструмент за справяне с това явление е plag.bg – сайт, който проверява за уникалност текстовете, включително с възможности да сравнява между различни езици и дори да открива перифразирани текстове.

В научната общност, за изследователите и създателите на словесно съдържание да напишат нова публикация е от фундаментално значение. Това е същността на техния принос. Проблемът касае всекиго от съвременното общество, защото хората, които напредват в кариерата с измама, са утрешните лекари, които ни лекуват, инженери, които строят домовете ни, или научни сътрудници, които пишат учебниците на децата ни. При създателите на съдържание – т. нар. копирайтъри – плагиатството означава директни финансови щети.

Днес все по-популярните инструменти от типа антиплагиат еволюират бързо и са нещо значително повече от средство за разпознаване на случаите „copy+paste”.

Изкуствен интелект

Стъпвайки на съвременните технологии за изкуствен интелект, plag.bg показва, че компютърните програми могат в голяма степен да „разбират“ текстовете при проверката за крадено съдържание. Това им позволява да разпознаят кога даден материал е взет от другаде и перифразиран, за да не бъде разпознат. Идентифицирането на перифразирани чужди текстове е един от трите основни параметъра, които формират оценката за този софтуер при проверка за плагиатство.

Лоши цитати

Много съществена помощ оказва софтуерът с открояването на т.нар. лоши цитати. По правило цитатът е приемлива форма на използване на чужд текст. Това обаче е допустимо съобразно определени правила – използване на кавички, споменаване на автора, посочване на неговото произведение, евентуално годината на издаване; цитатите са приемливи тогава, когато не надвишават определена част от обема на текста, например 10%.

Важно е да се има предвид, че резултати за открито плагиатство в обем до 5% се приемат за „технически“, т.е. допустими – това обикновено се дължи на употребата на често използвани изрази

Когато някое от тези условия не е изпълнено, plag.bg указва нередностите в цитирането. Така например софтуерът очертава в предупредителен цвят цитатите, които нямат референция – не е указан авторът. Правилно цитираното остава оцветено в зелено.

Разпознаване на препис от чуждоезичен текст

Plag.bg се справя и с друг проблем на плагиатството – кражбата от чуждоезични източници. Преводите на чуждо творчество се сигнализират в системата.

Удобна цветова легенда разкрива кой текст е плагиатстван. Крадените фрази се оцветяват в червено, а перифразираните – в оранжево.

Софтуерът използва удобна цветна легенда, за да очертае кои части от даден текст са оригинални и кои имат смущаваща прилика с вече съществуващо словесно творчество на български или чужд език.

Защита на собствения материал

Естествено, при работата с подобен софтуер-антиплагиат изниква и въпросът „добре, но ако кача свой текст в този сайт, сигурно ли е, че той няма да „изтече?”. Порталът използва SSL криптиране за формирането на защитена връзка между компютъра на потребителя и сървъра на plag.bg. Това прави трансфера на данните защитен.

Качените документи се сравняват анонимно с различни бази данни и източници в интернет. Потребителят може да изтрие файловете, които е качил, по всяко време. Неговите документи не се вграждат в каквито и да е бази данни – не оставят никаква следа.

Разбира се, остава въпрос на лична бдителност потребителят да използва достатъчно надеждни име и парола – и да не ги споделя с други хора.

Такси и ограничения

Услугата plag.bg е свободно достъпна чрез регистрация и може да се използва напълно безплатно. Засега сайтът има известни ограничения в работата: борави само с текстовите формати DOC и DOCX, което всъщност е добре, защото това означава прехвърляне на сравнително малки обеми данни. Създателите му обещават скоро да се работи и с отворения ODT формат.

Потребителите на безплатната версия трябва да приемат факта, че може да им се наложи да изчакват, за да се обработи техният документ. Ако желаят да ускорят процедурата, те могат да заплатят скромна цена, за да видят резултата си по-скоро.

За професионалистите има и други функции, които си струват инвестицията. Най-съществената от тях е изготвянето на пълен доклад с анализ на текста, който е проверен, в случаите, в които е установена съмнителна прилика с вече съществуващи източници.

Такъв доклад може да послужи за доказателство за авторите, за които е важно да имат аргумент в полза на своята обективност, честност и независимост. Всеки доклад представя плагиатстваните текстове в различни цветове и предлага връзки към източниците, от които изглежда да е взето даденото съдържание.

Мария Малцева

Мария Малцева