Разработчиците на Google са подобрили с изкуствен интелект спам филтрите в последната актуализация на услугата за електронна поща Gmail. В блога си те я наричат „една от най-големите актуализации на сигурността през последните години”.
Става въпрос за интегриране на новата система за класификация на текст Resilient & Efficient Text Vectorizer (RETVec) в пощенските услуги. Тя успешно идентифицира спам съобщения, включително имейли с голям брой специални знаци, емотикони, правописни грешки и други елементи, които преди са били различими за хората, но трудни за откриване от спам филтрите.
Според наличните данни, новият алгоритъм ефективно идентифицира, наред с други неща, съобщения с хомоглифи, т.е. графично много подобни един на друг знаци, различни по значение, отбeлязва Arstechnica.
Google твърди, че алгоритъмът RETVec е обучен да идентифицира съобщения с тест, който е бил манипулиран по някакъв начин, включително вмъкване или изтриване на знаци, правописни грешки, хомоглифи и т.н. Алгоритъмът е трениран с помощта на усъвършенстван енкодер, който може да кодира всякакви знаци и думи във формат UTF-8. В резултат на това разработчиците получават алгоритъм, който работи на повече от 100 езика по света.
RETVec изглежда функционира по начина, по който хората четат. Алгоритъмът е изграден върху рамката TensorFlow AI и в своя процес търси визуално „сходство”, за да определи значението на думите, а не знаците, от които те всъщност се състоят.
Според Google, замяната на използвания преди това текстов векторизатор на Gmail с RETVec е повишила нивото на откриване на спам с 38%, а броят на фалшивите положителни резултати е намалял с 19,4%.
В същото време броят на тензорните процесори (TPU), използвани от модела, е намалял с 83%, което прави настоящата актуализация една от най-значимите на системата за сигурност на Gmail през последните години.