Гласовите асистенти слушат по-често, отколкото мислим

Устройствата, активирани с глас, имат склонност да се събуждат случайно и да записват
(снимка: CC0 Public Domain)

Колко често Alexa и нейните създатели слушат разговорите на един притежател на подобен гласов асистент? Оказва се – по-често, отколкото той самият предполага. Според нов доклад на Northeastern University, умните устройства се активират до 19 пъти на ден, записвайки до 43 секунди аудио всеки път.

Има много вицове за гласовите асистенти и техните притежатели, но се оказва, че в шегата има доза истина. Налице са доказателства, че устройствата, активирани с глас, имат склонност да се събуждат случайно и да започнат да записват, ако „сметнат”, че човек е казал отключващата дума. Това не е никак приятно, ако държите на личната неприкосновеност. Добре известно е, че компаниите, които разработват и произвеждат този клас устройства, имат служители, чиято основна задача е именно това – да слушат малки фрагменти от записите на реални потребители.

Все пак една изследователска група от Northeastern University се е заела да определи количеството на непредвидените активации на гласовите асистенти и записите, които те извършват „неволно”. „Анекдотите не са грешни”, казва пред Vox Дейвид Чофнес, доцент по компютърни науки в университета, който е работил върху доклада. Чофнес и колегите му изследователи са тествали пет типа умни асистенти: първо поколение Google Home Mini, първо поколение Apple HomePod, Microsoft Harman Kardon Invoke, както и второ и трето поколение Amazon Echo Dot.

За целта на експеримента те накарали устройствата да изслушат няколко 125-часови цикъла от телевизионни предавания. През това време учените следили дали, кога и как устройствата се активират „случайно”. Добрата новина е липсата на доказателства, че устройствата непрекъснато записват разговори. Освен това около половината от случайните активирания са продължили по-малко от шест секунди.

Ето и лошата новина: около половината от случайните записи са продължили над шест секунди, като някои записи траят до 43 секунди. Това става без разрешението на хипотетичния потребител – даже и без негово знание. Чофнес казва, че макар и рядкост, тези дълги активации реално се случват.

Известно успокоение внася уточнението, че „тестовата среда не имитира стопроцентово реалната среда, в която се използват тези устройства”. Така например, гласовете идват от телевизионния екран, което не винаги е представително за това как хората говорят помежду си. Освен това звукът идва от говорител, а не от реална човешка уста. Затова действията на гласовите асистенти не са непременно представителни за ситуациите в реалния живот.

Както може да се очаква, устройствата обикновено се активират, когато се изрече дума, подобна на задействащата дума – когато има звукова прилика, асистентите се събуждат. Независимо от марката, производителя и името, всички гласови асистенти са „предразположени” към случайни активирания, вариращи средно от 1,5 до 19 пъти на ден. Устройствата на Apple и Microsoft се активират по-често от останалите.

Въпреки че резултатите от това проучване са скорошни, информацията, че умните асистенти могат да се активират „случайно” и да записват случайни разговори, не е новост. Който има такъв уред в дома си, навярно е забелязал ситуации, в които се случва подобно нещо.

Това, което повечето хора не знаят, е че без значение дали активирането е случайно или умишлено, записите се съхраняват на сървъри и дори могат да бъдат прослушвани от човешки уши. Звучи страховито, но за това си има причина: колкото повече знаят доставчиците за събития като случайните активирания, толкова повече информация имат за усъвършенстването на софтуера си за разпознаване на глас. Обичайно хората, които прослушват записите, нямат представа кого точно слушат, тяхната работа е да следят взаимовръзката между гласа и събитията, отчетени в регистрите на софтуера.

Новият доклад на учените е част от по-голямо и по-мащабно проучване, което има за цел да разгледа и това какво се случва с всички данни, които гласово-активираните асистенти събират. Чофнес се надява в резултат на работата му потребителите да се чувстват по-информирани и да могат по-добре да решават сами дали рискът за поверителността, който идва от гласово-активираните устройства, си заслужава удобството, което човек получава.

Изследователят е на мнение, че потребителите не бива да бъдат натоварвани със задачата да се занимават с баланса между комфорта и личната неприкосновеност. „Не те трябва да взимат решенията”, каза Чофнес. „В крайна сметка трябва да имаме регламенти за прилагане на добро поведение по отношение на защитата на личните данни”.

И тъй като много хора се чудят какво точно чуват техните гласови асистенти, добре е да с знае, че всеки потребител на подобен уред може да прослуша своите записи – да ги чуе, да ги изтрие и да ограничи или забрани възможността някой друг да ги прослушва.

Коментар