Големи медии забраниха AI бота на Apple да ги обхожда

Изкуственият интелект се обучава най-често от публично достъпните данни в сайтовете
(снимка: CC0 Public Domain)

Едни от най-големите социални медии и новинарски сайтове забраниха на Apple да събира техни данни за обучение на своите модели с изкуствен интелект. За това помогна и самата компания.

Не е тайна, че източниците на данни за обучение на системите за генеративен изкуствен интелект най-често са публично достъпните уеб ресурси. Apple даде възможност на техните собственици да се откажат от събирането на данни за обучение на AI системата Apple Intelligence.

Много от най-големите уеб ресурси се възползваха от тази възможност, включително социалните мрежи Facebook и Instagram, както и медии като New York Times и The Atlantic.

През последните няколко години Apple използва уеб робот, наречен AppleBot, който събира данни за обучение на гласовия асистент Siri и търсачката Spotlight. Наскоро компанията включи към AppleBot и своята AI система Apple Intelligence. 

Това е противоречива практика, тъй като AI ползва материали със защитени авторски права – в тесни области, където изобщо няма много материали, системите цитират цели параграфи почти без промяна, отбелязва 9to5Mac.

Apple твърди, че събира информация етично, филтрирайки личните данни, използвайки само лицензирани материали и публично достъпни данни, които идват от скенера AppleBot.

За да даде възможност на уеб администраторите да откажат да събират информация за обучение на AI, компанията използва псевдонима Applebot-Extended – стандартното индексиране на търсенето остава в сила, когато този псевдоним е забранен.

Отказът се извършва чрез въвеждане на съответната директива във файла robots.txt, който е публично достъпен в уеб сайтовете, което означава, че всеки може да види кой издател е блокирал достъпа до Apple Intelligence. Това вече е направено от Facebook, Instagram, Craigslist, Tumblr, New York Times, Financial Times, The Atlantic, Vox Media, USA Today Network и Wired.

Малко над една четвърт от големите американски новинарски сайтове (294 от 1167) отказаха да допуснат изкуствения интелект на Apple в своите уеб ресурси.

Според непотвърдена информация, Apple е сключила сделки с някои медийни компании, плащайки им за правото да използват техни материали за обучение на AI. Вероятно други сайтове също се надяват на пари от Купертино.

Коментар