Цифровата пропаст всъщност е… езикова

Приблизително 5% от хората по света говорят английски вкъщи, но около 50% от съдържанието в интернет е на английски (илюстрация: CCO Public Domain)

Около половината от населението на света все още няма достъп до интернет. Компании като Facebook, SpaceX и Amazon искат да променят това. Те работят по пускането на съзвездия от сателити в небето, които да излъчват интернет до всяка точка на Земята. Но дори и тези проекти да са успешни, проблемът с достъпа до интернет може би е не толкова технологичен. Има друга, по-съществена пречка пред преодоляването на цифровото разделение: езикът.

Хиляди различни езици се говорят по света. Ала по-голямата част от съдържанието в мрежата е достъпна само на няколко избрани езика, основно английски. Повече от 10% от Wikipedia е написана на английски език и почти половината от статиите на сайта са на европейски речи. Да накараш още един милиард души да са онлайн звучи като голяма работа, но нека си представим какво ще стане, когато тези потребители се регистрират за първи път – те ще открият, че интернет няма какво да им предложи на техния език.

„Приблизително 5% от хората по света говорят английски вкъщи”, казва Хуан Ортис Фроулър, член на Фондация „Световна мрежа”, цитиран от Wired. Въпреки това около 50% от съдържанието в интернет е на английски.

Проблемът с дигиталната пропаст не е в технологиите, казва Кристен Чернешоф, директор на организация Wikitongues, която насърчава езиковото многообразие. Корпорациите и правителствата рядко предоставят ресурсите и подкрепата, необходими за $качването” на по-малките езици онлайн.

За подобна ситуация има исторически причини. Повечето от най-големите онлайн платформи са създадени в САЩ, в Силициевата долина – и са развити предимно като англоезични потребителски бази. Тъй като те се разпространяват по света и на различни езици, то другите езици винаги са догонващи.

Но това догонване не е незначително. Facebook, например, е обект на остри критики, че не използва достатъчно местни администратори, за да наблюдава съдържанието в страни, където има милиони потребители. В Мианмар компанията от години има само шепа модератори, въпреки че т.нар. реч на омразата се разпространяваше бързо. По-късно Facebook призна, че не е направила достатъчно, за да предотврати използването на платформата си за подбуждане към насилие в страната.

Друга част от проблема произтича от факта, че на „малки” езици са създадени сравнително малко „набори от данни”, които да са подходящи за обучение на инструменти за изкуствен интелект. Например, езикът синхала, който се говори от около 17 милиона души в Шри Ланка и може да се пише по четири различни начина, е предизвикателство. Алгоритмите на Facebook, обучени предимно на английски и редица европейски езици, не го „картографират” добре. Това прави трудно управлението на платформи под този език.

Ала езиковото многообразие е нещо повече от практичност, когато става дума за изразяване, казва Чернешоф. Шегите, емоциите и изкуството често са трудни, ако не и невъзможни за превеждане на друг език.

До някаква степен отговорът на проблема е в „отворения код”, изглежда. Mozilla е организация, работеща за натрупването на множество набори от езикови данни, които да могат да се използват от всеки разработчик безплатно – като Common Voice, който – според организацията – е „най-разнообразният набор от гласови данни в света”. Проектът е предназначен да даде на инженерите инструментите, от които се нуждаят, за да изградят неща като програми за превръщане на говора в текст на различни езици.

Марк Сурман, изпълнителен директор на Mozilla Foundation, смята, че масивите от данни с отворен код като Common Voice са сред малкото жизнеспособни начини за осигуряване на повече езиково многообразие в нововъзникващите технологични системи. В организациите с комерсиална цел – т.е. във фирмите – този проблем „пада много ниско в икономическата стълбица”, казва Сурман.

Привличането на повече езици онлайн може в крайна сметка да се окаже „упражнение по запазване на културата”, а не само въпрос на ползваемост. И за да се постигне това, насърчаването на езиковото разнообразие в интернет е нужно и ще изисква съгласувани усилия от хора по цял свят.

Коментари по темата: „Цифровата пропаст всъщност е… езикова”

добавете коментар...

  1. ха

    Изидорус Б. звучиш като проповедник в секта, което не е хубаво. И ти казвам това, защото това което казваш е вярно, но не намираш правилния подход да го представиш, така че наистина да въздействаш на някого.

  2. Изидорус Б.

    Интернет , в днешния си вид, е изобретение на американската еврейска машина.

    Не се безпокойте, Господарите на света няма да ви позволят да останете дълго извън Интернет. Да сте извън Интернет означава да запазите независимото си мислене и да си спестите 90% от американо-еврейската пропаганда, която е в Мрежата.
    Да сте извън Интернет означава да останете настрана от глобалистката пропаганда за „Глобалното затопляне” , ваксините , Изкуствения интелект и прочие глупости.

    Та, Господарите не са никак очаровани , ако сте останали извън Интернет.

    Затова те правят всичко възможно да обхванат и най-последното кътче на тази планета с Мрежата. Услужливи слуги на Глобалистите като Илон Мъск, Марк Зукърбърг или Джеф Безос вече си предложиха услугите за създаването на глобален , сателитен и… БЕЗПЛАТЕН интернет за всеки един по света.
    Безплатен , защото ще се изплати от рекламодателите, които само чакат да се включите в Мрежата, за да ви бомбардират с реклами.

  3. Изидорус Б.

    Е, пък голяма работа ако не си в Интернет.

    Животът е текъл хиляди години преди това изобретение на злото – Интернет да се появи. Животът ще тече и хиляди годнини , след като Интернет изчезне. На некомерсиалните езици си има книги, вестници и каквото там още е нужно, за да съществуват.

    Българският дълбоко отвратен и дълбоко комплексиран компютърджия не може да си представи, че без Интернет има живот, но има. И си спестяваш цялата помия, която залива Мрежата и е 90% от нейното съдържание. Да, 90% от Интернет е помия, порно, фейк нюз, пропаганда, реклама. Всеки ден се създават милиони нови сайтове и едва 1% от тях си заслужават да ги отвориш.

    Тези народи ще си спестят и вонята на социалните мрежи – Инстаграм, Туитър и Фейксбук , и всичките безсмислени глупости вътре.
    Да, има живот и извън Интернет , и той е също така шарен, стойностен и хубав. В него жените са реални, а не се измерват в гигабайти порно. Има реално общуване между хората, а не чрез глупави туитове, фейсбук състояния и инстаграм лайкове. Извън Интернет има природа, а не картинки на десктопа.

    Да останеш извън Интернет означава да останеш в истинския живот, а не да бъдеш в неговото виртуално копие – мрежата. Това един компютърджия или геймър едва ли може да го разбере. Интернет в самото си начало беше нещо революционно и прогресивно. Имаше малко на брой сайтове и те бяха стойностни. Сега е една лайняна и задръстена с боклук мрежа, която губи времето на хората.

    Изключете Интернета и влезте в РЕАЛНИЯ, ИСТИНСКИЯ ЖИВОТ.

  4. Saevar

    колегата под мен Y (01011001) добре го е казал “който не умее да се адаптира или просперира …” много маймун има вече на тази планета, поне 2 езика всеки трябва да знае за да е конкурентен.. 70% от приятелите и познатите ми говорят повече от 2..

  5. 01011001

    който не умее да се адаптира или просперира ще исчезне. светът не е за всеки и всички. преди човекоподобните маси имаха стойност като роб и потребител, но вече тази остаряла капиталистическа гледна точка няма основи. а масите все повече се размножават, замърсяват околната среда и изразходват ресурсите.
    а с партизански игри и емигрантски вълни процесът е много бавен и мъчителен от човешка гледна точка и много ресурси се изхабяват напразно.

  6. Фофуфен

    Умника под мен пак се изказа…
    А това за троловете направо е патетичо, когато го чуеш от прословут трол 😉

  7. Фофу

    Троловете нещо не са разбрали опорните точки и сега плющят заучени глупости.

  8. ха

    Колониализмът е точно обратното явление на това за което miracles happen споменава. Да не развиваш компютърния превод (и той да стои в едно подигравателно некадърно състояние) и да няма интернет ресурси на твоя език, за да си принуден да учиш езика на колонизатора ти. Естествено зарибяването с превеждане на някоя друга страница на твоя език – това определено се прави и в момента.

  9. miracles happen

    Да се очаква някой да им създава съдържание – ей така от милсърдно мисонерство е твърде наивно … В най-добрия случай ще е от колонизаторски манипулативни намерения. В крайна сметка – следва да пораснат, и да си създават съдържание сами, като ползват достиженията на прогреса …

Коментар