
Българска система за машинен превод между 7 езика работи и офлайн на мобилни телефони, като заема само около 100MB от паметта на апарата, благодарение на езиковите технологии.
Системата превежда между български, английски, френски, немски, италиански, испански и турски и има свои приложение за мобилни устройства за водещите платформи: Android, iOS и Windows Phone.
7-in-1 Offline Translator функционира на базата на над 10 000 езикови правила и не се нуждае от огромни по обем паралелни корпуси за статистически анализ, на каквито разчита например Google Translate, чиято офлайн версия се нуждае от около 10 пъти повече свободно място на телефона.
[related-posts]
Системата е създадена от Лъчезар Джаков, който е докторант в Секцията по компютърна лингвистика в Института за български език при БАН и участва в проекта „Интегриране на нови практики и знания в обучението по компютърна лингвистика” по Оперативна програма „Развитие на човешките ресурси”.
Всеки може да тества системата онлайн на сайта на проекта. Достъпни за сваляне са версии за iOS ($4,99), Android (4,99 лв.) и Windows Phone (4 лв.), а скоро се очаква и приложение за BlackBerry OS.

16 коментара
@Драгомир:
Опитайте пак 🙂
Тъй като беше реагирано на предишния лош превод, то реших да опитам да пробвам друго.
Е, този път ударих на камък. Вижте само:
> Дали ще го преведе през гората. / Дали ще го преведе през гората?
тази преводачка> Will he transfer it in the forest. / Will he transfer it in the forest?
google трансл.> Will it through the woods. / Whether it will through the woods?
bing трансл.> If you walk through the forest. / If you walk through the Woods?
Между другото препинателните знаци доста променят превода на google и bing понякога. Не знам дали това е правилно.
за ДРАГОМИР:
>@77:
>Не ме разбирай погрешно. Аз не се възхищавам на Google. Просто ми се искаше >българският продукт, който явно има потенциал да се конкурира с преводачката на Google, >да измисли такава тактика, която е конкурентна.
Много, много отдавна се занимавах с подобна тематика (машинен превод) и да ти кажа – това си е сериозна наука и изисква много ресурс. Подхода на Гугъл и Майкрософт е близо до т.н. brute-force и се базира на извличане на правила на базата на огромен брой текстове (и съотвените грешки), докато една дузина други фирми (някои са с над 40 годишна история, специално за европейските става дума) имат много по-рафиниран подход. Преводът на някои от тях е много много по-добър от Гугъл Транслейт, специално за езиците от едно семейство.
Само че се явява един играч (Гугъл) който предлага евтин, ама лош превод и всички вкупом му ръкопляскат… Е това е като чалгата, ама пренесено във високите технологии.
Бъди здрав и ти пожелавам да създадеш продукт, дето да конкурира каквото и да е на Гугъл 🙂
@Драгомир:
“да измисли такава тактика, която е конкурентна”
Точно там е проблемът с Google. Няма как да се конкурираш с някой, който хем прилага кофти практики (дъмпинг), хем е световноизвестен. Дъмпингът е обратното на понятието “конкуренция”. Може нещата, които успяват да постигнат в технологичен аспект, да са превъзходни, но бизнес-практиките им смърдят.
Относно технологичните тактики, нещата са очевидни — няколко човека с доста ограничени ресурси са успяли да направят нещо, сравнимо с това, което прави многомилярдна компания с невъобразимо по-големи ресурси.
@99:
Това е добре, че подобряват превода в движение.
@77:
Не ме разбирай погрешно. Аз не се възхищавам на Google. Просто ми се искаше българският продукт, който явно има потенциал да се конкурира с преводачката на Google, да измисли такава тактика, която е конкурентна.
@Драгомир:
А като цяло, писанията ти напълно оправдават отговора на въпроса защо не е добра идея да правиш любов на площада. Защото минават хора, и всеки дава акъл 🙂
“И ти как смяташ, че човек може да се бори с дъмпинга? Подходящия начин е с подходяща конкурентна идея”
Говоря по принцип, че Гугъл ползват кофти практики, и докато се кефиш на “безплатния” обяд, да не плачеш, като стане платен, или пък като им хареса твоята пазарна ниша, и решат да приложат дъмпинг там. Пък кой как ще се бори с тях не е моя работа.
@ДРАГОМИР:
Offline превода на гугъл е следния: “if you will be translated properly?”. Обаче на демо сайта го превежда “Will it be translated properly?”, не знам къде си гледал или пък дали е пипнат превода междувременно. По принцип съм забелязал че offline-а на google е по-зле специално между български / английски.
@А:
Не се връзвай на глупости, това е имал твоя познат – това е ползвал. Аргументи всеки може да извади.
Само да обясня, че аз не съм против продукта, а против стратегията на развитието на цялостния продукт. Просто имаме нищо специално, имитация на стандартен модел. И накрая трябва ли да очакват успех? Жалко е, защото може би самата разработка на преводача може би има много хляб в нея. Но като си мислим, че всичко около основния софтуер е само подробности…
До 99:
И все пак аз още чакам превода на “Дали ще се преведе както трябва?” с помощта на offline версията на Google translate. Ако не ти е проблем, тогава защо не го дадеш?
До 77:
И ти как смяташ, че човек може да се бори с дъмпинга? Подходящия начин е с подходяща конкурентна идея. Ясно е, че по цена не могат да бият безплатното. А по какво го бият? Само заради размера? Това е твърде слаб фактор. И таблети и лаптопи и смартфони все повече ги пълнят с все повече памет. За флаш паметта да не говорим. Докато може би за момента 1GB допълнителна RAM е проблемна, то след 2 години ще е толкова достъпна, колкото 100MB RAM сега. Тогава какво ще е значението че българската преводачка е малка като RAM? Ами никакво!!!
Вземете пример от Opera. Имаха много ефективна система за изобразяване на web страници, генерирани отдалечено. Смартфоните подобриха параметрите си и тази система вече не беше предимство. Като резултат Opera въведе други продукти и дори изостави разработката на собствения си рендер. Така да се каже прояви гъвкавост.
Тук в описвания продукт не виждам такава гъвкаво решение още при старта. Нещо, което да загатва – ние имаме важно стратегическо предимство, което ще позволи продукта да се развива и в бъдеще.
До А:
На твоят познат не преводач, а обикновен речник му е бил нужен. А речниците са дори много по-малки от 100MB (естествено).
@ДРАГОМИР: Пропускаш offline фактора, който е много важен! Особено ако излезеш извън ЕС зоната. На един познат му се наложи да търси аптека в едно зачукано село нейде из централна Турция, където не само нямало интернет, но и GSM мрежа, а местните не са и чували за чужди езици. И за разлика от европейските езици “аптека” на турски няма нищо общо с думата с която сме свикнали. Е, точно този транслатор го спаси, а доколкото виждам най-джижаната версия струва колкото 2 кафета.
“За каква конкуренция и какъв монопол можем да говорим тогава? ”
Явно си пропуснал някои от часовете по история, по-специално тези, в които се говори за това що е то дъмпинг и как се практикува за да се постигне монопол. Докато трае дъмпингът потребителите са щастливи, защото получават нещата безплатно или почти безплатно. Но, както е добре известно, няма безплатен обяд. След като се постигне реален монопол в дадената пазарна ниша и конкурентните производители фалират, тогава става забавно за монополиста и тъжно за потребителите.
Хубаво нека да се опитват от СКАЙКОД ООД въпреки че фирмата е с основна дейност внос и продажба на компютърни части.
@ДРАГОМИР:
Предполагам че авторите на програмата знаят колко са неграмотни днешните младежи. Аз не бих отворил технологията, ако ще се пълни с “znae6 li 4e” и подобни, ако беше моя 🙂
@99
Защо не пробваш ти offline превода, щом имаш достъп до него? Аз работя само онлайн и не инсталирам нищо на компютъра си. Ето дал съм тестовото изречение: “Дали ще се преведе както трябва?”, което е добре да се преведе.
Ето да допълня статистиката:
bing translator> Whether it will translate well?
Между другото имаше период в който bing translator превеждаше по-добре от Google.
>Изобщо няма да се учудя ако някой ден направят Google Translate платен
А българската алтернатива, ако изчезне тестовия сайт си е и сега платена. За каква конкуренция и какъв монопол можем да говорим тогава? За да нямало монопол, то да плащаш за нещо, което го имаш по-качествено и то безплатно.
И освен това къде е гаранцията, че българската алтернатива ще се развива, а няма да изчезне? След като хората си накупуват преводача, то от какво ще печели авторът в бъдеще? Не виждам някакъв траен бизнес модел. Дано да греша…
Аз вече го казах в предишното ми мнение – защо не се отвори възможността за допълване на правила? Ако се прави нещо ново, то поне да има някакво конкурентно предимство.
@ДРАГОМИР:
По-добре пробвай оффлайн превода на Google ако ще сравняваш 🙂 Работи в пъти по-зле от онлайна, да не говорим че заема 10 пъти повече място за 7 езика (мерил съм го, но не точно с тия езици – въпреки това съотношението е подобно).
Аз лично не отричам постиженията на Google, но взеха да стават твърде големи (даже четох скоро че щели да почнат да правят лекарства, в момента си играят с автомобили) – а всеки монопол е вреден. Изобщо няма да се учудя ако някой ден направят Google Translate платен – и тогава всички малки фирми (над 30 в ЕС) които от години инвестират в подобни технологии няма да ги има (смазани от конкуренцията на Google), за да предложат алтернатива.
Текст за превод:
> Дали ще се преведе както трябва?
Превод от демо сайта:
> Whether he will translate by being needed?
Превод от Google:
> Will be translated properly?
Моето мнение е, че подобен продукт би имал успех, ако въпросните правила не останат капсулирани в софтуера, а се даде възможност потребителят да ги модифицира и разширява. В случая не говорим за мобилна версия, а примерно за сайт, който да е за превод, а не само за демо на мобилната версия.
Иначе е забавно че има турски, но няма руски (другите езици са си на мястото). Напълно в демократичен дух.