Български софтуер за превод работи офлайн на смартфони

„7-in-1 Offline Translator” функционира на базата на над 10 000 езикови правила

„7-in-1 Offline Translator” функционира на базата на над 10 000 езикови правила

Българска система за машинен превод между 7 езика работи и офлайн на мобилни телефони, като заема само около 100MB от паметта на апарата, благодарение на езиковите технологии.

Системата превежда между български, английски, френски, немски, италиански, испански и турски и има свои приложение за мобилни устройства за водещите платформи: Android, iOS и Windows Phone.

7-in-1 Offline Translator функционира на базата на над 10 000 езикови правила и не се нуждае от огромни по обем паралелни корпуси за статистически анализ, на каквито разчита например Google Translate, чиято офлайн версия се нуждае от около 10 пъти повече свободно място на телефона.

Системата е създадена от Лъчезар Джаков, който е докторант в Секцията по компютърна лингвистика в Института за български език при БАН и участва в проекта „Интегриране на нови практики и знания в обучението по компютърна лингвистика” по Оперативна програма „Развитие на човешките ресурси”.

Всеки може да тества системата онлайн на сайта на проекта. Достъпни за сваляне са версии за iOS ($4,99), Android (4,99 лв.) и Windows Phone (4 лв.), а скоро се очаква и приложение за BlackBerry OS.

Коментари по темата: „Български софтуер за превод работи офлайн на смартфони”

добавете коментар...

  1. Лъчезар Джаков

    @Драгомир:

    Опитайте пак 🙂

  2. Драгомир

    Тъй като беше реагирано на предишния лош превод, то реших да опитам да пробвам друго.

    Е, този път ударих на камък. Вижте само:
    > Дали ще го преведе през гората. / Дали ще го преведе през гората?
    тази преводачка> Will he transfer it in the forest. / Will he transfer it in the forest?
    google трансл.> Will it through the woods. / Whether it will through the woods?
    bing трансл.> If you walk through the forest. / If you walk through the Woods?

    Между другото препинателните знаци доста променят превода на google и bing понякога. Не знам дали това е правилно.

  3. Anonymous

    за ДРАГОМИР:

    >@77:
    >Не ме разбирай погрешно. Аз не се възхищавам на Google. Просто ми се искаше >българският продукт, който явно има потенциал да се конкурира с преводачката на Google, >да измисли такава тактика, която е конкурентна.

    Много, много отдавна се занимавах с подобна тематика (машинен превод) и да ти кажа – това си е сериозна наука и изисква много ресурс. Подхода на Гугъл и Майкрософт е близо до т.н. brute-force и се базира на извличане на правила на базата на огромен брой текстове (и съотвените грешки), докато една дузина други фирми (някои са с над 40 годишна история, специално за европейските става дума) имат много по-рафиниран подход. Преводът на някои от тях е много много по-добър от Гугъл Транслейт, специално за езиците от едно семейство.

    Само че се явява един играч (Гугъл) който предлага евтин, ама лош превод и всички вкупом му ръкопляскат… Е това е като чалгата, ама пренесено във високите технологии.

    Бъди здрав и ти пожелавам да създадеш продукт, дето да конкурира каквото и да е на Гугъл 🙂

  4. 77

    @Драгомир:
    “да измисли такава тактика, която е конкурентна”

    Точно там е проблемът с Google. Няма как да се конкурираш с някой, който хем прилага кофти практики (дъмпинг), хем е световноизвестен. Дъмпингът е обратното на понятието “конкуренция”. Може нещата, които успяват да постигнат в технологичен аспект, да са превъзходни, но бизнес-практиките им смърдят.

    Относно технологичните тактики, нещата са очевидни — няколко човека с доста ограничени ресурси са успяли да направят нещо, сравнимо с това, което прави многомилярдна компания с невъобразимо по-големи ресурси.

  5. Драгомир

    @99:
    Това е добре, че подобряват превода в движение.

    @77:
    Не ме разбирай погрешно. Аз не се възхищавам на Google. Просто ми се искаше българският продукт, който явно има потенциал да се конкурира с преводачката на Google, да измисли такава тактика, която е конкурентна.

  6. 77

    @Драгомир:

    А като цяло, писанията ти напълно оправдават отговора на въпроса защо не е добра идея да правиш любов на площада. Защото минават хора, и всеки дава акъл 🙂

  7. 77

    “И ти как смяташ, че човек може да се бори с дъмпинга? Подходящия начин е с подходяща конкурентна идея”

    Говоря по принцип, че Гугъл ползват кофти практики, и докато се кефиш на “безплатния” обяд, да не плачеш, като стане платен, или пък като им хареса твоята пазарна ниша, и решат да приложат дъмпинг там. Пък кой как ще се бори с тях не е моя работа.

  8. 99

    @ДРАГОМИР:

    Offline превода на гугъл е следния: “if you will be translated properly?”. Обаче на демо сайта го превежда “Will it be translated properly?”, не знам къде си гледал или пък дали е пипнат превода междувременно. По принцип съм забелязал че offline-а на google е по-зле специално между български / английски.

    @А:

    Не се връзвай на глупости, това е имал твоя познат – това е ползвал. Аргументи всеки може да извади.

  9. Драгомир

    Само да обясня, че аз не съм против продукта, а против стратегията на развитието на цялостния продукт. Просто имаме нищо специално, имитация на стандартен модел. И накрая трябва ли да очакват успех? Жалко е, защото може би самата разработка на преводача може би има много хляб в нея. Но като си мислим, че всичко около основния софтуер е само подробности…

    До 99:
    И все пак аз още чакам превода на “Дали ще се преведе както трябва?” с помощта на offline версията на Google translate. Ако не ти е проблем, тогава защо не го дадеш?

    До 77:
    И ти как смяташ, че човек може да се бори с дъмпинга? Подходящия начин е с подходяща конкурентна идея. Ясно е, че по цена не могат да бият безплатното. А по какво го бият? Само заради размера? Това е твърде слаб фактор. И таблети и лаптопи и смартфони все повече ги пълнят с все повече памет. За флаш паметта да не говорим. Докато може би за момента 1GB допълнителна RAM е проблемна, то след 2 години ще е толкова достъпна, колкото 100MB RAM сега. Тогава какво ще е значението че българската преводачка е малка като RAM? Ами никакво!!!
    Вземете пример от Opera. Имаха много ефективна система за изобразяване на web страници, генерирани отдалечено. Смартфоните подобриха параметрите си и тази система вече не беше предимство. Като резултат Opera въведе други продукти и дори изостави разработката на собствения си рендер. Така да се каже прояви гъвкавост.
    Тук в описвания продукт не виждам такава гъвкаво решение още при старта. Нещо, което да загатва – ние имаме важно стратегическо предимство, което ще позволи продукта да се развива и в бъдеще.

    До А:
    На твоят познат не преводач, а обикновен речник му е бил нужен. А речниците са дори много по-малки от 100MB (естествено).

  10. А

    @ДРАГОМИР: Пропускаш offline фактора, който е много важен! Особено ако излезеш извън ЕС зоната. На един познат му се наложи да търси аптека в едно зачукано село нейде из централна Турция, където не само нямало интернет, но и GSM мрежа, а местните не са и чували за чужди езици. И за разлика от европейските езици “аптека” на турски няма нищо общо с думата с която сме свикнали. Е, точно този транслатор го спаси, а доколкото виждам най-джижаната версия струва колкото 2 кафета.

  11. 77

    “За каква конкуренция и какъв монопол можем да говорим тогава? ”

    Явно си пропуснал някои от часовете по история, по-специално тези, в които се говори за това що е то дъмпинг и как се практикува за да се постигне монопол. Докато трае дъмпингът потребителите са щастливи, защото получават нещата безплатно или почти безплатно. Но, както е добре известно, няма безплатен обяд. След като се постигне реален монопол в дадената пазарна ниша и конкурентните производители фалират, тогава става забавно за монополиста и тъжно за потребителите.

  12. Юзвер

    Хубаво нека да се опитват от СКАЙКОД ООД въпреки че фирмата е с основна дейност внос и продажба на компютърни части.

  13. 99

    @ДРАГОМИР:

    Предполагам че авторите на програмата знаят колко са неграмотни днешните младежи. Аз не бих отворил технологията, ако ще се пълни с “znae6 li 4e” и подобни, ако беше моя 🙂

  14. Драгомир

    @99
    Защо не пробваш ти offline превода, щом имаш достъп до него? Аз работя само онлайн и не инсталирам нищо на компютъра си. Ето дал съм тестовото изречение: “Дали ще се преведе както трябва?”, което е добре да се преведе.

    Ето да допълня статистиката:
    bing translator> Whether it will translate well?
    Между другото имаше период в който bing translator превеждаше по-добре от Google.

    >Изобщо няма да се учудя ако някой ден направят Google Translate платен
    А българската алтернатива, ако изчезне тестовия сайт си е и сега платена. За каква конкуренция и какъв монопол можем да говорим тогава? За да нямало монопол, то да плащаш за нещо, което го имаш по-качествено и то безплатно.

    И освен това къде е гаранцията, че българската алтернатива ще се развива, а няма да изчезне? След като хората си накупуват преводача, то от какво ще печели авторът в бъдеще? Не виждам някакъв траен бизнес модел. Дано да греша…

    Аз вече го казах в предишното ми мнение – защо не се отвори възможността за допълване на правила? Ако се прави нещо ново, то поне да има някакво конкурентно предимство.

  15. 99

    @ДРАГОМИР:

    По-добре пробвай оффлайн превода на Google ако ще сравняваш 🙂 Работи в пъти по-зле от онлайна, да не говорим че заема 10 пъти повече място за 7 езика (мерил съм го, но не точно с тия езици – въпреки това съотношението е подобно).

    Аз лично не отричам постиженията на Google, но взеха да стават твърде големи (даже четох скоро че щели да почнат да правят лекарства, в момента си играят с автомобили) – а всеки монопол е вреден. Изобщо няма да се учудя ако някой ден направят Google Translate платен – и тогава всички малки фирми (над 30 в ЕС) които от години инвестират в подобни технологии няма да ги има (смазани от конкуренцията на Google), за да предложат алтернатива.

  16. Драгомир

    Текст за превод:
    > Дали ще се преведе както трябва?
    Превод от демо сайта:
    > Whether he will translate by being needed?
    Превод от Google:
    > Will be translated properly?

    Моето мнение е, че подобен продукт би имал успех, ако въпросните правила не останат капсулирани в софтуера, а се даде възможност потребителят да ги модифицира и разширява. В случая не говорим за мобилна версия, а примерно за сайт, който да е за превод, а не само за демо на мобилната версия.

    Иначе е забавно че има турски, но няма руски (другите езици са си на мястото). Напълно в демократичен дух.

Коментар