02.03.2020

В Переводчике Гугл появился Татарский язык

"Google тәрҗемәчесенең татарча эшли башлавы татар теленең дәрәҗәсен күрсәтә"

26 февраль Google Translate хезмәте үзенең телләр исемлегенә 5 тел өстәгәнен игълан итте. Системга татар, төрекмән, уйгыр, киньяруанда һәм одия телләре өстәлгән. Соңгы тапкыр ширкәт сайтына яңа телләрне 2016 елда өстәгән иде, ул вакытта тәрҗемә системына кыргыз һәм көрд кебек телләр өстәлгән иде.

Татар теленең дөньякүләм тәрҗемә системына кушылуы көтелгән вакыйга дисәк, бу һич тә арттыру булмас. Татар активистлары әлеге хезмәткә татар телен өстәү теләге белән инде кимендә 2012 елдан бирле янып йөри. Ул елда "Интернет татарча сөйләшә" чарасы барышында активистлар Google һәм башка сайтларга татар телен куллануны тәкъдим итеп, күпсанлы хат юллаган иде.

Моның тәэсирендәме, әллә татар теленә ихтыяҗ күрепме, 2013 елда Google волонтерлар өчен татар теленә тәрҗемә итү почмагын ачты. Волонтерлар анда тәкъдим ителгән инглизчә сүз-гыйбарәләрне татарчага тәрҗемә итте, булган тәрҗемәләргә тавыш бирде, янәсе, Google тәрҗемәчесе шул рәвешле татар телен өйрәнгән.

Тәрҗемә эшендә актив катнашкан активист Ирек Хаҗиев Азатлыкка ул чакта эш тиз бара алмый, системга тел өстәлсен өчен Google базасында 1 миллион тәрҗемә җыелырга тиеш дип аңлаткан иде. Әлеге база татар телендәге күптелле сайтлар, ачык мәкаләләр (Википедия), китаплар, дәүләт сайтлары, ачык сүзлекләр белән туплана. Моңа волонтерлар да ярдәм итеп үз өлешен кертә.

Дөнья татар яшьләре форумы волонтерлар эшен түләүле итәргә чакырып махсус проект әзерләгән иде, тик ул республика тарафыннан хуплау тапмаган. Эш волонтерлар кулында гына калды. Дөрес, 2018 елда мәсьәләгә Татарстан президенты да игътибар итте, татар телен Google Translate системына кертү мөмкинлеген карарга кушты.

Элек Google ширкәтендә эшләгән, хәзер Apple-да хезмәт итүче IT белгече Илдус Әхмәдуллин Google-га ике ел элек мөрәҗәгать иткәндә, ​татар телен тәрҗемәчегә өстәү әле төгәл планда юк иде дип әйткәннәрен сөйләде. Аннары аны 2020 ел башына планлаштырдылар, бу эшкә тестлар алып баручыны эзләделәр. Татар телен хәзер өстәү план нигезендә башкарылган, аны ниндидер соңгы вакыйгаларга бәйләргә кирәк түгел, диде ул Азатлыкка. Аның сүзләренчә, әлегә тәрҗемәче эшендә хилафлыклар булырга мөмкин, ширкәт аны даими камилләштерергә җыена.

Google Translate сайтына татар телен керү нинди өстенлекләр бирә? Бу татар теле үсешенә нинди йогынты ясый ала? Шушы һәм башка сорауларны Google тәрҗемә эшләрен башкарган активистлар һәм IT өлкәсе белгечләреннән сорадык.

"Tatsoft тәрҗеманы Google-дан бер елга иртәрәк ясалды"

Google Translator — татар теленнән беренче тәрҗеман түгел. Татарстан фәннәр академиясенең Гамәли семиотика институты бер ел элек Tatsoft дип аталган тәржемәче ясады. Нейрочелтәр моделенә нигезләнгән, русчадан татарчага һәм татарчадан русчага эшләүче бу тәрҗемәченең онлайн версиясе ​рәсми рәвештә узган көздә тәкъдим ителде. Шулай ук Яндекс тылмачы да үз исемлегенә татар телен өстәде.

Гамәли семиотика институтының өлкән фәнни хезмәткәре, Tatsoft тәржемәчесен ясаучы Айдар Хөсәенов Google Translator-ның татарча эшли башлавын татар теле өчен IT-технологияләр үсеше һәм татар теленең интернетта актив кулланылышы өчен мөһим вакыйга дип саный.

"Google, Yandex, Tatsoft кебек төрле тәрҗемәчеләр булуы һәм аларның киләчәктә үсеше, һичшиксез, мәгълүмат туплау һәм белем бирү теле буларак татар теленә ихтыяҗның тагы да артуына ярдәм итәчәк", диде ул Азатлыкка.

Шушы гамәлдәге өч системны чагыштырып буламы дигән сорауга Айдар беренче BLEU тест нәтиҗәләрен китерде. Бу нәтиҗәkohгә караганда, әлегә иң яхшы тәрҗемәне Tatsoft бирә — 26 балл, икенче урында Google — 17 балл, һәм өченче урында Яндекс — 13 балл чамасы.

Айдар сүзләренчә, нейрон челтәрләргә корылган "Татсофт" тәрҗемәчесе уникаль үзенчәлекләргә ия, аларны алга таба да үстерү планлаштырыла.

Бу хакта тулырак язманы Азатлык сайтыннан укырга була.

Центр перспективных экономических исследований Академии Наук РТ 50 лучших инновационных идей для Республики Татарстан Виртуальный музей-библиотека Академии Наук Республики Татарстан Татарстанский ЦНТИ