Презентация русско-татарского машинного переводчика «Татсофт»

Презентация русско-татарского машинного переводчика «Татсофт» 03.11.2019

Презентация русско-татарского машинного переводчика «Татсофт»

25 октября 2019 года в Доме «Сәләт» прошла презентация русско-татарского машинного переводчика на основе нейоросетей.

Первая версия русско-татарского переводчика на основе нейросетевого подхода была разработана Институтом прикладной семиотики Академии наук Республики Татарстан в 2018 году. В основе подхода была выбрана архитектура нейросети encoder-decoder-attention. В 2019 году система перевода была обновлена: построены модели на базе архитектуры Transformer, использовались алгоритмы внедрения языковых моделей в нейросеть, впервые для русско-татарской пары были проведены эксперименты по использованию параллельных данных для других языков с целью переноса знаний (transfer learning). Эксперименты с современными алгоритмами проводились совместно с лабораторией машинного обучения Университета Иннополис. 

В качестве основных обучающих данных используется созданный в институте параллельный корпус общим объемом 983 319 пар русско-татарских предложений, включающий тексты новостной тематики, литературу, переводы законов и нормативных актов. Проведенные эксперименты показали, что созданная система превосходит по качеству существующие на данный момент аналоги. 

В презентации приняли участие представители СМИ, научной общественности, государственных учреждений Республики Татарстан, специалисты по татарскому языку из институтов Академии наук РТ и Казанского федерального университета. Также пришли студенты Института филологии и межкультурной коммуникации КФУ, обучающиеся по направлению филология и переводоведение, которые под руководством преподавателей уже начали тестировать переводчик и изучать его возможности.

Переводчик доступен по адресу translate.tatar и предоставляет следующий функционал: 
  1. Перевод текстов в русско-татарском и татарско-русском направлениях; 
  2. Озвучивание результатов перевода на русском и татарском языках; 
  3. Двуязычный интерфейс; 
  4. Возможности оценки качества перевода для улучшения работы системы. 


Возврат к списку