Новости
03.11.2019
Презентация русско-татарского машинного переводчика «Татсофт»
25 октября 2019 года в Доме «Сәләт» прошла презентация русско-татарского машинного переводчика на основе нейоросетей.
Первая версия русско-татарского переводчика на основе нейросетевого подхода была разработана Институтом прикладной семиотики Академии наук Республики Татарстан в 2018 году. В основе подхода была выбрана архитектура нейросети encoder-decoder-attention. В 2019 году система перевода была обновлена: построены модели на базе архитектуры Transformer, использовались алгоритмы внедрения языковых моделей в нейросеть, впервые для русско-татарской пары были проведены эксперименты по использованию параллельных данных для других языков с целью переноса знаний (transfer learning). Эксперименты с современными алгоритмами проводились совместно с лабораторией машинного обучения Университета Иннополис.
В качестве основных обучающих данных используется созданный в институте параллельный корпус общим объемом 983 319 пар русско-татарских предложений, включающий тексты новостной тематики, литературу, переводы законов и нормативных актов. Проведенные эксперименты показали, что созданная система превосходит по качеству существующие на данный момент аналоги.
В презентации приняли участие представители СМИ, научной общественности, государственных учреждений Республики Татарстан, специалисты по татарскому языку из институтов Академии наук РТ и Казанского федерального университета. Также пришли студенты Института филологии и межкультурной коммуникации КФУ, обучающиеся по направлению филология и переводоведение, которые под руководством преподавателей уже начали тестировать переводчик и изучать его возможности.
Переводчик доступен по адресу translate.tatar и предоставляет следующий функционал:
- Перевод текстов в русско-татарском и татарско-русском направлениях;
- Озвучивание результатов перевода на русском и татарском языках;
- Двуязычный интерфейс;
- Возможности оценки качества перевода для улучшения работы системы.