Русско-татарский общественно-политический тезаурус
Формализованное описание лексической системы языка предполагает на определенном этапе создание предметно-ориентированных тезаурусов. Создание общественно-политических тезаурусов представляет для татарского языка большой интерес по ряду причин. Во-первых, общественно-политическая сфера помимо терминов соответствующей предметной области включает общеупотребительную лексику, которая обычно неоднозначна и представляет сложность для описания. В отличие от общеупотребительной лексики терминам общественно-политической сферы гораздо в меньшей степени свойственна многозначность. Во-вторых, общественно-политические тезаурусы могут, при необходимости, быть расширены и включать в себя лексику других предметных областей. В-третьих, общественно-политический тезаурус может использоваться как формализованный лингвистический ресурс в различных приложениях для автоматической обработки новостных документов, правовых актов или сообщений в социальных сетях.
Русско-татарский тезаурус общественно-политической лексики разработан на основе тезауруса РуТез и, в целом, повторяет его концептуальную структуру. Тематически тезаурус охватывает следующие основные сферы: политику и сферу управления, международные отношения, экономику и финансы, производство и промышленность, армию и военные отношения, социальную сферу, культуру и искусство, религию, спорт и др. Кроме того, в тезаурус включены отдельные значимые подобласти общего лексикона, смежные с общественно-политической зоной.
Моделирование тезауруса осуществляется в формате РуТез с сохранением концептуальной структуры тезауруса РуТез. Лексический материал отображается на двух уровнях: на уровне концептов и лексических входов (репрезентанты концептов в текстах). Важной задачей при разработке тезауруса является отображение специфики лексико-семантической системы татарского языка. Заполнение лексических входов концептов тезауруса предполагает, по возможности, максимальный охват существующих вариантов – параллельных наименований одного и того же явления.
Объем татарского общественно-политического тезауруса - 10000 концептов на декабрь 2019 г., в том числе более 6000 концептов с разработанными лексическими (текстовыми) входами.
Проект выполнен при финансовой поддержке Российского научного фонда (проект № 16-18-02074 «Разработка моделей связывания терминологии в разных языках (на материале русского и татарского языков)»).