Создание языковой базы данных стало одним из больших проектов, реализованных Удмуртским институтом истории, языка и литературы к 100-летию государственности республики.
Национальный корпус удмуртского языка – информационно-справочная система, основанная на собрании удмуртских текстов в электронной форме. Помимо массива текстов содержит электронные версии удмуртско-русского (2008) и русско-удмуртского словарей (2019). Над разработкой корпуса трудятся сотрудники Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН.
Сайт проекта включает два основных раздела: собственно корпус и словарь. Словарь позволяет не только переводить слова с одного языка на другой, но и прослушать, как звучат удмуртские слова. В корпусе же реализована возможность “гипертекстового” перевода – стоит навести курсор на любое слово в удмуртском тексте, как в окошке рядом появляется его перевод на русский язык.
Напомним, 27 января в Доме Дружбы народов прошла презентация двухтомного русско-удмуртского словаря, выпуск которого приурочен к 100-летию республики. Тогда было отмечено,что учёными также подписано соглашение с компанией Яндекс о создании электронного переводчика. В нём на основе технологий искусственного интеллекта будут применяться данные, собранные в новом издании словаря.
По материалам сайта газеты «Удмуртская правда».