Башкирские филологи и программисты выпустили в свет совместный проект, доработка которого осуществлялась на грант в 3 миллиона рублей - его предоставил Глава Башкирии.
На выходе и команды получился высококачественный речевой машинный переводчик. Утилита может распознавать не только текст, но и голос. С помощью переводчика можно работать с короткими предложениями и крупными текстами.
Стоит отметить, что именно грантовая поддержка от государства позволила совершить прорыв в вопросе взаимодействия языкознания и высоких технологий.
Для реализации проекта были накоплены параллельные обучающие корпуса данных, проведена разработка методов искусственного расширения обучающих данных, внедрение структурно-функциональной модели морфем. Сами создатели переводчика также отмечают: весомая роль принадлежит нейросети.
Лингвисты обработали свыше 2 миллионов пар предложений на русском и башкирском языках.
Ожидается, что новый переводчик упростит жизнь, в том числе, людям с ограниченными возможностями здоровья. По словам представителей Фонда по сохранению и развитию башкирского языка, благодаря данному проект башкирский стал вторым в мире языком из группы тюркских, для которого доступны такие возможности перевода. Ранее ими мог похвастаться только турецкий язык.
Впервые для башкирского языка были созданы самые современные нейросетевые алгоритмы, «выставляющие» знаки препинания и заглавные буквы при переводе устной речи в письменную, что сделает получаемый текст более качественным и «читаемым».
Проект уже показали Главе республики. Он отметил важность сохранения Башкирии для последующих поколений и расширения возможностей языка, на котором говорили предки.