Картина дняПолитикаЭкономикаОбществоПроисшествияСВОФинансыСпортВфокусеПогодаКурсыСделано в России

Казанские ученые разрабатывают русско-татарский голосовой онлайн-переводчик

4 мая 2023,источник: ИА Татар-информ

Ученые Института прикладной семиотики разрабатывают русско-татарский голосовой онлайн-переводчик. Он будет работать на основе онлайн-переводчика Tatsoft (Татсофт), который казанские специалисты презентовали в 2019 году.

Казанские ученые разрабатывают русско-татарский голосовой онлайн-переводчик
Источник: ИА Татар-информ

Tatsoft — русско-татарский машинный переводчик, позволяющий переводить тексты с русского на татарской язык и обратно. В настоящее время разработчики занимаются автоматизацией перевода. Искусственный интеллект будет распознавать устную речь на татарском или русском языке, переводить ее и озвучивать перевод.

«Для того, чтобы научить искусственный интеллект правильно переводить с помощью устной речи, нам надо собрать как минимум 200 часов речевой базы. Нетрудно построить модель, понимающий речь одного человека, но если будем учитывать большую аудиторию, где люди говорят по-разному, то необходимо записать больше голосов», — пояснил на пресс-конференции в «Татар-информе» директор Института прикладной семиотики АН РТ Ринат Гильмуллин.

Собирать базу речевых образцов ученые намерены с помощью телеграм-бота, который можно найти в мессенджере по поиску «Татар тавышы».

«Любой желающий может присоединиться к телеграм-боту и внести свой вклад в развитие татарского языка в сфере высоких технологий. Для этого надо вслух прочитать короткие тексты, предлагаемые в телеграм-боте, записать свой голос и отправить в чат. За три недели со старта проекта в нем уже приняли участие 467 человек, получены 16 тысяч аудиозаписей и собрано 24 часа речи. Нам необходимо минимум в десять раз больше».

рассказал Ринат Гильмуллин

По словам ведущего научного сотрудника института Булата Хакимова, самые активные участники — девушки 16−24 лет и мужчины 60−70 лет. Чтобы искусственный интеллект правильно воспринимал татарскую речь, важно, чтобы в записи аудио участвовали и представители других категорий, сказал ученый.