Ученые Института прикладной семиотики разрабатывают русско-татарский голосовой онлайн-переводчик. Он будет работать на основе онлайн-переводчика Tatsoft (Татсофт), который казанские специалисты презентовали в 2019 году.
Tatsoft – русско-татарский машинный переводчик, позволяющий переводить тексты с русского на татарской язык и обратно. В настоящее время разработчики занимаются автоматизацией перевода. Искусственный интеллект будет распознавать устную речь на татарском или русском языке, переводить ее и озвучивать перевод.
«Для того, чтобы научить искусственный интеллект правильно переводить с помощью устной речи, нам надо собрать как минимум 200 часов речевой базы. Нетрудно построить модель, понимающий речь одного человека, но если будем учитывать большую аудиторию, где люди говорят по-разному, то необходимо записать больше голосов», – пояснил на пресс-конференции в «Татар-информе» директор Института прикладной семиотики АН РТ Ринат Гильмуллин.
Собирать базу речевых образцов ученые намерены с помощью телеграм-бота, который можно найти в мессенджере по поиску «Татар тавышы».
«Любой желающий может присоединиться к телеграм-боту и внести свой вклад в развитие татарского языка в сфере высоких технологий. Для этого надо вслух прочитать короткие тексты, предлагаемые в телеграм-боте, записать свой голос и отправить в чат. За три недели со старта проекта в нем уже приняли участие 467 человек, получены 16 тысяч аудиозаписей и собрано 24 часа речи. Нам необходимо минимум в десять раз больше», – рассказал Ринат Гильмуллин.
По словам ведущего научного сотрудника института Булата Хакимова, самые активные участники – девушки 16-24 лет и мужчины 60-70 лет. Чтобы искусственный интеллект правильно воспринимал татарскую речь, важно, чтобы в записи аудио участвовали и представители других категорий, сказал ученый.