

ИА "Башинформ" сообщает, что озвучил проект известный башкирский телеведущий Наиль Юнусов. Башкирско-русский и русско-башкирский переводчик представлен на веб-сервисе: https://bashkortsoft.ru/.
В рамках проекта поставлены следующие задачи: накопление параллельных обучающих корпусов данных, разработка методов искусственного расширения обучающих данных, внедрение структурно-функциональной модели морфем, а также создание программных средств обучения машинного переводчика на основе современных нейросетевых подходов — будет способствовать решению актуальных и значимых задач по сохранению, развитию и популяризации государственных языков в Республике Башкортостан, а также расширению присутствия башкирского языка в интернет-пространстве.
Наиль Юнусов прокомментировал процесс создания пректа так: «Над порталом мы работали нынешним летом около 2,5 месяцев. Было непросто. Мне поставили задачу - читать максимальное количество слов в день, чтобы тембр голоса не менялся. Первое время я начитывал всего по 200-250 слов в день, речь должна быть размеренной, в одной тональности, не как в обычной жизни. Голос поначалу уставал. В концу проекта я дошел до 1300 слов в день. Несмотря на сложности, мы это сделали. Надеюсь, что наш вклад пригодится в изучении башкирского языка, и люди будут с удовольсвтием пользоваться этим ресурсом».
Озвученные диктором записи были проанализированы и обработаны экспертами. Итогом этой работы стала база данных, готовая для использования при обучении нейросетевого синтезатора башкирской речи. В общей сложности было выделено 19 892 предложения общей длительностью 40 часов.
На данный момент на сайте в режиме тестирования запущен синтез речи. Тестирование можно пройти через любой браузер, заранее обновив кеш, так как сайт может показывать старую версию сайта без иконки синтеза речи.
Цель проекта-способствование активному развитию информационных технологий в Республике Башкортостан и паритетному функционированию государственных языков Республики Башкортостан.







