Зилаирские огни
+30 °С
Облачно
Общество
9 Ноября 2021, 09:34

Фонд по сохранению и развитию башкирского языка запустил новый проект Bashkortsoft

Bashkortsoft является первым в своем роде проектом, переводящим цельные предложения с башкирского языка на русский и с русского на башкирский язык.

Фонд по сохранению и развитию башкирского языка запустил новый проект BashkortsoftФонд по сохранению и развитию башкирского языка запустил новый проект Bashkortsoft
Фонд по сохранению и развитию башкирского языка запустил новый проект Bashkortsoft

ИА "Башинформ" сообщает, что озвучил проект известный башкирский телеведущий Наиль Юнусов. Башкирско-русский и русско-башкирский переводчик представлен на веб-сервисе: https://bashkortsoft.ru/.

В рамках проекта поставлены следующие задачи: накопление параллельных обучающих корпусов данных, разработка методов искусственного расширения обучающих данных, внедрение структурно-функциональной модели морфем, а также создание программных средств обучения машинного переводчика на основе современных нейросетевых подходов — будет способствовать решению актуальных и значимых задач по сохранению, развитию и популяризации государственных языков в Республике Башкортостан, а также расширению присутствия башкирского языка в интернет-пространстве.

Наиль Юнусов прокомментировал процесс создания пректа так: «Над порталом мы работали нынешним летом около 2,5 месяцев. Было непросто. Мне поставили задачу - читать максимальное количество слов в день, чтобы тембр голоса не менялся. Первое время я начитывал всего по 200-250 слов в день, речь должна быть размеренной, в одной тональности, не как в обычной жизни. Голос поначалу уставал. В концу проекта я дошел до 1300 слов в день. Несмотря на сложности, мы это сделали. Надеюсь, что наш вклад пригодится в изучении башкирского языка, и люди будут с удовольсвтием пользоваться этим ресурсом».

Озвученные диктором записи были проанализированы и обработаны экспертами. Итогом этой работы стала база данных, готовая для использования при обучении нейросетевого синтезатора башкирской речи. В общей сложности было выделено 19 892 предложения общей длительностью 40 часов.

На данный момент на сайте в режиме тестирования запущен синтез речи. Тестирование можно пройти через любой браузер, заранее обновив кеш, так как сайт может показывать старую версию сайта без иконки синтеза речи.

Цель проекта-способствование активному развитию информационных технологий в Республике Башкортостан и паритетному функционированию государственных языков Республики Башкортостан.

Автор:София Серкова
Читайте нас