Коми язык появится в сервисе «Яндекс.Переводчик» к концу года
Возможность машинного перевода с русского на коми язык в сервисе «Яндекс.Переводчик» появится уже в конце этого года. По словам Андрея Чемышева, работавшего в республике над созданием электронного коми-русского словаря, задержка с его появлением была связана со сменой ответственного специалиста в сервисе.
Сейчас в сервисе «Яндекс.Переводчик» уже присутствуют бета-версии удмуртского, марийского и горномарийского языков. О них на секции «СМИ. Информационные технологии» проходящего в Сыктывкаре VI съезда Ассоциации финно-угорских народов России рассказал заведующий отделом по инновационному развитию марийского языка и культуры Центра марийской культуры, сотрудник отдела языка Марийского НИИ языка, литературы и истории Андрей Чемышев.
По его словам, совершенствование машинного перевода требует от ученых и носителей языка постоянной работы с сервисом, например, редактирования предлагаемых переводов. В случае с коми языком – уже сделана большая часть необходимого для его появления в переводчике.
- Чтобы язык был включен в «Яндекс.Переводчик», нужно провести огромную работу. Я надеюсь, к концу года коми язык в «Яндекс.Переводчике» появится. Работа была начата, но начальник отдела машинного перевода ушел, и полгода в «Яндексе» не было человека на этом месте. Сейчас там появился новый человек, он раньше работал в Google. Это связано с тем, что сейчас перевод делается не только с опорой на корпусы текстов, но и с использованием нейросетей, - пояснил Андрей Чемышев.
По словам эксперта в математической лингвистике, пока сервис использует возможности нейросетей только для пары «русский – английский», но в перспективе эта технология будет применяться и в машинном переводе других языковых пар.
- Наша задача – облегчить функционирование наших языков в цифровом мире, чтобы полноценно представить язык в сети: сделать раскладки клавиатуры и буквы в юникоде, создать общедоступные электронные словари, системы проверки правописания и машинные переводчики. Кроме того, нужно заниматься национальной Википедией, работать с анализом тональности текста, - рекомендовал коллегам Андрей Чемышев.
Комментарии (49)
По поводу алкоголизации, то статистика указывает, что самые алкоголезависимые народы словенские и африканские Либеры белорусы, украинцы и русские.
Про алкоголизацию угров- это миф. ))))
Кому-то стыдно, но он ищет опрадание своим порокам, так как не в силах с ними справится, он клеймит своим пороком всех вокруг. )))
В психологии это назвается комплекс собутыльника.)))
Но словене получили наибольшее спаивание в этом процессе.
Результат виден в статистике.
Поэтому словене, вместо того , чтобы заняться здоровым образом жизни, ищут себе оправдание, и собутыльников.
Соответственно процес ещё не прекращен, у власти византийцы, а не словене и угры.
таджико-армяне не расстроятся, заменят
ну или матанализ там, ТОЭ.
выпустите - позовёте, а до тех пор это не язык, а сельский жаргон - как не пыжьтесь.