В Чебоксарах в Чувашском госуниверситете с 23 по 27 января проходит курс по совместной разработке научно-прикладных проектов в области машинного перевода для языков народов России. Об этом сообщил Инфоцентру FINUGOR активист проектов по цифровому представлению финно-угорских языков, сотрудник межрегиональной лаборатории по электронному представлению финно-угорских языков в Коми академии госслужбы и управления Андрей Чемышев.
Цель курса - дать практические знания по созданию автоматического переводчика с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На данной платформе создано около 40 автоматических переводчиков и еще многие находятся в процессе создания. Речь, прежде всего, идет об автоматических переводчиках между родственными языками.
Стоит отметить, что сотрудники Apertium проявляют большой интерес к региональным языкам и активно поддерживают те языки, ресурсы которых малы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.
Слушатели курсов получат знания, которые позволят им участвовать в конкурсах на получение грантов по созданию новых автоматических переводчиков, например Google Summer of Code.
Преподают на курсах западные специалисты, в частности, ученый-лингвист, специалист по морфологии уральских языков, руководитель центра изучения саамского языка Gjellatekno в университете Тромсё (Норвегия) Тронд Тростеруд. С 1999 года он разрабатывал морфоанализаторы и и систему машинного перевода для саамских и других уральских языков. Также преподают специалист в области машинного перевода, аспирант факультета компьютерных наук университета Алаканта (Испания) Францис Мортон Таерз и специалист по фонетике и тюркским языкам, аспирант лингвистического факультета Университета Индианы (США) Джонатан Норт Вашингтон.
С программой курсов можно ознакомиться здесь.