Андрей Чемышев: «На конгрессе в Венгрии финно-угроведы должны потребовать от «Консорциума Юникода» утверждения наших букв»

Как сообщал Инфоцентр FINUGOR.RU в Интернете появилась коми-марийско-удмуртская раскладка клавиатуры для 64-разрядной Windows 7.

Инфоцентр задал несколько вопросов идейному вдохновителю этого проекта Андрею Чемышеву. Оказалось, что, несмотря на появление финно-угорских раскладок в Интернете, на все более активное использование национальных языков во Всемирной паутине, в этой сфере остается достаточно много нерешенных проблем. Именно на них, как убежден А.Чемышев, должны обратить внимание участники XI конгресса финно-угроведов, который состоится в Венгрии в августе этого года.

Андрей, откуда у вас появилась такая идея? Почему возникла необходимость в создании раскладки именно на этих трех языках: коми, марийском и удмуртском?

Идея появилась в 2008 году, когда проблема несовместимости различных шрифтов кодировки Win-1251 стояла очень остро. Нами было даже написано письмо Биллу Гейтсу о том, что наши марийские буквы не включены в стандартный пакет Windows. А шрифтов с поддержкой стандарта Юникод было очень и очень мало.

Ситуация изменилась, когда правительство России заказало у фирмы «Паратайп» общедоступные (бесплатные) шрифты с поддержкой национальных алфавитов России. Сейчас первая партия этих шрифтов готова и находится в свободном доступе. Очень надеемся, что данная работа продолжится, и мы будем получать все новые и новые шрифты.

Но и тут дела обстоят не очень гладко. Проблема касается шрифтов с кодами так называемой F-зоны. Фирмой «Паратайп» в эти создаваемые шрифты были включены не только дополнительные буквы национальных алфавитов, но и дополнительные знаки для диалектов языка, обсуждаемых для включения в национальные алфавиты, а также дополнительные знаки, используемые в лексикографических источниках, знаки, показывающие долгие гласные. Новые буквы, у которых не было юникодовских кодов, «Паратайп» разметил в F-зоне. Так вот, «Консорциум Юникода», в чьем ведении находится утверждение этих знаков, бесконечно долго тянет с их признанием. Пока Консорциум не утвердит наши финно-угорские знаки, эти буквы невидимы в Интернете. При утверждении Консорциум коды может и поменять. Это не так важно, главное, буквы должны быть утверждены.

Насчет трех языков - это просто географически мне близко. Вот в нашей коми-марийско-удмуртской раскладке клавиатуры для Windows, если вы заметили, есть дополнительные буквы, которые используются только  в коми-язьвинском диалекте коми языка (коми-язьвинцев всего около 2 тысяч человек)...

Эрзянам и мокшанам раскладка не нужна, у них все буквы из русского алфавита, нет дополнительных букв. Не переживайте, и до остальных финно-угорских языков доберемся.
Возьмем, к примеру, хантыйский язык.

Хантыйский алфавит на основе кириллицы был введен в 1937 году. Реформирован в 1952 и 2000 годах.

Дополнительные знаки и их Юникоды

Современный суммарный алфавит для четырех диалектов хантыйского языка — ваховского, казымского, сургутского и шурышкарского — состоит из букв русского алфавита и ряда специфических знаков (выделены красным). В квадратных скобках приведены альтернативные формы знаков, предпочтительные для использования в хантыйском языке на территории Ямало-Ненецкого автономного округа. Зеленым цветом выделены важные для языка исторические знаки и знаки, встречающиеся в лексикографических источниках.

Обратите внимание на буквы в квадратных скобках - перед ними в табличке стоят очень похожие буквы. Звуки одни и те же, а пишут по-разному. Это означает, что ханты из Салехарда не могут договориться с хантами из Ханты-Мансийска насчет единых букв. А на F- начинаются коды, не утвержденных Консорциумом дополнительных букв.

Не этим ли должны заниматься ученые - финно-угроведы, которые в очередной раз в августе этого года соберутся в Венгрии? Что они там будут обсуждать? Какую пользу принесут нашим финно-угорским народам? Я считаю, именно они должны требовать от «Консорциума Юникода», чтобы те, наконец-то, утвердили наши буквы, они должны помочь систематизировать и стандартизировать буквы хантам. Подобных проблем у финно-угорских народов много.
 
Кто помогал Вам в этом проекте?

Таких людей пока мало. Сотрудники ОАО ЛИНУКС ИНК много чем помогают, Михаил Пирогов, Вячеслав Килеев - это наши «марийские» программисты. Может быть, со временем нас будет больше?

Каковы дальнейшие планы по использованию информационных технологий в развитии финно-угорских языков?

Будем делать различные электронные словари. Есть, например, идея сделать коми-марийский, эрзя-коми или марийско-удмуртский словари. В данный момент переводим локаль (locale) для Линукса (Linux) на марийский язык. Будем работать дальше над марийской компьютерной терминологией. Хотим несколько программ перевести на марийский язык, такие как браузер, программу обмена мгновенными сообщениями. Еще думаем над тем, как сделать систему проверки правописания. Портал хотим сделать для финно-угорских лингвистов, переводчиков.

К нам недавно обратились ведущие российские разработчики различных операционных систем Линукс (Linux) с просьбой помочь сделать раскладку клавиатуры для всех языков России.

Пока мы анализируем существующие раскладки клавиатуры - это башкирская, калмыцкая, коми, осетинская, татарская, удмуртская, чувашская и якутская раскладки. При внимательном анализе данных раскладок можно обнаружить некоторые неточности. Кое-что придется править.

Нужны раскладки клавиатуры как минимум для таких языков Российской Федерации, как абазинский, аварский, агульский, адыгейский, даргинский, кабардино-черкесский, лакский, лезгинский, рутульский, табасаранский, цахурский, азербайджанский, алтайский, бурятский,  вепсский, долганский, ингушский, ительменский, карачаево-балкарский, карельский, кильдинский, корякский, кумыкский, ливвиковский, людиковский, мансийский, марийский (в НауЛинукс уже есть марийская раскладка клавиатуры), нанайский, нганасанский, ненецкий, татский, тувинский, хакасский, хантыйский, чеченский, чукотский, эвенкийский, эвенский, энецкий, юкагирский. Многие раскладки мы уже сделали, размещаем их на сайте www.marlamuter.ru.

Для нескольких языков раскладки клавиатуры не нужны — это мокшанский, эрзянский, ногайский языки, так как буквы и специфические сочетания алфавитов этих языков состоят из букв русского алфавита. Но мы склоняемся к идее, чтобы сделать раскладки и для этих трех языков. Почему? Представьте, человек, не знающий русского языка, ищет в операционной системе раскладку для эрзянского языка. Мы всегда за то, чтобы все языки были «прописаны» в Интернете.

Ну, и напоследок еще один «камень» в сторону финно-угроведов. Печально то, что некоторым языкам не присвоены коды ISO 639 — это международный стандарт ISO сокращений названий языков. Так вот, ливвиковскому и людиковскому наречиям карельского языка «положены» коды ISO 639-3, а мы их почему-то не наблюдаем. Хотя уважающий себя язык должен иметь также код ISO 639-1. У марийского языка, кстати, нет кода ISO 639-1.

Финно-угроведам давно пора идти в ногу со временем. Им надо понять, что на наших языках выпускаются не только их «умные» книжки, но и наши языки пытаются функционировать в электронном информационном пространстве. Я не удивлюсь, если среди приглашенных на IX конгресс в Венгрии не окажется ни одного математического лингвиста.

А у нас впереди работы так много! В век высоких технологий важно, чтобы национальные языки активнее использовались в Сети. Их используют миллионы людей по всей стране. Но раскладки нужны не только им, они нужны всем.

Читайте также:
Loading...