Вики-конференция 2015/Программа/Доклады/Локализация MediaWiki на региональные языки России


Основные цели доклада:

  • показать состояние перевода интерфейса движка на региональные языки России;
  • обратить внимание на существующие проблемы.
Файл:Локализация MediaWiki на региональные языки России.pdf
Слайды доклада

Каждую вики-конференцию которую удается посетить я напоминаю коллегам, что кроме великой и могучей Русской Википедии в России есть вики-проекты на региональных языках России. То есть это языки тех 160 разных народов, проживающих в России, или около ста так называемых коренных народов России, то есть, народов, не имеющих государственных образований вне России, или 54 официальных языков республик и других регионов федерации. Вики-проекты на этих языках также имеют право быть представленными в Викимедиа РУ.

Отрадно заметить, что руководители нашего национального чаптера начали упоминать наши проекты в своих торжественных (и не очень) речах. За что я очень им благодарен.

Сколько википедий и других вики-проектов на региональных языках России?

править

Тут, как и в вопросе сколько народов и языков в России, масса тонкостей. Начиная с того, какой язык считать региональным языком России (например, можно ли им считать идиш) и заканчивая тем, вводить ли в список тестовые проекты, находящиеся в инкубаторе, учитывая многолетнюю заброшенность большинства из них?

Тем не менее, для того, чтобы не претендуя на академичность, сделать обзор, можно делать небольшие допущения. Это упрощает дело. Прошу учесть это и не судить слишком строго.

Википедий открытых на российских языках 24 штуки. Еще не открытых, но тех, которые можно наполнять в тестовом режиме — 10 штук. Викиновостей — 1 Викисловарей — 1 (есть не открытые) Викитек — 2 (также есть тестовые) Существует также масса невикимедиевских, «нефондовых» вики-проектов, также использующих вики-движок.

Что такое локализация и зачем она нужна

править

Локализация — грубо говоря, это перевод интерфейса компьютерной программы или, в нашем случае сайта, на какой-либо неанглийский язык. Собственно, локализацией на русский язык все мы и пользуемся. А поскольку в России практически каждый человек (если он не очень стар) владеет письменным русским языком, то, возникает вопрос о необходимости в локализации на татарский, саха или любой другой язык. Нужно ли переводить?

Вчера эстонским коллегой было хорошо продемонстрировано, как язык и принадлежность к той или иной культуре влияет на изложение материала. Даже самым объективным викимедистом. Это первое. Вторым моментом является то, что материнский или родной язык воспринимается ментально, психологически, эмоционально несколько по другому. Это обусловлено культурными отличиями и может быть, даже какими-то нейробиологическими или, точнее, нейрофизиологическими причинами.

Это когда-то хорошо и понятно выразил известный борец за права человека и народов Нельсон Мандела. Он сказал следующие слова: «Говоря с человеком на том языке, который он понимает, ты говоришь с его головой. Если ты говоришь с человеком на его родном языке, ты говоришь с его сердцем».

То есть локализовывать нужно. К тому же, для регистрации любого нового раздела на языке, Языковой Комитет Фонда в качестве одного из критериев положительного решения считает перевод интерфейса. Разумеется не всего, а хотя бы основных групп слов. То есть, если вы хотите, чтобы проект вышел из инкубатора — будьте любезны перевести хотя бы 500 фраз.

Где это делается и кем

править

Существует специальный сайт ТранслэйтВики.нет на котором в онлайн-режиме любой человек владеющий тем или иным языком и наделенный соответствующими правами, может переводить интерфейс МедиаВики.

Впрочем, на этом сайте переводится/локализуется не только МедиаВики, но и масса другого софта. Всего таких проектов на сегодня 30. Есть люди, специализирующиеся на переводе единиц интерфейса, а есть люди, которые выверяют переводы, редактируют уже сделанные переводы. Единицей перевода может быть как отдельное слово (слово «файл», к примеру), так и фраза, предложение или целый текст, а также аббревиатура.

Сайт работает круглые сутки, переводы делаются на массу языков. Например MediaWiki начинали переводить на 370 языков. А активных языковых сообществ на сегодня поменьше — 200. Это число постоянно меняется.

Количество локализаторов на русский язык — 58 человек. Не все из них активны, но тем не менее, практически ежедневно появляющиеся единицы для перевода в том же ежедневном режиме переводятся. Движок постоянно совершенствуется, появляются какие-то дополнения или уточнения формулировок.

Как обстоит дело с переводами?

править

Как видите, картина очень разнообразная. МедиаВики более или менее постоянно переводится на 23 региональных языка России. Я уже упоминал вскольз о группах перевода. Существуют важные группы и группы, подлежащие переводу во вторую и третью очередь. Для движка ВМ есть несколько таких групп (слайд со списком групп). Это:

  • Wikipedia Mobile Apps — 725
  • Translatewiki.net main page — 52
  • Translatewiki.net — 73
  • MediaWiki (most important messages)
  • MediaWiki — 25 860
  • Installer — 315
  • MediaWiki Action API — 1310
  • MediaWiki core — 3358
  • MediaWiki extensions — 21 117
  • MediaWiki skins — 106

Некоторые, как вы понимаете, вложены одна в другую, как матрешки.

Теперь приступим к рассмотрению конкретных примеров по группам.

править

(слайд Мобайл, ТранслэйтВики) Значение перевода Мобайла — интерфейса для мобильных устройств — велико, ибо сейчас очень многие заходят в энциклопедию со смартфонов и планшетов. Значение ТранслэйтВики не столь велико, но тем не менее, уровень перевода показывает серьезные намерения переводчиков и косвенно степень разработанности терминологии на языке. Можно заметить, что серьезно к сегменту мобильных пользователей подходят саха, башкиры, татары, осетины.

(слайд МастВики) Теперь собственно МВ. Три группы: Most, Core и Extention.

Must то выделяют, то не выделяют. Одно время он надолго исчезал. Полгода назад Амир Ахарони выделил для практических целей, и когда я неделю назад делал набросок презентации эта группа была, а буквально вчера — исчезла. Поэтому не смогу сказать точно сколько позиций она содержала. В разное время от 500 до тысячи с хвостиком. Core — это сердцевина. То есть основные сообщения. Эту группу важно переводить в первую очередь и постоянно следить за новинками. Extention — соответственно все что вне core, сама она внутри группируется на сотни подгрупп. Как только закончили перевод core — надо начинать переводить эту группу…


Доклад вместе с ответами на вопросы рассчитан на 30 минут. Автор доклада — Николай Павлов