Internationalization (Русский)

From ArchWiki
Jump to: navigation, search

Tango-preferences-desktop-locale.pngЭта страница нуждается в сопроводителеTango-preferences-desktop-locale.png

Статья не гарантирует актуальность информации. Помогите русскоязычному сообществу поддержкой подобных страниц. См. Команда переводчиков ArchWiki

Об этой статье

Эта статья рассказывает о том, как настроить отображение и ввод русского языка в Arch Linux.

Настройка локали

В файле /etc/locale.gen раскомментируйте следующую строку:

ru_RU.UTF-8   UTF-8

Создайте выбранную вами локаль командой:

/usr/sbin/locale-gen

Проверьте, что все заявленные локали были созданы:

locale -a

Настройка консоли

Несколько слов о том как работает консоль.

Любой вывод программы перенаправляется консольному драйверу в ядре. Ядро работает только в кодировке unicode. Если программа не использует utf-8 для вывода текста, необходима таблица ACM (Application Character Map), которая будет выполнять соответствующее преобразование из 8-битной кодироки в unicode. Если используется пакет kbd (в arch он устанавливается по умолчанию), то эту таблицу можно найти по адресу /usr/share/kbd/consoletrans.

Далее ядро должно отобразить символ на экране. Таблица соответствия знаков шрифта кодам unicode называется SFM (Screen Font Map). Она либо находится внутри шрифта (в большинстве случаев), либо подгружается дополнительно (из /usr/share/kbd/unimaps). Сами шрифты располагаются в /usr/share/kbd/consolefonts.

Кроме этого, нужна ещё клавиатурная раскладка - таблица по переводу скан-кодов клавиатуры в нужный код символа (соответственно может быть либо старая 8-битная либо новая unicode).

Таким образом, работа по настройке консоли разбивается на пункты (рассмотрен utf вариант):

  1. Найти нормальную клавиатурную раскладку, поддерживающую unicode и ваши любимые способы переключения языков и указать её как KEYMAP="..." в файле /etc/vconsole.conf.
  2. Установить экранный шрифт, имеющий встроенную таблицу SFM и приличное начертание: FONT="..." в файле /etc/vconsole.conf.
  3. Убедиться что необходимость в ACM пропадает (CONSOLEMAP="" - остаётся пустым) в файле /etc/vconsole.conf.

Вся остальная работа по настройке kbd (типа использования утилит loadkeys и setfont) уже сделана известными людьми, написавшими стартовые файлы системы.

Пакет kbd поддерживает русские раскладки в utf8. Дополнительные раскладки клавиатуры можно получить, установив пакет kbd-ru-keymaps командой

pacman -S kbd-ru-keymaps

или cкачав одну из раскладкок вручную:

и поместив их в каталог /usr/share/kbd/keymaps/i386/qwerty

Установите шрифт Terminus из репозитория [community]:

pacman -S terminus-font

Отредактируйте файл /etc/vconsole.conf:

LOCALE="ru_RU.UTF-8"
KEYMAP="ru" # Или ru-mab для раскладки с переключением по Ctrl-Shift
FONT="ter-v16v" # Можно поэкспериментировать с другими шрифтами ter-v* из /usr/share/kbd/consolefonts
CONSOLEMAP=""

Обратите внимание, что поиск шрифта происходит в /usr/share/kbd/consolefonts.

Можно обойтись и без terminus, установив:

CONSOLEFONT="cyr-sun16"
Примечание: Значение LOCALE= может быть как "ru_RU.UTF-8", так и "ru_RU.utf-8" или "ru_RU.utf8". Но, с целью уменьшения путаницы, все же лучше использовать вариант LOCALE="ru_RU.UTF-8".

Можно обойтись без установки пакета kbd-ru-keymaps, вариант с переключением по Ctrl+Shift:

LOCALE="ru_RU.UTF-8"
HARDWARECLOCK="UTC"
TIMEZONE="Europe/Moscow"
KEYMAP="ru"
CONSOLEFONT="cyr-sun16"
CONSOLEMAP=""
USECOLOR="yes"
Примечание: Текущая версия initscripts[ссылка недействительна: package not found] не требует наличия в rc.conf переменной LOCALE. Тем не менее необходимо внести в файл /etc/locale.conf следующие строки:
LANG=ru_RU.UTF-8
LC_MESSAGES=ru_RU.UTF-8

Учитывая, что теперь установка консольных шрифтов и раскладки вынесена из /etc/rc.sysinit, в некоторых случаях, для корректного отображения шрифтов в консоли, Вам потребуется добавить хуки и регенерировать образ ядра. Для этого список хуков в файле /etc/mkinitcpio.conf необходимо привести примерно к следующему виду:

HOOKS="base consolefont keymap udev <Ваши хуки>"

то есть, вставить два дополнительных хука consolefont и keymap. После чего регенерировать образ ядра:

# mkinitcpio -p linux

и перезагрузить машину.


Примечание: Если вышеперечисленные способы не помогли изменить шрифт в tty, вероятно, изменения не сохраняются после KMS. Для обхода этой проблемы. попробуйте добавить в initrd модуль, выполняющий modesetting (nouveau/radeon/i915 и т.п.):
MODULES="nouveau"

Настройка X.org

Установите шрифты ttf-dejavu и ttf-liberation из репозитория [community]:

pacman -S ttf-dejavu ttf-liberation

Настройки клавиатуры

Клавиатуру теперь принято настраивать при помощи systemd, точнее localectl. При настройке Xorg она читает и правит файл 00-keyboard.conf:

$ cat /etc/X11/xorg.conf.d/00-keyboard.conf 
# Read and parsed by systemd-localed. It's probably wise not to edit this file
# manually too freely.
Section "InputClass"
        Identifier "system-keyboard"
        MatchIsKeyboard "on"
	Option "XkbLayout" "us,ru"
	Option "XkbModel" "pc105"
	Option "XkbLayout" "us,ru"
	Option "XkbVariant" "os_winkeys"
	Option "XKbOptions" "grp:menu_toggle,grp_led:scroll,ctrl:swapcaps,compose:ralt"
EndSection

Это значит, что localectl нужен root, а Xorg придется перезапускать.

Посмотреть возможные значения:

 $ localectl list-x11-keymap-models
 $ localectl list-x11-keymap-layouts
 $ localectl list-x11-keymap-variants ru
 $ localectl list-x11-keymap-options

Переключение раскладок средствами X.org

Описано на странице Xorg (Русский)

Compose-последовательности

С помощью клавиши «Compose» можно вводить практически все варианты символов с акцентами, а также разные специальные символы, например кавычки или тире «—», которых нет в стандартных раскладках. Для этого

  • Добавьте в xorg.conf опцию
Option "XkbOptions" "compose:menu"
  • Присвойте переменным окружения GTK_IM_MODULE и QT_IM_MODULE значение xim. Если этот шаг пропустить, все последующие настройки на GTK приложения распространяться не будут (они будут использовать свой метод ввода).
  • После этого можно создать в домашнем каталоге файл ~/.XCompose. Первой его строчкой можно включить все стандартные комбинации клавиш:
include "/usr/share/X11/locale/en_US.UTF-8/Compose"
а затем можно и задать любые дополнительные последовательности (по образцу как в /usr/share/X11/locale/en_US.UTF-8/Compose). Например,
<Multi_key> <period> <space> : "…" U2026 # HORIZONTAL ELLIPSIS, многоточие
<Multi_key> <apostrophe> <apostrophe> : "́" U0301 # ударение

После этого стало возможным набирать много интересных символов, нажимая вначале клавишу Compose, а потом набирая ту или короткую иную последовательность. Например,

Compose + O + C даёт © (символ авторского права),
Compose + O + R даёт ®

Полный список последовательностей. Пример .XCompose:

.XCompose
# -*- coding: utf-8 -*-
#
# .XCompose
#
# $Id: .XCompose,v 1.31 2008/09/18 17:57:14 deskpot Exp $

#
# Quotation marks
#
<Multi_key> <Cyrillic_be>       : "«"   guillemotleft  # LEFT DOUBLE ANGLE QUOTATION
<Multi_key> <comma>             : "«"   guillemotleft  # LEFT DOUBLE ANGLE QUOTATION
<Multi_key> <Cyrillic_yu>       : "»"   guillemotright # RIGHT DOUBLE ANGLE QUOTATION
<Multi_key> <period>            : "»"   guillemotright # RIGHT DOUBLE ANGLE QUOTATION
<Multi_key> <Cyrillic_BE>       : "„"   U201e # DOUBLE LOW-9 QUOTATION MARK
<Multi_key> <less>              : "„"   U201e # DOUBLE LOW-9 QUOTATION MARK
<Multi_key> <Cyrillic_YU>       : "“"   U201c # LEFT DOUBLE QUOTATION MARK
<Multi_key> <greater>           : "“"   U201c # LEFT DOUBLE QUOTATION MARK
#
<Multi_key> <Cyrillic_zhe>      : "‘"   U2018 # LEFT SINGLE QUOTATION MARK
<Multi_key> <semicolon>         : "‘"   U2018 # LEFT SINGLE QUOTATION MARK
<Multi_key> <Cyrillic_e>        : "’"   U2019 # RIGHT SINGLE QUOTATION MARK
<Multi_key> <apostrophe>        : "’"   U2019 # RIGHT SINGLE QUOTATION MARK
<Multi_key> <Cyrillic_ZHE>      : "“"   U201c # LEFT DOUBLE QUOTATION MARK
<Multi_key> <colon>             : "“"   U201c # LEFT DOUBLE QUOTATION MARK
<Multi_key> <Cyrillic_E>        : "”"   U201d # RIGHT DOUBLE QUOTATION MARK
<Multi_key> <quotedbl>          : "”"   U201d # RIGHT DOUBLE QUOTATION MARK

#
# Dashes
#
<Multi_key> <minus>             : "—"   emdash       # EM DASH
<Multi_key> <underscore>        : "–"   endash       # EN DASH

#
# Currencies
#
<Multi_key> <Cyrillic_u>        : "€"   EuroSign     # EURO SIGN
<Multi_key> <e>                 : "€"   EuroSign     # EURO SIGN
<Multi_key> <Cyrillic_a>        : "£"   sterling     # POUND SIGN
<Multi_key> <f>                 : "£"   sterling     # POUND SIGN

#
# Trademarks
#
<Multi_key> <Cyrillic_es>       : "©"   copyright    # COPYRIGHT SIGN
<Multi_key> <c>                 : "©"   copyright    # COPYRIGHT SIGN
<Multi_key> <Cyrillic_ka>       : "®"   registered   # REGISTERED SIGN
<Multi_key> <r>                 : "®"   registered   # REGISTERED SIGN
<Multi_key> <Cyrillic_ie>       : "™"   U2122        # TRADE MARK SIGN
<Multi_key> <t>                 : "™"   U2122        # TRADE MARK SIGN

#
# Math
#
<Multi_key> <Cyrillic_ef>       : "≈"   approximate  # ALMOST EQUAL TO
<Multi_key> <a>                 : "≈"   approximate  # ALMOST EQUAL TO
<Multi_key> <5>                 : "‰"   U2030        # PER MILLE SIGN
<Multi_key> <equal>             : "≠"   U2260        # NOT EQUAL TO
<Multi_key> <plus>              : "±"   plusminus    # PLUS-MINUS SIGN

#
# Misc. typographics
#
<Multi_key> <Cyrillic_yeru>     : "§"   section      # SECTION SIG
<Multi_key> <s>                 : "§"   section      # SECTION SIGN
<Multi_key> <Cyrillic_shcha>    : "°"   degree       # DEGREE SIGN
<Multi_key> <o>                 : "°"   degree       # DEGREE SIGN
<Multi_key> <space>             : " "   nobreakspace # NO-BREAK SPACE
<Multi_key> <Cyrillic_ve>       : "…"   ellipsis     # HORIZONTAL ELLIPSIS
<Multi_key> <d>                 : "…"   ellipsis     # HORIZONTAL ELLIPSIS

#
# Missing keys in Russian layout
#
<Multi_key> <3>                 : "#"   numbersign   # NUMBER SIGN
<Multi_key> <4>                 : "$"   dollar       # DOLLAR SIGN
<Multi_key> <Cyrillic_ha>       : "["   bracketleft  # LEFT SQUARE BRACKET
<Multi_key> <Cyrillic_hardsign> : "]"   bracketright # RIGHT SQUARE BRACKET

#
# Bindings to ease usage with the Russian `typewriter' layout.
# NB: Unable to bind dollar symbol to be Compose+4, it's Compose+Shift+4.
#
<Multi_key> <2>                 : "—"   emdash       # EM DASH
<Multi_key> <8>                 : "–"   endash       # EN DASH
<Multi_key> <slash>             : "#"   numbersign   # NUMBER SIGN
<Multi_key> <percent>           : "‰"   U2030        # PER MILLE SIGN
<Multi_key> <bar>               : "±"   plusminus    # PLUS-MINUS SIGN

Настройка русских man-страниц

Установите русские страницы командой

 $ pacman -S man-pages-ru

man показывает страницы ориентируясь на локаль, для принудительного показа русских манов:

 $ man -L ru <manpage>

Сделаем libreoffice русским

Все просто. Поддержка языков в openoffice реализуется отдельными пакетами.

Смотрим список пакетов:

 $ pacman -Ss libreoffice | grep \\-ru
 extra/libreoffice-fresh-ru 5.3.0-1
 extra/libreoffice-still-ru 5.2.5-1

Ставим поддержку русского языка

 pacman -S libreoffice-fresh-ru

или

 pacman -S libreoffice-still-ru

Перекодировка тегов MP3

Установите пакет mutagen:

 pacman -S mutagen

В каталоге с вашей коллекцией mp3 файлов выполните команду:

 find -iname '*.mp3' -print0 | xargs -0 mid3iconv -eCP1251 --remove-v1

Команда перекодирует старые теги из кодировки CP1251 в UTF8, запишет тег версии id3v2.4 и удалит теги первой версии.

Минус способа: не все проигрыватели из ОС Windows понимают теги формата 2.4. Поведение при этом различное: от игнорирования тега, до ругани на битый файл.

Hint: в mpd после этого нужно перечитать список проигрывания, например так:

 mpc update (дождитесь завершения, статус можно смотреть запуская mpc без параметров)
 mpc clear
 mpc listall | mpc add

Опционально:

 mpc rm all
 mpc save all