
Предыдущие номера:
|

|
Заметка двадцать четвертая
РУССКОЕ ПОЛЕ
Как, вероятно, заметил проницательный читатель, наши заметки пишутся и читаются не только на русском языке (этим сегодня мало кого удивишь), но даже и русскими буквами - по крайней мере, в четырех своих версиях из пяти, перечисленных на панели кодировок в самом верху страницы. Сам факт, что вам удается прочесть наши заметки - верное свидетельство того, что компьютер у вас на столе руссифицирован не хуже нашего сервера. Тем не менее, я все же рискну посвятить сегодняшнюю заметку наиболее распространенным - и болезненным - проблемам руссификации компьютерных систем, а также способам решения этих проблем в каждом отдельно взятом случае.
Начнем с того, что распространенных русских кодировок (способов расположения русских букв в символьной таблице компьютера) на сегодняшний день насчитывается больше дюжины. Многие из них ведут свою родословную от тех давних времен, когда компьютеры были в России огромной редкостью, о глобальных сетях еще никто не помышлял, и каждый кулик, желающий писать по-русски, создавал специальную таблицу алфавитных кодов для служебного пользования своего института или ведомства (без амбиции создавать русские тексты, которые бы могли потом читаться на компьютере другой модели, за стенами данного ведомства). Во многих случаях создавались даже не символьные таблицы, как заявка на определенный стандарт руссификации, а просто прикладные программы - драйверы экрана и клавиатуры с тем или иным расположением русских букв. Получалось так, что текстовые файлы, написанные с использованием того или иного драйвера, только этим же драйвером могут быть прочитаны.
На нашу большую удачу отнюдь не все кодировки и символьные таблицы, созданные в годы всеобщего разброда и шатания, сподобились дожить до дня сегодняшнего. Многие умерли, сошли со сцены, утратили актуальность и стерлись в памяти людской. До сегодняшнего дня дожили несколько основных кодировок, драйверы для которых лично я рекомендовал бы каждому читателю держать под рукой на компьютере с любой операционной системой:
- Русская кодировка DOS (известная также как альтернативная кодировка, Alt или СР866). Применяется в большинстве русских драйверов для ДОСа (от самых древних - таких, как альфа, бета и проч.), а также в таких заслуженных русских текстовых редакторах, как Lexicon. Использовать эту кодировку для создания текстов в WYSIWYG редакторах (под Windows, UNIX или в Маке) не имеет большого смысла, однако полезно иметь перекодировщики для импорта текстов из этого формата и экспорта в него. Кстати, в русские версии Windows 3.1x и Windows 95 перекодировка этой символьной таблицы и поддержка кодовой страницы 866 встроена изначально.
- Русская кодировка Windows (известная также как СР1251). Эта кодировка является стандартом для всех документов, меню и файловой системы во всех русских версиях Microsoft Windows и прикладных программах на этой платформе (компоненты Microsoft Office, MS Internet Explorer и др.)
- Кодировка КОИ8 (расшифровывается как кодировка обмена информацией 8 бит) - фактический стандарт для русскоязычных документов в Интернете, включая уставную и официальную документацию RIPN).
Компьютер, оснащенный средствами программной поддержки для трех этих кодировок, пригоден для чтения практически любых русских текстов, встречаемых на Интернете и в его окрестностях. В идеальном теоретическом случае было бы куда лучше, если бы вместо трех этих кодировок (и еще дюжины экзотических разновидностей) в конце концов утвердилась бы какая-нибудь одна в качестве общепринятого стандарта, однако в ближайшие пять лет трудно поверить в реальность такого события. Сторонники виндозной кодировки более многочисленны, поскольку вообще пользователей Windows сегодня в любом месте больше, чем пользователей всех других операционных систем, вместе взятых; зато приверженцы КОИ8 подходят к вопросу кодировок с фанатизмом, близким к религиозному, и перейти на поддержку СР1251 не согласятся даже за большие отдельные деньги. Заменить кодовую страницу 866 на любую другую тоже никто пока не согласен. Помимо r.exe - творения Вадима Курлянда из Киева - нет даже толком никакой поддержки КОИ8 и других неальтернативных кодировок для ДОСа (хотя написать соответствующие драйверы - задача совершенно детсадовской степени сложности). Так что, похоже, соперничество трех ведущих кодировок в ближайшие несколько лет будет сохраняться, и стоит запастись средствами программной поддержки для всех трех.
Под средствами программной поддержки понимают обычно три вида служебных приложений. Во-первых, экранно-принтерные шрифты (true type или postscript), позволяющие нам в любой программе прочесть документ, написанный в данной кодировке. Во-вторых, драйвер клавиатуры, позволяющий нам самим создавать документы в этой кодировке. В-третьих, конвертор, позволяющий преобразовывать файлы между различными кодировками.
Что касается шрифтов, то одна из крупнейших публичных коллекций, включающая самые разные форматы и кодировки, находится в Финляндии на университетском сервере по адресу ftp://ftp.funet.fi/pub/culture/russian/comp/fonts/.
Читателю, который ни разу не посещал этого сервера, настоятельно рекомендуем там побродить и обследовать сие примечательное собрание Тимо Хамалайнена: там хранится масса ценных вещей, не менее примечательных и полезных, чем русские шрифты.
Среди драйверов клавиатуры для Windows всех последних версий стоит отметить пакет Winkey, поддерживающий по умолчанию и СР866, и СР1251 и КОИ8 сразу. Для ДОС существует уже упомянутый пакет Вадима Курлянда r.exe. Мы упоминаем здесь именно два этих пакета, а не десятки альтернативных им программ по единственной причине: в дистрибутив обоих включена поддержка КОИ8, без необходимости в дополнительной настройке, в то время как и Parawin, и CyrWin требуют для подключения КОИ8 дополнительных телодвижений.
Что касается текстовых конверторов, то для ДОС мы можем порекомендовать две версии программы Convert Константина Гредескула из Австралии: последнюю и предпоследнюю. Для Windows 95 недавно написан очень симпатичный конвертор KOItus, работы Германа Шпигеля. Особенность обоих названных конверторов состоит в том, что помимо СР866, СР1251 и КОИ8 они позволяют пользователю подключать собственные символьные таблицы для перекодирования файлов из любой самой экзотической кодировки.
В заключение нашей сегодняшней заметки остается лишь сослаться на несколько страниц, где темы руссификации компьютеров различных систем освещены более подробно, чем в нашем тексте: |