Зато еще не поздно принять нормальную кодировку для ЭВМ! Заранее, буквально в зародыше, раздавить на уровне отраслевых нормативов разброд и шатание, которые царили в советской компьютерной среде. Шутка ли, в меню FARа мне удалось найти более десятка разных таблиц. Только к эпохе первых персоналок можно отнести ISO с непонятным номером, целый выводок разных KOI, Альтернативную CP866, Основную ГОСТ… Наверняка это далеко не все плоды фантазий программистов СССР, но заниматься археологией у меня особого желания не возникло. Только задумался, сколько сил и денег пошло на устранение идиотизма отраслевого министерства. Сложно им было стукнуть кулаком и принять единую форму? Пусть не самую удобную, но какая была бы экономия.
При этом совместимость с ASCII и ее латинскими буквами неизбежна. Можно, разумеется, на радость врагам предложить доморощенный кириллический стандарт и фанатично его продвигать. Но насилие над здравым смыслом оставим коммунистам. Поэтому первые 128 знаков или семь бит будем считать злом уже свершившимся. И пусть сейчас в СССР толком никто не знает, шесть бит в байте, семь, или сразу десять. Мне совершенно точно известно что их будет восемь! На этом «восьмом» есть следующие свободные 128 клеточек в таблице. Их нужно только заполнить, этого хватит минимум на десяток лет. Далее процессоры будут помощнее, памяти побольше, придет время графических операционок и полных мультиязыковых наборов шрифтов.
Насколько помню, основных проблем с кириллическими кодировками было две. Во-первых, из-за блока псевдографики, крайне неудачно расположенной в IBM PC. Не лезли 66 букв алфавита ни сверху, ни снизу этого занятого куска. Не позаботились штатовские инженеры о длинных алфавитах, или специально нехилую диверсию для СССР учинили. В общем, маленькие русские буквы поневоле начинались до блока кракозябр, прерывались, и продолжались после него. Программисты были крайне недовольны.
Во-вторых, кому-то неизвестному было удобно отбросить старший бит, и получить вместо русского текста транслит, вполне читаемые слова латинскими буквами. Тут уж вообще ни о каком алфавитном порядке речь не шла, получалось что-то типа Т, У, Ж, В, Ь, C, Ы, B, З. Программисты яростно матерились, попробуй, напиши в таких условиях алгоритм сортировки или просто что-то внятное для работы с текстом.
Но меня-то пока ничего не ограничивает! Выбрать надо наиболее удобный вариант. Например «Основную» – она и название имеет понятное, и любимый чиновниками всех времен ГОСТ упоминается. На вид вполне прилична, вот только буква «Ё» стоит в стороне, на 33-й позиции. Задумался, проверил все имеющиеся кодировки. Сакральная буква обнаружилась на своем законном седьмом месте лишь в двубайтовом UTF начала 90-х, по сути, в совершенно иной эпохе. Что делать?
Как обычно в трудных случаях, пошел советоваться к жене.
— Кать, понять не могу, в Союзе букву Ё используют?
— Внимания не обращала… — Она подтянула к себе валяющуюся в углу стола «Комсомолку». — Смотри-ка, тут нет нет Ё.
— Ничего не понимаю, — я машинально разглядывал слова в газете, — в мое время были борцы за права этого символа, и много. Кивали на великую русскую историю, Пушкина там вспоминали, Толстого. В блогах рубились.
— Хочешь сказать, что у нас буквы Ё должно быть больше чем в будущем?
— Конечно!
— Знаешь Петь, я историю слышала, что Ё товарищу Сталину нужна стала на картах в войну, чтоб названия не путать, вот он и потребовал ее вернуть.
— В смысле? Ее что, до этого не было?
— Не знаю… Получается, отменили ее когда-то. — Катя вдруг выставила вперед руки с растопыренными пальцами, будто положила на клавиатуру. — Точно! При слепой печати десятью пальцами Ё не используется!
— Ничего себе история. Погоди, а в книгах как печатают сейчас?
Ничего не говоря, Катя подошла к стоящему в углу шкафу, и начала доставать оттуда журналы, газеты, и прочую макулатуру. Был и десяток книг. Мы вместе проштудировали все издания – буква Ё нашлась только в русско-английском словаре.
— Вот в чем секрет, — вспомнил я мультик. — Если мед есть, то его сразу нет.
— Так и получается, — подтвердила жена. — Школьники букву изучают, писать учатся, а потом в книгах и газетах ее не используют.
— Спасибо, Кать, — чмокнул в щечку. — Что бы я без тебя делал!
Выходит, разработчики были искренне уверены, дни буквы Ё сочтены. Ее не было в окружающем их медиапространстве, даже на клавишах телетайпа ее нет. А тут такой шанс, адреса таблицы 32+32 буквы укладывается ровно в восемь байт. Адресовать и переключать регистр одно удовольствие! Стоит ли портить такой убедительный знак свыше давно отмененной буквой?
На всякий случай специально сходил, посмотрел на клавиатуру ноутбука. Покрутил разные софтины 2010 года. Буквы Ё не оказалось даже в налоговой отчетности 1С. Осталось только махнуть рукой – сколь бы ни боролись энтузиасты за этот символ, доживет он только до очередной языковой реформы. И ткнул пальцем в «Основную ГОСТовскую» кодировку без всяких изменений. Если я правильно понимаю, то при обработке как минимум 80% рускоязычного текста «Е» и «Ё» надо уравнивать «в правах». То есть создавать надстройку над любым алгоритмом, для чего место нахождения злосчастной буквы вообще безразлично.
Оформленное предложение отправил в главк МЭПа, кросспостом товарищу Шелепину. Так точно не потеряется, дело нешуточной государственной важности. Заодно посоветовал активно использовать термин байт, директивно и навсегда равный 8 битам. Соответственно, разрядность ЭВМ исчислять исключительно по степени двойки, ну там 4, 8, 16, 32, 64… Кто будет против – враг мира, прогресса и коммунистической партии. Конструкторов БЭСМ-4 с 45-разрядным словом вообще стоило бы приговорить к принудительным работам по устранению самодеятельности. Хотя это лучше не писать, времена тут больно простые, еще в самом деле пристроят в шарашку.