Использование технологий WWW для доступа к базам данных


Поддержка русскоязычных кодировок


Исторически сложилось, что

в России распространены несколько русскоязычных кодировок, в основном

ориентированных на разные платформы. Наиболее известные из них:

  • КОИ - 8 8 - битовая кодировка по ГОСТ

  • Microsoft Code Page 866 ("Альтернативная") - кодировка,

    используемая в MS-DOS

  • ISO-8859-5 - кодировка, утвержденная международной организацией

    по стандартизации

  • Microsoft Code Page 1251 ("Windows") - кодировка,

    используемая в Microsoft Windows.

Специалисты утверждают что всего в России имеют хождение 11 кодировок

русского алфавита.

Если Ваш WWW сервер ориентирован на использование внутри организации

или его пользователями будет являться ограниченный круг людей

с однотипными рабочими местами, Вы можете ограничиться одной кодировкой

русскоязычной информации на сервере.

Сложности возникают, когда Вы захотите расширить круг клиентов

сервера. Вам необходимо будет организовать поддержку нескольких

кодовых страниц для русскоязычных документов. Приведенный выше

список из четырех кодировок удовлетворит более 99% всех возможных

абонентов сервера.

Вообще говоря, в составе языка HTML имеются теги, определяющие

кодировку документа и должные позволить корректно прочитать документ

в любой кодировке. Однако в связи с тем,

что эти теги не поддерживаются ни одним из известных броузеров,

надеяться на них не стоит. Возможно, в будущем эта ситуация изменится,

и проблема с кодировками будет решена.

Для поддержки нескольких кодовых страниц применяется множество

методов, которые можно разбить на две группы:

  • использование файлов - копий одного документа в разных кодировках

  • динамическое преобразование документов из кодировки, в которой

    они лежат на сервере, в кодировку, поддерживаемую WWW - клиентом.

    В первом случае, на сервере физически присутствуют все файлы во

    всех поддерживаемых кодировках. Документы в различных кодировках

    отличаются между собой по правилам образования путей и имен.

    Например:


    indexw.html,

    indexa.html

    - добавление суффиксов, определяющих




    - Начало -  - Назад -  - Вперед -