Як визначити кодування текстового файлу.

Кодуванням тексту в файлах цифрових документів називають спосіб зіставлення послідовностей байт символам мови. Існує безліч різних кодувань для різних мов. Визначити кодування текстового файлу можна за допомогою ряду програмних засобів.
Вам знадобиться
  • - Microsoft Office Word;
  • - KWrite;
  • - Mozilla Firefox;
  • - enca.
Інструкція
1
Використовуйте редактор Microsoft Office Word, якщо він встановлений на комп'ютері, для визначення кодування текстового файлу. Запустіть цю програму. У головному меню виберіть пункт «Файл» і «Відкрити ...» або натисніть клавіші Ctrl + O. У отобразившейся діалозі перейдіть до потрібного каталогу і виділіть файл. Натисніть кнопку «Відкрити». Якщо кодування тексту відрізняється від CP1251, автоматично відкриється діалог «Перетворення файлу». Активуйте в ньому опцію «Інша» і підберіть кодування, використовуючи список, що знаходиться праворуч. При виборі правильного кодування в полі «Зразок» буде виведений читається текст.
2
Застосуйте текстові редактори, що допускають вибір кодування тексту джерела. Хорошим прикладом подібного програми є KWrite (працює в середовищі KDE в UNIX-подібних системах). Завантажте текстовий файл в редактор. Потім просто перебирайте кодування, поки не відобразиться читається текст (у KWrite для цього використовується розділ Encoding меню Tools).
3
Аналогічно текстовому редактору для визначення кодування файлу можна використовувати і браузер. Скористайтеся Mozilla Firefox. Запустіть цю програму. Якщо воно не встановлене, завантажте відповідний дистрибутив з сайту mozilla.org і інсталюйте його. Відкрийте в браузері текстовий файл. Для цього виберіть у головному меню пункти «Файл» і «Відкрити файл ...» або натисніть Ctrl + O. Якщо завантажений текст відобразився коректно, розгорніть розділ «Кодування» меню «Вид» і дізнайтеся кодування з назви пункту, на якому встановлена позначка. В іншому випадку підберіть даний параметр шляхом вибору різних пунктів того ж меню, а також його розділу «Додаткові».
4
Застосуйте спеціалізовані утиліти для визначення кодувань текстових файлів. В UNIX-подібних системах можна використовувати enca. При необхідності встановіть цю програму за допомогою доступних менеджерів пакетів. Виведіть список доступних мов, виконавши команду: enca --list languagesОпределіте кодування текстового файлу, вказавши його ім'я за допомогою опції -g і мова документа за допомогою опції -L. Наприклад: enca -L russian -g/home/vic/tmp/aaa.txt.