Декодировщик – початківцям криптографії

Трошин Сергій, http://stnvidnoye.chat.ru

У гранично чіткій і стандартизованому Світ комп’ютерів і всього, що з ними пов’язано, якщо вдуматися, склалася трохи парадоксальна ситуація. Так, стандартизовано практично всі, що тільки можливо, але самих цих стандартів на кожну дрібницю так багато, що неважко потрапити в халепу навіть з самими головними компонентами ПК, намагаючись, наприклад, “увіткнути” свежераспакованний третій “Пень” в Socket370 замість застарілого “Селерон”, або пам’ять SDRAM в роз’єми SIMM. Виробникам заліза все складніше домовитися про єдині специфікаціях на нове обладнання – достатньо пригадати, на скільки виявилося через це затриманим повсюдне впровадження DVD – в результаті навіть сьогодні такий привід не так часто зустрінеш. Не спостерігається просвіту і в програмному забезпеченні. Запустив нову гру, а виявилося, що вона здатна продемонструвати всі свої тривимірні гідності тільки на відеокартах від 3DFX, і треба “качати” з Інтернету патч, щоб пограти в неї на TNT. Нова програма не може інтегруватися з Internet Explorer 5, треба з нею працювати – спробуй повернутися до четвертого “Експлорер”, якщо готовий заради цього “знести” цілком Windows’98SE.

В ідеалі, хотілося б, щоб таких проблем було якомога менше, і простий “чайник” не морщити чоло в спробах зрозуміти, чому щось не працює або не запускається, а програми і “залізо” були повністю сумісні не тільки один з одним, але і різними операційними системами. І, незважаючи на те, що багатством вибору операціоннок похвалитися абсолютно не можна, і нам хотілося б мати набагато більше альтернатив “кватиркам”, нечисленні творці ОС не зробили (та й не змогли б зробити) так, щоб, наприклад програми для Windows работлі хоча б під набирають популярність Linux у чомусь типу віртуальної машини (щось схоже, до речі, вже є, але на неофіційному рівні). Помріяти не шкідливо, скажете ви, з монополією на перспективну технологію ніхто з доброї волі не розлучиться і з конкурентом своєї документацією та вихідними кодами не поділиться. Безумовно, все пояснюється не тільки тим, що ми знаходимося тільки на зорі розвитку інформаційних технологій, і стандарти, не встигнувши народитися, тут же застарівають, залишаючи, Проте, нам у спадок в якості свого праху необхідність їх підтримки в майбутніх продуктах. Багато в чому винні і розробники, бажаючі сьогодні ж урвати шматок пожирніше від великого пирога науково-технічної революції і не думають про історичної доцільності своїх розробок. Хтось не хоче відкрити код своєї операційної системи, навіть якщо б це нічого крім користі для комп’ютерного співтовариства не принесло, хтось винаходить велосипед, просуваючи свій власний стандарт, лише б не використати специфікації конкурента, хтось патентує купу різних слотів під майже однакові процесори тільки для того, щоб користувачі витрачали більше грошей на апгрейд комп’ютерів, змінюючи материнську плату разом з новим процесором. Можливо, все це було б не так і важливо: ринок – Закон джунглів, нічого не поробиш, але стикатися з абсолютно зайвим різноманіттям стандартів доводиться майже щодня в самих різних дрібницях. Дуже незручно постійно долати якісь незручності, нами ж і породжені.

Купили ви, наприклад, новий компакт-диск з дуже потрібною програмою і, засунувши його з почуттям глибокого задоволення в привід CD-ROM, першим же ділом знаходите файл READ.ME, тисніть ліву кнопку миші і читаєте … Ні, нічого не читаєте, тому що в “Блокноті” замість російських букв суцільні крякозябри. Текст виявився в DOS-кодуванні … Можна, звичайно його і не читати, але раптом там написано, що програму треба встановлювати тільки в корінь диска С: \, а при інсталяції в інше місце вона ні за що не запрацює? Доводиться, забувши про всі просунуті технології Windows, запускати старий добрий “Нортон”, жати заповітну “F3” і ламати очі від шістдесяти герц повноекранної DOS-сесії. Добре, якщо треба прочитати 10 рядків READ.ME, а якщо ви закачали з Інтернету полмегабайта “Нейромантіка” Вільяма Гібсона? До кінця книги доведеться окуляри замовляти. А все через те, що компанія Microsoft пішла своїм шляхом при створенні Windows і придумала власну систему кодування, звану в просторіччі Win-1251, не подбавши, як зазвичай, про кінцевому користувачі, якому, розумієш, потрібна підтримка Блокнотом ще й “досовських” кодової сторінки 866, створеної, до речі, самим же Microsoft. В результаті “На рівному місці” виникла ще одна проблема для недосвідченого користувача.

Але це ще не найгірший випадок! Через дісталися нам від різних Unix’ов, DOS’ов, Макінтошів, кодувань, російськомовні завсідники Інтернету постійно стикаються при серфінгу по Мережі з незрозумілими ієрогліфами замість російських букв на багатьох сторінках Рунета. І якщо в останніх версіях найбільш популярних броузерів досить легко перемкнути кодову сторінку за допомогою меню “Вид” – “Кодування”, розшифрувавши, таким чином, весь текст на сайті, то листи, що пройшли через декілька поштових серверів, створених на різних операційних системах, і схожі більше на танцюючих чоловічків Конан-Дойля, прочитати деколи можуть тільки в ФСБ. Щоб через незрозумілих маніпуляцій з поштовими повідомленнями по шляху їх слідування до адресата не вивчати криптографію, доводиться знову “навішувати” на систему додаткові утиліти – перекодіровщік, здатні відновлювати вихідний текст навіть після багаторазових його спотворень поштовими серверами, які, мабуть, таки запрограмовані робити як краще, а виходить …

Програм, призначених для перекодування текстів на ринку досить багато, знайти їх легко серед колекцій софта на сайтах типу http://www.download.ru/, практично всі вони вітчизняного походження, і майже повністю задовольняють будь-які потреби користувачів, але відмінності у функціональності і спеціалізації, все-таки є. Щоб кожен зміг вибрати серед всього різноманіття цих хороших програм те, що потрібно саме йому, я спробував потестувати декілька найпопулярніших програм-перекодіровщік. Деякі з них є повноцінними текстовими редакторами, інші розроблені виключно для швидкого перекодування цілих пакетів файлів, але всіх їх об’єднує одне: вони дають нам те, що розробники самої популярної операційної системи, забувши про кінцевому користувачі, не побажали врахувати при її розробці – сумісність з усіма текстовими стандартами.

TPZ Recoder
http://www.geocities.com/baja/3519/sof

  Recoder
дуже знадобиться веб-дизайнерам, які іноді змушені створювати кілька варіантів одних і тих же HTML-документів в різних кодуваннях. Він служить тільки для зміни кодування вихідних файлів і теоретично не призначений для розшифровки вашої пошти. Ця невелика вузькоспеціалізована програма виконає одночасне перекодування групи файлів в будь-яку з кодувань WIN, DOS, KOI, ISO, MAC, LAT, або навіть в усі відразу, створивши для кожного варіанту свою папку з відповідною назвою. У роботі гранично проста і зручна. Єдиний її недолік полягає в необхідності знати вихідну кодування файлу, але якщо його створили ви ж самі, то це, зрозуміло, не складе жодних проблем. В якості конкурента можна подивитися, наприклад, програму “Перекодування Кирилиці" (http://reality.sgi.com/victors/), яка трохи менш зручна в роботі через те, що перекодує за раз тільки в один варіант текстового стандарту і замість приміщення отриманого файлу в нову папку, просто замінює старий, зберігаючи, правда, його резервну копію. Тому, хоча вона і “розуміє” ще й формат “Unicode”, для розробників сайтів підходить таки менше, вона скоріше орієнтована на одиничне, несподівано потребовавшееся перекодування, ніж на постійну роботу з кодуваннями.

Tcode
http://alexboiko.chat.ru/

Ця утиліта призначена вже для автоматичного або ручного декодування “убитих” поштових повідомлень і новин з UseNet. При відновленні підтримуються кодування Dos, Windows, KOI-8, ISO 8859-5 та їх комбінації, а також перетворення тексту з форматів Base64, Quoted-Printable, HTML і UTF-8. За твердженнями автора, відмітна особливість програми – Використання швидкого евристичного алгоритму розпізнавання російських слів, в результаті чого TCODE повинен перевершувати по швидкості і точності інші подібні програми. З програмою максимально зручно працювати, використовуючи буфер обміну при читанні електронних листів і новинних телеконференцій, достатньо клікнути мишкою на значок TCODE в системній області панелі задач. З простими випадками псування текстів програма цілком справляється, однак з текстом виду ï & icirc, отриманому при збереженні HTML-сторіночки з помилковим параметром CHARSET, і з дуже складним варіантом спеціально невірно перекодувати рази три файли вона не розібралася. Не працює вона і з транслітерацією – російськими словами, написаними латиницею. Можливо, в майбутніх версіях її функції будуть розширені, поки ж вона підійде, швидше, для недосвідченого користувача завдяки своїй простоті і швидкості роботи.

SHTIRLITZ
http://www.download.ru/

“Штірліц” цілком виправдовує свою назву завдяки дуже потужного механізму розшифровки зіпсованих текстів. Кількість підтримуваних кодувань (вам зустрічалася кодова сторінка 855?) і схем транслітерації просто величезно, причому, легко додати ще й свою власну схему кодування. Можна зробити читаються навіть тексти, в яких зустрічаються декілька кодувань в одному файлі, HTML-файли, при створенні яких був неправильно вказаний charset (ï & icirc), тексти, написані нестандартної транслітерацією або набрані в невірній розкладці клавіатури. “Штірліц”, на відміну від більшості аналогів, відновлює російський текст, складається з вигаданих слів, що говорить про оригінальність механізму розпізнавання кодування. Тексти поштових повідомлень, закодовані за допомогою uuencoding, xxencoding, base64 і binhex беруть свій нормальний вид автоматично і за частки секунди. Режим пакетного декодування, правда, не настільки зручний, як у програмі TPZ Recoder, так як одноразово можливо перекодування тільки в один стандарт, але зате блискуче реалізована настроюваність програми – не кожен користувач відразу розбереться у всіх режимах і функціях. На щастя, установки, прийняті в програмі за умовчанням, цілком достатні для переважної більшості випадків, тому труднощів в роботі з нею ні в кого не виникне – автоматична робота “Штірліца” і активне використання буфера обміну гранично полегшують відновлення текстів і електронних листів. А коли користувач трохи ближче ознайомиться з інструкцією та численними прикладами, то підлаштувати програму вже саме під свої, найчастіше зустрічаються схеми розпізнавання.

При інсталяції “Штірліца” в контекстне меню текстових файлів додасться дуже зручна команда “Відкрити Штірліцем”, шкода тільки що не можна вибирати в опціях інші типи файлів, до яких треба додати цю команду. Є корисна функція перетворення HTML-документа в текстовий файл. Іноді, правда зустрічаються прикрі упущення, наприклад, пакетне перекодування не працює з транслітом, самі файли з текстом, записаним латиницею не завжди переводяться в нормальний вигляд, та й дизайн інтерфейсу програми трохи застарів, особливо дивує величезна кнопка на одному з найбільш чільних місць Панелі Інструментів, випадкове натискання якої призводить до деінсталяції “Штірліца”. Але в цілому, це одна з найбільш потужних програм, впоралася майже з усіма найскладнішими тестовими файлами.

Hieroglif
http://www.adelaida.net/hieroglyph/

“Ієрогліф” – Найбільша програма огляду, вона є абсолютно повноцінним текстовим редактором, підтримуючим навіть перевірку орфографії. Якщо ви будете набирати в ньому тексти, то відучити вибирати розкладку клавіатури при переході від російських слів до англійських – Ієрогліф зробить це за вас автоматично. При налаштуванні цієї програми вже можна самому поставити, до яких типів файлів додасться в контекстне меню команда “Відкрити Ієрогліфом “, що позбавляє рядових користувачів від можливих помилок використання стандартного “віндового” засоби налаштування файлових асоціацій – меню “Властивості Папок”.

Підтримуються всі стандартні схеми кодування, транслітерація можлива в обидві сторони, що у конкурентів зустрічається досить рідко, причому при відновленні російського тексту з латиниці, мається інтерактивний режим, при якому практично виключені помилки відновлення з нестандартних схем трансліту. Дуже багато й інших, дуже потрібних функцій, що роблять цю програму найпотужнішою серед протестованих: перетворення HTML-документа в текст, очищення тексту після OCR-розпізнавання, сортування рядків списків за алфавітом, Автовизначник мови, переформатування текстів і абзаців – все це дозволяє максимально зручно працювати з текстами, виправляючи в них самі різні помилки.

Панель інструментів “Ієрогліфи” надає і практично всі стандартні засоби для повноцінної роботи з текстами – від вибору шрифту, до його кольору і пошуку тексту, ні в чому не поступаючись “віндовий” WordPad (ще трохи і вийшов би Word J). Майже будь-яку функцію можна викликати прямо з Панелі Інструментів, натиснувши тільки одну кнопку. На жаль, на тестовому, понад міру “запороти” файлі, “Ієрогліф” себе ніяк не проявив, і жодного слова з нього не сприйняв, видавши суцільні квадратики замість літер. Не зміг він прочитати і HTML-файл, збережений з невірним charset, який був легко до цього розшифрований “Штірліцем”, та й багато файли прикладів, що поставляються з “Штірліцем”, “Ієрогліф” перетворити в читаний вигляд не зміг. Розкодування поштових повідомлень не автоматизовано, що явно викличе труднощі у користувача, навіть якщо він не “чайник”. В іншому ж, це одна з кращих, якщо не найкраща, завдяки сумі всіх своїх можливостей і “просунутому”, сучасному інтерфейсу, програма на ринку, причому безкоштовна, що зустрічається вже все рідше і рідше. Ієрогліф, мабуть, швидше хороший текстовий редактор з функціями перекодіровщік, ніж спеціалізований декодер текстів.

Etype Mail
Decoder
http://www.gorlach.etype.net/ecoder/

Спеціалізація програми – Розшифровка поштових повідомлень, збережених на диску за допомогою Outlook Express, наприклад, і з цим вона справляється краще “ієрогліфи”, але для декодування доводиться натискати як мінімум чотири кнопки, так як автоматичного відновлення тексту прямо при відкритті файлу, як в інших програмах, не передбачено. Інтерфейс програми просто зразок мінімалізму – операції з буфером, відкриття і збереження файлу, вибір ручного або автоматичного декодування. Процес самого декодування, здається, займає трохи більше часу, ніж у конкурентів. І хоча радує самий повний набір підтримуваних форматів, але, тим не менш, кілька заплутаних послідовностей “знущань” над вихідним файлом, ставить Etype Mail Decoder в тупик. Загалом, проста програма, з достатньою потужністю для читання вашої пошти, яку можуть встановити собі ті, хто хоче бути впевнений, що в разі чого, зуміє швидко прочитати важливе повідомлення. Якщо ж ваш поштову скриньку кожен день “пухне” від листів, то підберіть що-небудь більш автоматизоване.

Конкуренти

Що ще можна спробувати крім розглянутих програм? Гідних програм багато, і хоча вони практично аналогічні за своїми можливостями і призначенням, у кожної є свої “родзинки”, описати які в невеликій і суб’єктивної журнальної статті неможливо. Подивіться самі, може бути, вам більше сподобається SNK Decoder (http://www.snkey.net/) або Реаніматор (http://www.ars.ru/products), на сайті http://www.download.ru/ рубрика перекодіровщік містить не один десяток утиліт, серед яких кожен знайде саме те, що потрібно для його роботи. А що стосується мене … От якщо б об’єднати швидкість “Блокнота”, інтерфейс і функціональність “ієрогліфи”, інтелект і міць “Штірліца” …

Інформація до роздумів …

  ALT (Ms-Dos 866) – Альтернативне кодування DOS (кодова сторінка 866), розробка Microsoft і IBM, застосовується в операційних системах MS-DOS, PC-DOS, DR-DOS, OS / 2 і в FidoNet.
Зразковий вид в “Блокноті”: ⥪бв ў ᥳ ® © Є ® ¤ Еа ® ўЄҐ.

 КОІ-8 – Вона ж
KOI8-R
, Код обміну інформацією восьмібітного, розроблений в радянських НДІ, використовується в багатьох клонах ОС UNIX, таких як Linux і FreeBSD; повідомлення електронної пошти, пересилають по Інтернету також використовують це кодування.
Зразковий вид в “Блокноті”: рЕТЕД’БЗТХ’ЛПК ХВЕДЙФЕУШ

 Macintosh 10007 – MAC – Російське кодування на комп’ютерах Macintosh з операційною системою
MacOS.
Зразковий вид в “Блокноті”: “лЯ його прочитання

 ISO 8859-5 – Російська кодування в UNIX-системах, розробка International Standards Organization, використовується в основному, операційною системою Sun Solaris, працюючої на комп’ютерах SUN.
Зразковий вид в “Блокноті”: вХ’бв Т бЬХіРЕЕЮЩ’ЮФШаЮТ’Х

  Windows-1251 – Microsoft code page 1252 дітище всесвітньо улюбленої фірми, використовується в Windows9x, WindowsNT, одна з найпоширеніших в Інтернеті.

 Latinica, Translit,
TRANS
– Транслітерація, запис російських слів латинськими буквами: Vsem privet!. Використовується в системах, що не підтримують кирилицю в принципі.

 Unicode – 16-бітова кодування, кожен символ представлений двома байтами – можливо, сама перспективна і вдала кодування сточування зору сумісності, але використовується рідко. Включає в себе 65 536 знаків, а не 256, як звичайні.

 Quoted printable – Семібітная виду = C2 = EE = F2 = EE = ED = E0 – використовується при кодуванні російських символів у поштових повідомленнях формату MIME.

Семібітная виду% C2% EE% F2 % EE% ED% E0 – також використовується при кодуванні російських символів у повідомленнях електронної пошти.

Семібітная виду \ ‘c2 \’ ee \ ‘f2 \ ‘Ee \’ ed \ ‘e0 – кодування російських букв у файлах формату RTF.

Семібітная виду У в а ж – Фактично, це кодування Unicode. Всі “нелатинські” символи представлені у вигляді & # xxxx;, де xxxx – код символу в кодуванні Unicode. Застосовується деякими поштовими програмами.

 UTF8 – Кодування застосовувана для створення тексту на декількох мовах. У поштовій програмі Outlook Express вона називається Unicode, що не зовсім вірно. Виглядає вона приблизно так: РЅРμРІРμСЂРЅРѕ.

 UTF7 – Також для створення тексту на декількох мовах. Зразковий вид: + BD8EQAQ + BDMEQAQwBD.

 Base64 – Популярна семібітная поштова кодування: ojZGVmaW5lIF9fQ09ORklHX0gN

 BinHex 4.0 – Кодування для пересилки файлів через Мережу використовувана в комп’ютерах Macintosh:

(This file must be converted with BinHex 4.0)
: #Nl$3S0#L0PEQ4TCJd+$3S[,b

 Uuencode / Uudecode – Кодування для пересилки поштою двійкових файлів:
begin 644 config.h
1U](#0HC9&5F:6YE(%]?0T].1DE’7T

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*