Декодувальник – початківцям криптографія, криптографія, Security & Hack, статті

Трошин Сергій, stnvidnoye.chat.ru

У гранично чіткій і стандартизованому Світ комп’ютерів і всього, що з ними пов’язано, якщо вдуматися, склалася трохи парадоксальна ситуація. Так, стандартизовано практично все, що тільки можливо, але самих цих стандартів на кожну дрібницю так багато, що неважко потрапити в халепу навіть з самими головними компонентами ПК, намагаючись, наприклад, “увіткнути” свежераспакованний третій “Пень” в Socket370 замість застарілого “Селерон”, або пам’ять SDRAM в роз’єми SIMM. Виробникам заліза все складніше домовитися про єдині специфікаціях на нове обладнання – достатньо пригадати, на скільки виявилося через це затриманим повсюдне впровадження DVD – в результаті навіть сьогодні такий привід не так часто зустрінеш. Не спостерігається просвіту і в програмному забезпеченні. Запустив нову гру, а виявилось, що вона здатна продемонструвати всі свої тривимірні гідності тільки на відеокартах від 3DFX, і треба “качати” з Інтернету патч, щоб пограти в неї на TNT. Нова програма не може інтегруватися з Internet Explorer 5, треба з нею працювати – спробуй повернутися до четвертого “Експлорер”, якщо готовий заради цього “знести” цілком Windows’98SE.

В ідеалі, хотілося б, щоб таких проблем було якомога менше, і простий “чайник” не морщить лоб в спробах зрозуміти, чому щось не працює або не запускається, а програми і “залізо” були повністю сумісні не тільки один з одним, але і різними операційними системами. І, незважаючи на те, що багатством вибору операціоннок похвалитися абсолютно не можна, і нам хотілося б мати набагато більше альтернатив “кватиркам”, нечисленні творці ОС не зробили (та й не змогли б зробити) так, щоб, наприклад програми для Windows работлі хоча б під набирає популярність Linux у чомусь типу віртуальної машини (щось схоже, до речі, вже є, але на неофіційному рівні). Помріяти не шкідливо, скажете ви, з монополією на перспективну технологію ніхто з доброї волі не розлучиться і з конкурентом своєї документацією та вихідними кодами не поділиться. Безумовно, все пояснюється не тільки тим, що ми знаходимося тільки на зорі розвитку інформаційних технологій, і стандарти, не встигнувши народитися, тут же застарівають, залишаючи, тим не Проте, нам в спадок в якості свого праху необхідність їх підтримки в майбутніх продуктах. Багато в чому винні й розробники, бажаючі сьогодні ж урвати шматок пожирніше від великого пирога науково-технічної революції і не думають про історичну доцільність своїх розробок. Хтось не хоче відкрити код своєї операційної системи, навіть якщо б це нічого крім користі для комп’ютерного співтовариства не принесло, хтось винаходить велосипед, просуваючи свій власний стандарт, аби не використовувати специфікації конкурента, хтось патентує купу різних слотів під майже однакові процесори тільки для того, щоб користувачі витрачали більше грошей на апгрейд комп’ютерів, змінюючи материнську плату разом з новим процесором. Можливо, все це було б не так і важливо: ринок – Закон джунглів, нічого не поробиш, але стикатися з абсолютно зайвим різноманіттям стандартів припадає майже кожен день в самих різних дрібницях. Дуже незручно постійно долати якісь незручності, нами ж і породжені.

Купили ви, наприклад, новий компакт-диск з дуже потрібної програмою і, засунувши його з почуттям глибокого задоволення в привід CD-ROM, першим же ділом знаходите файл READ.ME, тисніть ліву кнопку миші і читаєте … Ні, нічого не читаєте, тому що в “Блокноті” замість російських букв суцільні крякозябри. Текст виявився в DOS-кодуванні … Можна, звичайно його і не читати, але раптом там написано, що програму треба встановлювати тільки в корінь диска С: \, а при інсталяції в інше місце вона ні за що не запрацює? Доводиться, забувши про все просунуті технології Windows, запускати старий добрий “Нортон”, жати заповітну “F3” і ламати очі від шістдесяти герц повноекранної DOS-сесії. Добре, якщо треба прочитати 10 рядків READ.ME, а якщо ви закачали з Інтернету полмегабайта “Нейромантіка” Вільяма Гібсона? До кінця книги доведеться очки замовляти. А все через те, що компанія Microsoft пішла своїм шляхом при створенні Windows і придумала власну кодування, звану в просторіччі Win-1251, не подбавши, як завжди, про кінцевий користувача, якому, розумієш, потрібна підтримка Блокнотом ще й “ДОСовскіх” кодової сторінки 866, створеної, до речі, самим же Microsoft. В результаті “На рівному місці” виникла ще одна проблема для недосвідченого користувача.

Але це ще не найгірший випадок! Через дісталися нам від різних Unix’ов, DOS’ов, Макінтош, кодувань, російськомовні завсідники Інтернету постійно стикаються при серфінгу по Мережі з незрозумілими ієрогліфами замість російських букв на багатьох сторінках Рунета. І якщо в останніх версіях найбільш популярних броузерів досить легко перемкнути кодову сторінку за допомогою меню “Вид” – “Кодування”, розшифрувавши, таким чином, весь текст на сайті, то листи, які пройшли через кілька поштових серверів, створених на різних операційних системах, і схожі більше на танцюючих чоловічків Конан-Дойля, прочитати часом можуть тільки в ФСБ. Щоб через незрозумілих маніпуляцій з поштовими повідомленнями по шляху їх слідування до адресата не вивчати криптографію, доводиться знову “навішувати” на систему додаткові утиліти – перекодіровщік, здатні відновлювати вихідний текст навіть після багаторазових його спотворень поштовими серверами, які, мабуть, все-таки запрограмовані робити як краще, а виходить …

Програм, призначених для перекодування текстів на ринку достатньо багато, знайти їх легко серед колекцій софта на сайтах типу www.download.ru/, практично всі вони вітчизняного походження, і майже повністю задовольняють будь-які потреби користувачів, але відмінності у функціональності та спеціалізації, все-таки є. Щоб кожен зміг обрати серед всього різноманіття цих хороших програм те, що потрібно саме йому, я спробував потестувати декілька найпопулярніших програм-перекодіровщік. Деякі з них є повноцінними текстовими редакторами, інші розроблені виключно для швидкого перекодування цілих пакетів файлів, але всіх їх об’єднує одне: вони дають нам те, що розробники самої популярної операційної системи, забувши про кінцевий користувача, не побажали врахувати при її розробці – сумісність з усіма текстовими стандартами.

TPZ Recoder
www.geocities.com/baja/3519/sof

  Recoder
дуже стане в нагоді веб-дизайнерам, які іноді змушені створювати кілька варіантів одних і тих же HTML-документів в різних кодуваннях. Він служить тільки для зміни кодування вихідних файлів і теоретично не призначений для розшифровки вашої пошти. Ця невелика вузькоспеціалізована програма виконає одночасне перекодування групи файлів в будь-яку з кодувань WIN, DOS, KOI, ISO, MAC, LAT, або навіть у всі відразу, створивши для кожного варіанту свою папку з відповідною назвою. У роботі гранично проста і зручна. Єдиний її недолік полягає в необхідності знати вихідну кодування файлу, але якщо його створили ви ж самі, то це, зрозуміло, не складе ніяких проблем. В якості конкурента можна подивитися, наприклад, програму “Перекодування Кирилиці" (reality.sgi.com/victors/), яка трохи менш зручна в роботі через те, що перекодує за раз тільки в один варіант текстового стандарту і замість приміщення отриманого файлу в нову папку, просто замінює старий, зберігаючи, правда, його резервну копію. Тому, хоча вона і “розуміє” ще й формат “Unicode”, для розробників сайтів підходить все-таки менше, вона швидше орієнтована на одиничне, несподівано потребовавшееся перекодування, ніж на постійну роботу з кодуваннями.

Tcode
alexboiko.chat.ru/

Ця утиліта призначена вже для автоматичного або ручного декодування “убитих” поштових повідомлень і новин із UseNet. При відновленні підтримуються кодування Dos, Windows, KOI-8, ISO 8859-5 та їх комбінації, а також перетворення тексту з форматів Base64, Quoted-Printable, HTML і UTF-8. За твердженнями автора, відмітна особливість програми – Використання швидкого евристичного алгоритму розпізнавання російських слів, в результаті чого TCODE повинен перевершувати по швидкості і точності інші подібні програми. З програмою максимально зручно працювати, використовуючи буфер обміну при читанні електронних листів і новинних телеконференцій, достатньо клікнути мишкою на значок TCODE в системній області панелі задач. З простими випадками псування текстів програма цілком справляється, проте з текстом виду ï & icirc, отриманому при збереженні HTML-сторінки з помилковим параметром CHARSET, і з дуже складним варіантом спеціально невірно перекодованої рази три файли вона не розібралася. Не працює вона і з транслітерацією – російськими словами, написаними латиницею. Можливо, в майбутніх версіях її функції будуть розширені, поки ж вона підійде, швидше, для недосвідченого користувача завдяки своїй простоті і швидкості роботи.

SHTIRLITZ
www.download.ru/

“Штірліц” цілком виправдовує свою назву завдяки дуже потужного механізму розшифровки зіпсованих текстів. Кількість підтримуваних кодувань (вам зустрічалася кодова сторінка 855?) і схем транслітерації просто величезна, причому, легко додати ще й свою власну схему кодування. Можна зробити читаються навіть тексти, в яких зустрічаються кілька кодувань в одному файлі, HTML-файли, при створенні яких був неправильно вказаний charset (ï & icirc), тексти, написані нестандартної транслітерацією або набрані в невірної розкладці клавіатури. “Штірліц”, на відміну від більшості аналогів, відновлює російський текст, складається з вигаданих слів, що говорить про оригінальність механізму розпізнавання кодування. Тексти листів, закодовані за допомогою uuencoding, xxencoding, base64 і binhex беруть свій нормальний вид автоматично і за частки секунди. Режим пакетного декодування, правда, не настільки зручний, як у програмі TPZ Recoder, так як одноразово можливо перекодування тільки в один стандарт, але зате блискуче реалізована настроюваність програми – не кожен користувач відразу розбереться у всіх режимах і функціях. На щастя, установки, прийняті в програмі за умовчанням, цілком достатні для переважної більшості випадків, тому труднощів в роботі з нею ні в кого не виникне – автоматична робота “Штірліца” і активне використання буфера обміну гранично полегшують відновлення текстів та електронних листів. А коли користувач трохи ближче ознайомиться з інструкцією і численними прикладами, то підлаштувати програму вже саме під свої, найчастіше зустрічаються схеми розпізнавання.

При інсталяції “Штірліца” в контекстне меню текстових файлів додасться дуже зручна команда “Відкрити Штірліцем”, шкода тільки що не можна вибирати в опціях інші типи файлів, до яких треба додати цю команду. Є корисна функція перетворення HTML-документа в текстовий файл. Іноді, правда зустрічаються прикрі упущення, наприклад, пакетне перекодування не працює з транслітом, самі файли з текстом, записаним латиницею не завжди переводяться в нормальний вигляд, та й дизайн інтерфейсу програми трохи застарів, особливо дивує величезна кнопка на одному з найбільш чільних місць Панелі Інструментів, випадкове натискання якої наводить до деінсталяції “Штірліца”. Але в цілому, це одна з найбільш потужних програм, впоралася майже з усіма найскладнішими тестовими файлами.

Hieroglif
www.adelaida.net/hieroglyph/

“Ієрогліф” – Найбільша програма огляду, вона є абсолютно повноцінним текстовим редактором, що підтримує навіть перевірку орфографії. Якщо ви будете набирати в ньому тексти, то відучити вибирати розкладку клавіатури при переході від російських слів до англійських – Ієрогліф зробить це за вас автоматично. При налаштуванні цієї програми вже можна самому поставити, до яких типів файлів додано до контекстне меню команда “Відкрити Ієрогліфом “, що позбавляє рядових користувачів від можливих помилок використання стандартного “віндового” засоби налаштування файлових асоціацій – меню “Властивості Папок”.

Підтримуються всі стандартні схеми кодування, транслітерація можлива в обидві сторони, що у конкурентів зустрічається досить рідко, причому при відновленні російського тексту з латинки, є інтерактивний режим, при якому практично виключені помилки відновлення з нестандартних схем трансліту. Дуже багато й інших, дуже потрібних функцій, що роблять цю програму найпотужнішою серед протестованих: перетворення HTML-документа в текст, очищення тексту після OCR-розпізнавання, сортування рядків списків за алфавітом, Автовизначник мови, переформатування текстів і абзаців – все це дозволяє максимально зручно працювати з текстами, виправляючи в них різні помилки.

Панель інструментів “Ієрогліф” надає і практично всі стандартні засоби для повноцінної роботи з текстами – від вибору шрифту, до його кольору та пошуку тексту, ні в чому не поступаючись “віндовий” WordPad (ще трохи і вийшов би Word J). Майже будь-яку функцію можна викликати прямо з Панелі Інструментів, натиснувши тільки одну кнопку. На жаль, на тестовому, понад міру “запороти” файлі, “Ієрогліф” себе ніяк не проявив, і жодного слова з нього не сприйняв, видавши суцільні квадратики замість літер. Не зміг він прочитати і HTML-файл, збережений з невірним charset, який був легко до цього розшифрований “Штірліцем”, та й багато файли прикладів, що поставляються зі “Штірліцем”, “Ієрогліф” перетворити в читаний вигляд не зміг. Розкодування поштових повідомлень не автоматизовано, що явно викличе труднощі у користувача, навіть якщо він не “чайник”. В іншому ж, це одна з кращих, якщо не найкраща, завдяки сумі всіх своїх можливостей і “просунутому”, сучасному інтерфейсу, програма на ринку, причому безкоштовна, що зустрічається вже все рідше і рідше. Ієрогліф, мабуть, швидше хороший текстовий редактор з функціями перекодіровщік, ніж спеціалізований декодер текстів.

Etype Mail
Decoder
www.gorlach.etype.net/ecoder/

Спеціалізація програми – Розшифровка поштових повідомлень, збережених на диску за допомогою Outlook Express, наприклад, і з цим вона справляється краще “ієрогліфи”, але для декодування доводиться натискати як мінімум чотири кнопки, так як автоматичного відновлення тексту прямо при відкритті файлу, як в інших програмах, не передбачено. Інтерфейс програми просто зразок мінімалізму – операції з буфером, відкриття та збереження файлу, вибір ручного або автоматичного декодування. Процес самого декодування, здається, займає трохи більше часу, ніж у конкурентів. І хоча радує самий повний набір підтримуваних форматів, але, тим не менш, кілька заплутаних послідовностей “знущань” над вихідним файлом, ставить Etype Mail Decoder в глухий кут. Загалом, проста програма, з достатньою потужністю для читання вашої пошти, яку можуть встановити собі ті, хто хоче бути впевнений, що в разі чого, зуміє швидко прочитати важливе повідомлення. Якщо ж ваш поштовий ящик кожен день “пухне” від листів, то підберіть що-небудь більш автоматизоване.

Конкуренти

Що ще можна спробувати крім розглянутих програм? Гідних програм багато, і хоча вони практично аналогічні за своїми можливостями і призначенням, у кожній є свої “родзинки”, описати які в невеликий і суб’єктивної журнальної статті неможливо. Подивіться самі, може бути, вам більше сподобається SNK Decoder (www.snkey.net/) або Реаніматор (www.ars.ru/products), на сайті www.download.ru/ рубрика перекодіровщік містить не один десяток утиліт, серед яких кожен знайде саме те, що потрібно для його роботи. А що стосується мене … От якщо б об’єднати швидкість “Блокнота”, інтерфейс і функціональність “ієрогліфи”, інтелект і потужність “Штірліца” …

Інформація до роздумів …

  ALT (Ms-Dos 866) – Альтернативне кодування DOS (кодова сторінка 866), розробка Microsoft і IBM, застосовується в операційних системах MS-DOS, PC-DOS, DR-DOS, OS / 2 і в FidoNet.
Зразковий вид в “Блокноті”: ⥪бв ў ᥳ ® © Є ® ¤ Еа ® ўЄҐ.

 ЯКІ-8 – Вона ж
KOI8-R
, Код обміну інформацією восьмібітних, розроблено в радянських НДІ, використовується в багатьох клонах ОС UNIX, таких як Linux і FreeBSD; повідомлення електронної пошти, що пересилаються по Інтернету також використовують це кодування.
Зразковий вид в “Блокноті”: рЕТЕД’БЗТХ’ЛПК ХВЕДЙФЕУШ

 Macintosh 10007 – MAC – Російська кодування на комп’ютерах Macintosh з операційною системою
MacOS.
Зразковий вид в “Блокноті”: “лЯ його прочитання

 ISO 8859-5 – Російська кодування в UNIX-системах, розробка International Standards Organization, використовується в основному, операційною системою Sun Solaris, що працює на комп’ютерах SUN.
Зразковий вид в “Блокноті”: вХ’бв Т бЬХіРЕЕЮЩ’ЮФШаЮТ’Х

  Windows-1251 – Microsoft code page 1252 дітище всесвітньо улюбленої фірми, використовується в Windows9x, WindowsNT, одна з найпоширеніших в Інтернеті.

 Latinica, Translit,
TRANS
– Транслітерація, запис російських слів латинськими буквами: Vsem privet!. Використовується в системах, що не підтримують кирилицю в принципі.

 Unicode – 16-бітова кодування, кожен символ представлений двома байтами – можливо, сама перспективна і вдала кодування з точки зору сумісності, але використовується рідко. Включає в себе 65 536 знаків, а не 256, як звичайні.

 Quoted printable – Семібітная виду = C2 = EE = F2 = EE = ED = E0 – використовується при кодуванні російських символів в поштових повідомленнях формату MIME.

Семібітная виду% C2% EE% F2 % EE% ED% E0 – також використовується при кодуванні російських символів в повідомленнях електронної пошти.

Семібітная виду \ ‘c2 \’ ee \ ‘f2 \ ‘Ee \’ ed \ ‘e0 – кодування російських букв в файлах формату RTF.

Семібітная виду У в а ж – Фактично, це кодування Unicode. Все “нелатинські” символи представлені у вигляді & # xxxx;, де xxxx – код символу в кодуванні Unicode. Застосовується деякими поштовими програмами.

 UTF8 – Кодування застосовувана для створення тексту на декількох мовах. У поштовій програмі Outlook Express вона називається Unicode, що не зовсім вірно. Виглядає вона приблизно так: РЅРμРІРμСЂРЅРѕ.

 UTF7 – Також для створення тексту на декількох мовах. Зразковий вид: + BD8EQAQ + BDMEQAQwBD.

 Base64 – Популярна семібітная поштова кодування: ojZGVmaW5lIF9fQ09ORklHX0gN

 BinHex 4.0 – Кодування для пересилки файлів через Мережу використовувана в комп’ютерах Macintosh:

(This file must be converted with BinHex 4.0)
: #Nl$3S0#L0PEQ4TCJd+$3S[,b

 Uuencode / Uudecode – Кодування для пересилання поштою двійкових файлів:
begin 644 config.h
1U](#0HC9&5F:6YE(%]?0T].1DE’7T

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*