XML. Огляд мови, HTML, XML, DHTML, Інтернет-технології, статті

Сергій Коломієць
www.i.com.ua/~srk
srk@i.com.ua

XML є результатом більш ніж піввікової роботи програмістів – розробників гіпертекстової системи подання інформації. Однак додатки, реально використовують цю систему, з’явилися тільки в середині 60-х років, коли стало необхідно об’єднати безліч інформаційних ресурсів в єдиний комплекс.


Основною ознакою гіпертексту є механізм нелінійного представлення інформації. Дані представляються не у вигляді безперервного потоку, а набором різних, пов’язаних між собою, компонентів, навігація за якими здійснюється за допомогою гіперпосилань.


Самим широко використовуваним на даний момент мовою гіпертекстової розмітки – HTML. HTML містить набір інструкцій (тегів), за допомогою яких здійснюється розмітка тексту. Теги HTML управляють процесами введення-виведення інформації в програмі-клієнті (Що, до речі, є серйозним недоліком, так як вид подання документа може змінюватися при переході від одного клієнта до іншого). Внаслідок цього ця мова не визначає структуру документа.


Дані, укладені в теги HTML, ніяк не пов’язані з самими тегами. Наприклад:


Жирний текст


Броузер відображає текст напівжирним шрифтом, проте він не “бачить” зв’язку даного тега з іншими, не “розуміє”, чи включений цей тег в інші, чи включає він сам небудь. Це вкрай ускладнює пошук інформації в таких документах. Також, недоліком HTML є обмежений набір тегів і відсутність можливості вводити розробником нових інструкцій.


У зв’язку з цим в 1998 році консорціумом World Wide Web Consortium був прийнятий принципово новий мова гіпертекстової розмітки XML (Extensible Markup
Language), відрізняється наступними ознаками:


·        Поділ уявлень і даних полегшує модифікацію GUI, оскільки оброблювані дані при цьому не змінюються


·        Можливість введення нових тегів, що дозволяє створювати і використовувати спеціальні мови подання даних


·        У міру стандартизації додаткових тегів полегшується обмін даними між веб-сторінками.


Автор документа на XML сам створює його структуру, набори елементів, будує зв’язки між ними і домагається оптимального типу розмітки, пошуку та аналізу документа.


Так як XML визначає структуру документа, то він, відповідно, дозволяє проводити перевірку коректності даних, ієрархічних відносин у документі, стандартизувати структуру документів з різними даними. Це властивість можна застосувати для побудови складних інформаційних систем, де необхідно забезпечити оперативний обмін інформацією між різними додатками в одній системі.


Для XML не потрібно складних програм-обробників, тому про його підтримку заявили такі виробники програмного забезпечення, як Microsoft (MS Explorer 4.0/5.0/5.5), Netscape, Oracle та ін


* * *


Тіло документа XML складається з елементів розмітки та вмісту документа. Теги призначені для визначення елементів документа, атрибутів і інших конструкцій. Документ XML починається з тега , В якому можна вказувати кодову сторінку, версію мови та іншу інформацію.


Вимоги до XML-документу:


·        Заголовок документа – З необхідними параметрами.


·        На відміну від HTML, в XML кожен тег повинен мати закриває елемент.


·        В враховується регістр символів.


·        Атрибути тегів полягають в лапки.


·        Необхідний строгий порядок проходження відкривають і закривають тегів при використанні вкладень.


Існують два способи перевірки коректності XML-документів – визначення DTD (Document Type Definition) і семантичні схеми.


У XML представлені наступні конструкції:


·        Елементи даних.


·        Атрибути


·        Директиви


·        Спеціальні символи


·        Коментарі


·       
CDATA


Елементи даних – основні структурні одиниці документа. Наприклад:


<animal>cat</animal>


Будь-який елемент повинен обов’язково містити відкриває та закриває теги. Його вмістом можуть виступати будь-які конструкції мови. Набором елементів визначається структура документа. Пошук в документі проводиться, спираючись на цю структуру.


Атрибути – це параметри, що визначають характеристики тих чи інших елементів. Так само, як і в HTML, вони задаються парою “Назва” = “значення”.


Директиви аналізатора позначаються в XML тегами . Броузер використовує ці інструкції для управління розбору документа.


Для відображення в тексті документа деяких спеціальних символів, як, наприклад, лапки або кутовий дужки, необхідно використовувати їх спеціальні символьні ідентифікатори (& lt, & qout).


Коментарі визначаються за аналогією з HTML як . Вони ігноруються аналізатором при розборі структури документа.


Тегом CDATA визначається область документа, що розглядається аналізатором, як просто текст. У цю область можна поміщати, наприклад, Java Script. Форма запису тега:


<![CDATA] Текст]]>


* * *


Що ж можна віднести до недоліків нової мови розмітки? Внаслідок відсутності визначених тегів і гнучкості структури мови існує безліч програм-обробників (parsers) XML-файлів. Це призводить до ускладнень в області стандартизації мови і може спричинити за собою поділ його на безліч діалектів.


XML можна називати новою сходинкою Web-програмування, можна вважати просто наступним кроком у розвитку HTML, але, безсумнівно, можна сказати, що його впровадження і повсюдне застосування (не тільки в Інтернеті, а й в інших інформаційних системах, наприклад, в системах управління підприємством) призведе до значного спрощення пошуку, аналізу, обробки і відображення інформації.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*