Освоєння Web 3.0, HTML, XML, DHTML, Інтернет-технології, статті

У статті, опублікованій в New York Times в листопаді 2006 року, репортер Джон Маркофф заявив: «Комерційний інтерес до Web 3.0 або до Semantic Web, починає виникати тільки тепер» [1]. Ця заява викликала велике замішання з приводу відносин між Semantic Web і Павутиною як такої, а також між Semantic Web і деякими аспектами концепції, відомої під назвою Web 2.0. Деякі експерти відкидали термін «Web 3.0» як надмірно орієнтований на бізнес, інші підозрювали, що викладені в статті концепції є лише частиною більш широкого уявлення про Semantic Web, а треті відчували, що як не назви, а проникнення Semantic Web в бізнес-розділ New York Times означає досягнення певної зрілості.

Стандартизація Resource Description Framework (RDF) і Web Ontology Language (OWL), мов, що лежать в основі Semantic Web, і визрівання нових технологій до вбудовування семантики в існуючі Web-сторінки і до запитів RDF до сховищ знань показують, що в цій області явно відбувається щось шалено цікаве.


Історичний фон Semantic Web

Після десятирічної роботи над основами Semantic Web і через п’ять років з тих пір, як назва стала популярним, зараз самий відповідний момент, щоб окинути поглядом поточний стан справ і перспективи на майбутнє. Зародившись у вигляді скромної методики для машинно-інтерпретуються метаданих і пройшовши через «всеохопне» уявлення про нову еру програмного забезпечення (часто помилкове, сприймається як наукова фантастика), ідея Semantic Web визріла в набір стандартів, які підтримують «відкриті» дані і погляд на обробку інформації, сфокусований скоріш на самої інформації, ніж на її обробці.

З однією з точок зору, Semantic Web – це злиття Web-технологій та науки про подання знань (knowledge representation, KR), що є підобластю штучного інтелекту (artificial intelligence, AI), спрямоване на створення і підтримку (потенційно складних) моделей світу, які дозволяють міркувати про себе і про пов’язаної з ними інформації. В такій якості ми можемо зрозуміти Semantic Web, спираючись на досвід, отриманий при розробці та впровадженні Web, а також на (можливо, трохи більш болючий) досвід впровадження технологій штучного інтелекту.

У Web ми спостерігали появу деяких абсолютно нових бізнес-моделей, які реально працюють, незважаючи на те, що спочатку здавалися нездійсненними. До них можна віднести моделі, представлені або вдосконалені Netscape, Amazon і eBay, Yahoo! і Google. Спільне використання інформації (чи «контенту», як її часто називають у міркуваннях про Павутині) призводить до несподіваних і казковим результатами – Варто зробити річ доступною, і деякі починають використовувати її абсолютно непередбачуваним чином. Феномен «довгого хвоста» (наприклад, сумарні продажі малозатребуваних товарів, на зразок спеціалізованих книг, перевершують загальна кількість проданих бестселерів) кидає виклик традиційним уявленням про бізнес-моделях, але виключно важливий для нової Web-економіки. Web-сайти насправді існують не в ізоляції. Посилання – ось що змушує працювати пошукові машини і наповнює силою «блогосферу».

Пройшовши через ейфорію навколо штучного інтелекту в 80-х роках і похмілля «зими штучного інтелекту» 90-х, вдалося з’ясувати, що саме не працює: окремо розташована «додаток штучного інтелекту »продати не можна. Ці технології мають сенс, лише будучи вбудованими в інші системи. Інструменти продавати важко, вони не особливо привабливі для бізнесу (і вже звичайно не мають ніякого сенсу для венчурних капіталістів). Нарешті, розмірковуючи про штучний інтелект як такому, ми помічаємо, що механізми міркування – це не кінцева мета, а лише засіб її досягнення; важливий не стільки сам факт, скільки спосіб їх використання.

З часом багато хто захопився ідеями Web 2.0. Ми досить прохолодно ставимося як до самого цього терміну, так і взагалі до нумерації версій Павутини, але визнаємо, що еволюційний процес рясніє цікавими явищами. У головному, Web 2.0 являє собою соціальну революцію у використанні Web-технологій, зміна парадигми Web від засобу публікації до засобу взаємодії та участі. Однак з точки зору Semantic Web найбільш цікаві такі технічні аспекти:


З моменту випуску стандартів RDF та OWL в 2004 році ми спостерігали безліч експериментів (і помилок) в пошуках правильного мови подання для кожного конкретного додатка. Не дивно, що почали з’являтися підмножини та розширення цих мов – найбільш помітні серед них версії RDF (S), що запозичують деякі функції з OWL (при цьому залишаючись простішими, ніж «OWL Lite»). Інші розробники вкладають значні зусилля в перегляд і розширення функціональних можливостей стандарту OWL, який зараз виходить у новій версії OWL 1.1.

Оскільки більша частина поточної роботи видається на академічних конференціях, з’являються нові журнали, присвячені семантичним технологіям, а більшість мовних проектів виконується в академічних лабораторіях і корпоративних дослідницьких центрах, не дивно, що Semantic Web сприймається передусім як дослідницький напрямок, ще не готове до масового застосування на практиці. Проте ми можемо спостерігати значну активність в розробці додатків, і, як показано в наступному розділі, вона починає приносити важливі і цікаві результати.


Web 3.0

Хоча прихильники Semantic Web давно спостерігали свідоцтва зростаючого інтересу, за останні кілька місяців технологічні успіхи стали набагато більш очевидними. Це відбулося в значній мірі завдяки досягненню певної зрілості мовами RDF і підтримують їх технологіями.

У липні 2005 року включення компанією Oracle підтримки RDF в свій продукт Spatial 10.2g забезпечило легітимність, якої, на думку деяких, бракувало мови. В ході експериментів з базами даних RDF в багатьох випадках виявилися їх безсумнівні переваги перед традиційними структурованими базами даних, особливо щодо вбудовування даних у Web. Як відзначає компанія Microsoft в грудневому випуск Connected Services Framework 3.0 Developer Guide за 2006 рік [2]: «Зберігання профілів із застосуванням RDF вигідно з двох причин. По-перше, RDF забезпечує гнучку схему зберігання даних, що дозволяє зберігати додаткові типи інформації, про які не було відомо при первісній розробці схеми. По-друге, це допомагає створювати Web-подібні відносини між даними, що нелегко зробити в звичайній реляційної бази даних ».

З визнанням RDF назріла потреба в стандартному мовою запитів для RDF, що грає ту ж роль, що і SQL в реляційних даних. Протокол SPARQL і мова запитів RDF Query Language [3], сьогодні проходять стандартизацію в W3C, розроблені саме з цією метою. Директор компанії-«стартапа» Radar Networks Нова Співак зазначив у своєму блозі в лютому 2007 року: «В даний час є величезний інтерес до SPARQL, і зростає кількість точок доступу SPARQL, що виникають в Web. Ці точки доступу по відношенню до даних грають ту ж роль, що і Web-сайти по відношенню до документів ».

Сьогодні різні компанії, великі і маленькі, розвивають цілий ряд напрямів у Semantic Web. Наприклад, англійська компанія Garlik використовує технології Semantic Web для «управління персональними даними в цифровому світі ». Зокрема, компанія працює над тим, щоб дати можливість користувачам виявити сліди своєї присутності в Web і побачити, що може розкрити агрегування цієї інформації, виставленої на огляд через сховище RDF. Інженер компанії Yahoo Дейв Беккетт оголосив в листопаді 2006 року, що сайт Yahoo Food використовує OWL і RDF, а також ряд інших технологій. Компанія Teranode, серед іншого, досліджує використання технологій Semantic Web для інтеграції наукових даних, особливо в галузі біологічних наук. Joost (www.joost.com), нова платформа Internet-телебачення, що стала героєм новин у лютому, оголосивши про партнерство з Viacom, широко використовує RDF. Більш того, Joost збирається надати свою відкриту внутрішню технологію RDF некомерційної корпорації Apache Software Foundation, розширивши її доступність для Web-розробників.

Цікаво відзначити, наскільки мала частина зусиль, що спрямовується на те, що раніше здавалося головним завданням Semantic Web – інтеграцію корпоративних інформаційних активів за допомогою онтологій. Не можна сказати, що така робота не ведеться, – Oracle, IBM і кілька початківців компаній досягли в цій галузі серйозних результатів, але ключовим напрямком розвитку технологій Semantic Web є вбудовування RDF і OWL в Web через що має першорядне значення механізм URI. Науково-дослідне спільнота широко експлуатує технології штучного інтелекту, які, зокрема, мотивують розвиток діалекту OWL DL, тоді як «павутинні» функції мови, іноді звані «темною стороною» Semantic Web [4], живлять простір технологій Web 3.0.


За горизонтом Web 3.0

Яким ми бачимо майбутнє Semantic Web, і особливо, застосування цих нових технологій у вирішенні найважливіших проблем, що стоять перед інформаційними системами? У Web 3.0 ці технології знаходять родючий грунт у багаторівневих Web-додатках, де проміжний рівень може бути реалізований з використанням сховища триплетів RDF, яке, зокрема, забезпечує інтеграцію різнорідних джерел даних і репозиторіїв. Затвердження SPARQL в якості стандартного мови запитів для RDF дозволяє багатьом сховищ даних постати у вигляді точок доступу SPARQL, таким чином забезпечуючи гнучкий обмін даними між системами. Це прокладає шлях до Web-додатків, які мають свого роду «фрактальну» структуру з шаблонами, в яких один компонент використовує інший як джерело даних (наприклад, через SPARQL) і сам виступає в ролі джерела даних для третього компонента ( рис. 1 ). Така архітектура дозволяє по-новому поглянути на Web-сервіси та слабо пов’язані розподілені системи.

По суті, ми маємо всі підстави розглядати технологію Semantic Web як новий підхід до інтероперабельності: розробники додатків можуть відкласти до часу виконання визначення семантики діалогу між двома інформаційними системами навіть після того, як системи були розгорнуті. Використовуючи механізми міркування для доступу до неявної інформації в рамках діалогу, що складається з явних тверджень, і дозволяючи системам динамічно розвивати свої здібності, обзаводячись новими онтологіями і даними для побудови міркувань, Semantic Web дає нам можливість будувати неустаревающіе системи, здатні діяти правильно навіть в несподіваних ситуаціях. Цей підхід особливо корисний, коли інтероперабельність є життєво важливою, наприклад, в комп’ютерному середовищі, що складається з безлічі вбудованих систем. Для підключення, скажімо, вашого кишенькового пристрою до динамічно змінюється сукупності з десятків, якщо не сотень, інших систем, часто вам непідконтрольних (і потенційно небезпечних), потрібні зовсім нові підходи до забезпечення інтероперабельності. Ми більше не можемо чекати апріорної стандартизації взаємодії з кожною з систем, фактично, ми не можемо навіть уявити собі всі можливі сценарії таких взаємодій.

Життя в такому безмежному світі вимагає механізмів для обмеження числа варіантів при прийнятті рішень. Наприклад, при пошуку певного сервісу виникає бажання обмежити набір кандидатів якимсь доречним контекстом (скажімо, тими, які знаходяться у вашому найближчому оточенні). Аналогічним чином, традиційні механізми контролю доступу можуть не впоратися в ситуаціях з необмеженим набором систем і користувачів: потрібні нові механізми прийняття рішень для здійснення більш гнучкої політики. Можна очікувати, що технології Semantic Web дозволять реалізувати такого роду технологічні структури і платформи. Ми стверджуємо, що розуміння контексту і розуміння політики – це взаємодоповнюючі, а не окремі механізми: розглядайте політики (і їх здійснення) як специфічний вид контексту.

У довгостроковій перспективі, коли кошти опису об’єктів Semantic Web стануть досить зрілими, ми зможемо використовувати їх виразну міць для опису предметів реального світу. Згідно з однією з точок зору, фізичні об’єкти стануть доступні в Web в тому сенсі, що ми зможемо представити їх за допомогою метаданих. Точно так само, як застосування семантичних технологій до проблем інтероперабельності в всюдисущих обчислювальних середовищах, опис фізичних об’єктів розширить наші можливості за межі сучасної Павутини. Це мало чим відрізняється від тверджень, що Web-сервіси просто експлуатують механізми і технології, розвинуті для Web, але самі не мають до цього ніякого відношення. Зусилля з розвитку Semantic Web забезпечують підхід до створення гнучких, інтелектуальних інформаційних систем, частина з яких будуть Web-додатками, але зрозуміло, ними справа не обмежиться. У той же час, можливості застосування Web-технологій розширюються і в інших напрямках. Наприклад, консорціум W3C почав проект під назвою Ubiquitous Web («Всюдисуща Павутина»), визнаючи вигоди від розширення Web за межі наших ПК і ноутбуків на інші типи пристроїв і ситуацій. Синергетика вездесущности і семантики – захоплююча область, в якій ми очікуємо докладання значних зусиль у майбутньому.

Близько шести років тому ми змалювали наші уявлення про Semantic Web [5], включаючи і те, що дані, описані способом, піддається машинної інтерпретації, разом із засобами для визначення словників і онтологій приведуть до нових революційних Web-додатків. Тоді в одному з відступів ми згадали, що не можемо достовірно передбачити, яким буде «типове додаток» Semantic Web. Ми всього лише стверджували, що «можливості Semantic Web занадто різноманітні, щоб міркувати про них в термінах розв’язання однієї ключової проблеми або створення однієї потужної системи. Вони матимуть такі застосування, про які ми не можемо навіть мріяти ». Сьогоднішнє різноманітність програм Semantic Web, від інтеграції корпоративних даних до нового покоління Web-телебачення, показує, що це було зменшенням.

Хоча багато аспектів Semantic Web все ще чекають своїх дослідників, і треба ще багато зробити, ясно, що ця технологія поступово займає гідне місце в сучасній Web-всесвіту. Ми можемо не любити термін «Web 3.0», але ми з ентузіазмом освоюємо стоять за ним технології.

Література




  1. J. Markoff, Entrepreneurs See a Web Guided by Commonsense. The New York Times, 12 Nov. 2006.

  2. Connected Services Framework 3.0 Developers Guide, Microsoft, 2006; msdn2.microsoft.com/en-us/library/aa303446.aspx.

  3. E. Prudhommeaux, A. Seaborne. SPARQL Query Language for RDF. W3C working draft, 26 Mar. 2007; www.w3.org/TR/rdf-sparql-query.

  4. J. Hendler, The Dark Side of the Semantic Web. IEEE Intelligent Systems, vol. 22, no. 1, 2007.

  5. T. Berners-Lee, J. Hendler, O. Lassila. The Semantic Web, Scientific Am., May 2001.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*