Глибинний аналіз даних в режимі реального часу: Oracle Real Time Decisions

Введення


Результати досліджень, проведених компаніями Gartner і Merill Lynch, показують, що бізнес-аналітика ( Business Intelligence – BI ) Залишається одним з трьох головних пріоритетних напрямів розвитку. Тому корпорація Oracle, як і її основні конкуренти, приділяє дуже велику увагу аналітичним можливостям своїх бізнес-додатків, оскільки саме вони є ключовим фактором, який впливає на вибір споживачів. Серйозне місце в аналізі даних починає займати глибинний аналіз даних ( Data Mining ), Процес пошуку різних закономірностей у величезному наборі фактичних даних. У цілому, термін Data Mining позначає не стільки конкретну технологію чи підхід, скільки сам процес пошуку кореляцій, тенденцій, взаємозв'язків, асоціацій і закономірностей за допомогою різних математичних і статистичних алгоритмів. Мета цього пошуку – представити дані у вигляді, чітко відбиває бізнес-процеси, побудувати модель, за допомогою якої можна прогнозувати процеси, критичні для планування бізнесу та проводити історичний аналіз даних для побудови планів і бюджетів. Основне завдання Data Mining – Прогнозування тих чи інших процесів.

Для реалізації технологій вилучення знань до складу СУБД Oracle Database включена спеціальна опція – Oracle Data Mining, основу якої складають процедури, що реалізують різні алгоритми побудови моделей, засоби підготовки даних, оцінки результатів, застосування моделей. Використовувати всі ці можливості можна як на програмному рівні за допомогою Java API або PL / SQL API, так і за допомогою графічної середовища Oracle Data Miner (ODM). Продукт ODM і Data Mining опція існують досить давно і добре відомі спільноті Oracle.

Oracle, купивши в 2005 році компанію Siebel Systems, прийняла рішення, що корпоративна лінійка коштів Business Intelligence (BI) корпорації буде базуватися на Siebel Analytics, а її CRM-системи – на Siebel CRM. До складу продуктів Siebel Analytics і Siebel CRM в рамках OEM-угоди включався Real-Time Decisions – Спеціальний інструмент для Data Mining від компанії Sigma Dynamics. Ця компанія була розробником засобів так званої прогнозної аналітики (predictive analytics), що дозволяють передбачати, наприклад, реакцію конкретного замовника на те чи інше комерційну пропозицію, спираючись на аналіз накопичених раніше даних і беручи до уваги оперативну інформацію, що надходить в режимі реального часу. Завдання такого роду стоять перед користувачами CRM-систем (крос-продажу, утримання клієнтів), call-центрів (інтелектуальна маршрутизація викликів), засобів забезпечення безпеки (виявлення шахрайства) і т. д. Таким чином, черговим кроком корпорації Oracle в цьому напрямку стало придбання активів компанії Sigma Dynamics. Так з'явився новий продукт Oracle Real-Time Decisions (Oracle RTD). Розглянемо основні особливості цього продукту.


Опис Oracle RTD


Oracle RTD – Це продукт лінійки Data Mining, створений для прогностичної аналітики в режимі реального часу. Він побудований повністю на SOA-архітектурі. Oracle RTD публікує назовні різні Web-сервіси, через які здійснюється робота з сервером. Він складається з п'яти основних компонентів:


Проект в RTD називається Inline Service . Розробка проектів ведеться в Decision Studio. Взагалі сама розробка моделей у RTD дуже схожа з програмуванням на Java. У кінцевому результаті весь проект являє собою набір Java-класів, які виконуються на сервері додатків. Основним компонентами Inline Service є


Oracle RTD може виявитися особливо корисними для реалізації адаптуються бізнес-процесів, тобто процесів, логіка яких визначається не набором фіксованих бізнес-правил, а може змінюватися з часом. Одне з головних переваг цього продукту – функції самонавчання. І оскільки основне завдання таких додатків – аналіз даних, що містяться в базах підприємства з метою визначення намічених трендів діяльності, то раннє виявлення подібних трендів дозволяє приймати рішення точніше і швидше.


ODM і ORTD


Корпорація Oracle на сьогоднішній день пропонує два рішення класу Data Mining – ODM (Oracle Data Mining), рішення на основі Data Mining опції бази даних, і Oracle Real-Time Decisions. Опція для аналізу даних Data Mining є потужним двигуном, який розташовується в ядрі бази даних і тому розрахований на обробку екстремально великих обсягів даних. Саме тому Data Mining зручно застосовувати регламентовано при формуванні сховищ даних або при історичному аналізі даних та виявленні тенденцій, закономірностей і залежностей. Для Data Mining джерелом і приймачем інформації є таблиці бази даних. З іншого боку, Oracle RTD є продуктом іншої категорії. Його зручно застосовувати в режимі реального часу, коли обсяги даних, що надходять не настільки великі, але швидкість видачі результатів повинна бути високою. Зазвичай така практика поширена в бізнес-додатках (облікових системах), коли по інформації, що надходить в режимі реального часу треба робити висновки і видавати рекомендації.

На сьогоднішній день найбільш розвиненим способом інтеграції додатків є SOA-архітектура. Тому ORTD і розрахований на SOA-середу. Слід зазначити, що відрізняється у двох продуктів і методика роботи самого движка, в ODM розробник повинен чітко і правильно налаштувати моделі для аналізу даних. З іншого боку, ORTD надає механізми, в якому моделі можуть самостійно налаштовуватися і змінюватися. У Загалом ситуація з ODM і ORTD схожа на ситуацію, яка склалася з Oracle-продуктами для побудови сховищ даних Oracle Warehouse Builder (OWB) і Oracle Data Integrator (ODI). ODM є аналогом OWB, оскільки працює на рівні бази даних Oracle. RTD, відповідно, є аналогом ODI, розрахований на роботу в SOA-середовищі, має готові механізми для настроювання моделі. Тобто Oracle пропонує продукти двох категорій: один для розробників базових технологій, які знають SQL, PL / SQL, Java, і для розробників нових і "модних" систем, які використовують SOA-стандарти XML, WSDL і т.д. Відповідно з цим RTD можна легко і просто інтегрувати в BPEL-процеси. Ще однією відмінною особливістю цих двох продуктів є те, що ODM призначений для безпосереднього аналізу даних, в той час як ORTD призначений більшою мірою для інтеграції аналізу даних у бізнес-додатки.








































Oracle Data Mining

Oracle Real-Time Decisions


Сервер


Опція бази даних, представляє собою набір готових процедур і пакетів


J2EE додаток


Платформи


Сервер – платформи, на яких існує Oracle Database
Клієнт – будь-яка платформа з підтримкою Java


Сервер – будь-який J2EE-сервер

Клієнти – будь-яка платформа з підтримкою Java


Інтерфейс


PL/SQL API, Java API


Web-сервіси, Java API


Алгоритми


Алгоритми класифікації, кластеризації, пошук істотних атрибутів, регресія, пошук асоціацій, виділень ознак


Складні моделі прогнозування на основі класифікації


Клієнти


Oracle Data Miner – "товстий" Java-клієнт для створення, налагодження, запуску моделей


Decision Studio – "товстий" Java-клієнт для проектної роботи

Decision Center – Web-додаток для моніторингу, запуску та адміністрування проектів


Інтеграція


На рівні базі даних


На рівні Web-сервісів


Можливості налаштування моделей


Тільки налаштування параметрів


Гнучка настройка моделей на Java


 

Висновок

Oracle Real-Time Decisions представляється дуже цікавим продуктом для розширення аналітичних можливостей бізнес-додатків і BI-систем. Він ідеально підходить для SOA-середовища і легко інтегрується в будь-які бізнес-процеси на підприємстві. Основний його плюс – це які самостійно прогностичні моделі, які можна оперативно запускати через Web-сервіси. З іншого боку, Oracle Data Mining ідеально підходить для глибокого і всебічного аналізу великих обсягів інформації. Його плюси – велика кількість різних алгоритмів для аналізу, що дозволяють проводити тонке налаштування і робити різні перед-і пост- обробки даних. ORTD – це більшою мірою закінчене бізнес-додаток, яке треба налаштувати і адаптувати для конкретних бізнес-завдань. ODM – це потужний інструмент і технологія, яка дозволяє будувати складні і різнобічні системи для аналізу даних.

В даний час відділ бізнес-аналізу і сховищ даних Консалтингової групи "Борлас" займається вивченням продукту Oracle Real-Time Decisions. У наступних номерах OM / RE ми покажемо на прикладах, як працює даний продукт і виконаємо невеликий бізнес-приклад.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*