OLAP: як розібрати інформаційну звалище, Інтеграція додатків і даних, Бази даних, статті

Оперативний доступ до інформації та її ефективний аналіз – те, чого досі не вистачає багатьом підприємствам для успішного розвитку бізнесу. В одному випадку накопичені масиви даних є просто набір звітів, позбавлених єдиної структури, в іншому – користувачі просто не мають постійного і швидкого доступу до необхідних баз, в третьому – навіть маючи на руках всі потрібні дані, співробітники підприємства не в змозі зробити з них відповідні висновки. У всіх перерахованих ситуаціях ефективність бізнесу помітно знижується. Багато експертів дотримуються думки, що в такій ситуації слід будь-яким способом налагоджувати процес роботи з інформацією. Як варіант – впроваджуючи OLAP-продукти.


Бізнес накопичив величезні обсяги інформації, але без уміння ефективно використовувати її при прийнятті рішень вона стає даремною. Історично аналіз починався з побудови звітності в облікових системах, однак спроби розвитку звітності транзакційної системи в повноцінний інструмент аналітика показала обмеженість даного підходу. Виявилися наступні проблеми: в обліковій системі можуть зберігатися дані тільки останнього періоду; структура інформації націлена на оперативне внесення даних і не ефективна при угрупованню по аналітичним ознаками; потрібна інформація може бути “розсіяна” по базах різних облікових систем і т.п.


Складові принципу FASMI


Fast – Швидкий відгук системи, не більше 5 сек.;


Analysis – Повнофункціональний аналіз максимально зручним способом;


Shared – Багатокористувацький доступ, захист інформації;


Multidimensional – Багатовимірне концептуальне подання даних у вигляді кубів з ієрархічними вимірами;


Information – Отримання інформації в потрібному обсязі, там, де вона необхідна.


Був потрібен абсолютно новий підхід, який і був запропонований в 1993 році основоположником реляційних баз даних Едгаром Коддом. Сформульовані ним 12 правил визначили сутність технології OLAP (On-Line Analytical Processing). Згодом правила були перероблені в принцип FASMI (Fast Analysis of Shared Multidimensional Information).


Центральним пунктом в цьому списку є багатомірне представлення даних. При такому підході інформація класифікується по заданому набору ознак, що утворює вимірювання багатовимірного простору даних. Це дозволяє користувачеві бачити потрібну йому інформацію в найбільш інтуїтивно зрозумілому вигляді – у вигляді таблиці, по осях якої розгорнуті потрібні сполучення аналітик, а всередині знаходяться згруповано потрібним чином дані.


В даний час технологія OLAP отримала широке визнання. Лінійки OLAP-продуктів представляють практично всі основні виробники програмного забезпечення для баз даних. Незважаючи на вражаючі можливості технології багатовимірних БД, ряд поширених помилок часто заважає успішному впровадженню OLAP-продуктів.


Міфи про OLAP


Багато користувачів під online-аналізом помилково розуміють наявність і застосування найбільш актуальних даних. Насправді під терміном “online”-аналіз мається на увазі швидка реакція системи на формовану користувачем послідовність уточнюючих запитів. Аналіз як би слід за думкою аналітика. Наприклад, регіональний менеджер може міркувати так: “Чим викликаний спад продажів по регіону в Минулого місяця? – Це пов’язано з певним магазином? – Як у цьому магазині розподілялися продажу по днях? – Чому такий низький рівень продажів у першій половині місяця? – Чи добре продавалися товари групи “A”? – Чи були ці товари на складі? “І після цього він приймає рішення, наприклад, про підвищення страхового запасу товарів групи” А “на складі.


4 міфу про OLAP


Міф 1. OLAP – online-аналіз, значить, в ньому найбільш актуальні дані;
Міф 2. OLAP – це просто засіб візуалізації даних;
Міф 3. OLAP замінює систему звітності;
Міф 4. Для отримання бажаного результату досить просто підключити OLAP до обліковій системі.


При цьому далеко не обов’язково, що в аналітичній базі присутні дані до останньої транзакції. Досить поширеною є практика, коли дані в аналітичній базі оновлюються раз на добу і містять інформацію “на початок дня”. У багатьох випадках, як, наприклад, у наведеному вище, це не впливає на достовірність аналізу.


Ще одна помилка, поширене серед початківців користувачів OLAP, Полягає в сприйнятті цих систем просто як засоби відображення тих же даних, що є в обліковій системі, в багатовимірному вигляді. Цим помилкою часто користуються деякі виробники програмних продуктів, що пропонують користувачам псевдо-OLAP-функціональність, наприклад, імітацію куба за допомогою запитів до традиційної базі. Насправді ж ці рішення вкрай залежні від обсягу збережених даних, що вступає в протиріччя з одним з основних правил Е. Кодда, що вимагає, щоб продуктивність формування звітів істотно не падала зі збільшенням розмірів бази даних. В OLAP-продуктах це досягається зберіганням попередньо обчислених агрегованих значень. Наприклад, на відміну від традиційних баз облікових систем, де зберігається список продажів товарів, в OLAP-базі додатково можуть зберігатися підсумки продажів в розрізі товарів, категорій товарів, клієнтів і т.п.



Третій міф, пов’язаний з OLAP, Полягає в тому, що користувачі сприймають її як рівнозначну заміну системі звітності. Насправді багато залежить від особливостей звітності підприємства. Часто вона характеризується жорсткою регламентацією форм, вимогами до періодичності формування, списками розсилки. Ці вимоги можуть бути забезпечені тільки використанням системи побудови звітів разом з OLAP.


Іншим важливим моментом є те, що часто підприємства складають об’ємні звіти з високим ступенем деталізації. Такі звіти користувачі часто можуть більш ефективно будувати без застосування багатовимірних структур, тому що час відгуку багатовимірних систем зазвичай лінійно залежить від кількості повертаються осередків. OLAP ефективна на запитах, які повертають підсумкові дані, отримання яких традиційними методами вимагає великого обсягу обчислень.


Багато користувачів також помилково вважають, що для отримання бажаного результату досить просто підключити OLAP до обліковій системі. Інша формулювання того ж помилки: “OLAP консолідує дані різних облікових систем”. Багатовимірна база дійсно зазвичай містить консолідовані з різних облікових систем дані. Однак, незважаючи на те, що OLAP-продукти зазвичай мають можливості підключення до різних облікових систем, в більшості випадків завдання консолідації вирішується на рівні сховища даних. В процесі поповнення сховища даними з облікових систем вирішуються і такі завдання, як очищення даних, відображення даних облікових систем в єдине довідкове простір підприємства і т.п.


Спроба “заощадити” на створення сховища при впровадженні OLAP часто призводить до специфічних проблем. Спосіб побудови OLAP безпосередньо на таблицях облікової системи призводить до ускладнення процесу проектування багатовимірної бази, характеризується збільшенням навантаження на базу облікової системи і майже не застосуємо при наявності декількох облікових систем.


Тенденції розвитку OLAP


Зростання популярності OLAP призводить до подальшого розширення сфери її застосування. Якщо раніше OLAP позиціонувалася в основному як інструмент вирішення стратегічних питань і була призначена швидше для менеджерів вищої ланки, то зараз OLAP-технології все частіше застосовуються рядовими користувачами для вирішення повсякденних завдань підприємства. Іншими словами, OLAP стає звичайним робочим інструментом менеджерів усіх рівнів підприємства.


Спроба “заощадити” на створення сховища при впровадженні OLAP часто призводить до специфічних проблем


Проблема різнорідності і неузгодженості даних у різних облікових базах є серйозною проблемою багатьох організацій. При цьому користувач часто не може не тільки проаналізувати дані, розкидані за різними джерелами, а й навіть отримати їх, оскільки структура оперативних баз часто далеко не прозора. Найбільш перспективним напрямком у вирішенні цієї проблеми стала концепція створення єдиної інформаційної моделі підприємства. Ця модель надає доступ до інформації підприємства, структурованої і представленої у зрозумілих термінах бізнесу. При цьому користувачеві немає необхідності знати принципи організації первинних даних.


Можливості технології OLAP по швидкому розрахунку складних величин дозволили перейти до технології візуального відображення для користувача найбільш важливих бізнес-показників, які називаються ключовими показниками ефективності KPI (Key Performance Indicator). Завдяки KPI можна оперативно оцінювати, в яких аспектах робота компанії відповідає стратегічним цілям, а що викликає тривогу і потребує додаткової уваги. Також KPI відображає тенденції зміни показників ефективності.


Спектр вирішуваних за допомогою OLAP-задач постійно розширюється, і багатьом здається недостатнім наявність даних “на початок дня”. Це визначає високий інтерес до розробок, що зменшує запізнювання інформації. В даний час використовується ряд методик, що підвищують актуальність даних, наприклад, завантаження тільки змін (incremental processing), побудова OLAP-кубів безпосередньо на таблицях оперативної бази (ROLAP), сегментування даних.


Швидкий час реакції OLAP-систем на запити є одним з найважливіших переваг даної технології, проте сучасні користувачі, звиклі за секунду знаходити в пошукових системах відповіді на будь-які питання, часто не розуміють, чому тут вони повинні чекати довше. Зараз у якості прийнятного часу реакції OLAP все частіше називають 1 секунду, і багато виробників OLAP продуктів приймають цей виклик.


На даний момент технологія OLAP займає впевнене місце в сучасному бізнесі. Еe застосування дозволяє оперативно реагувати на мінливі умови, приймати правильні рішення і ефективно використовувати час співробітників.

Вадим Ляхін: тенденції пов’язані з прагненням надати все більшу функціональність кінцевому користувачеві аналітичної системи


Фахівець відділу розробки ПЗ компанії “Інталев” Вадим Ляхін


CNews: Які тенденції в розвитку СУБД в галузі аналізу даних ви відзначаєте сьогодні?


Вадим Ляхін: Думаю, можна виділити два роду тенденцій – кількісні та якісні. До кількісних я б відніс прагнення розробників зменшити до мінімуму час відгуку системи і разом з тим підвищити оперативність з якою в аналітичну систему потрапляють дані.


Якісні тенденції пов’язані з прагненням надати все більшу функціональність і гнучкість кінцевому користувачеві аналітичної системи. До проявів цієї тенденції можна, наприклад, віднести намір Microsoft включити в нові версії Excel таку OLAP-функціональність як внесення даних в куби (зворотній запис) і засоби Data Mining. Природно, що поява подібних можливостей зробить затребуваною їх підтримку з боку розробників працюють в області розробки засобів аналізу даних.


Як ви ставитеся до протистояння стандартів SQL і MDX в області розробки OLAP? Який стандарт вам здається більш перспективним?


Вадим Ляхін: SQL – Це старий і, можна сказати, заслужений мову роботи з базами даних. Він не орієнтований на яку б то не було зумовлену структуру даних і взаємозв’язок цих даних. Таблиці можуть бути організовані безліччю образів, що визначаються розробниками. MDX, навпаки, передбачає чітко структуровану інформацію – є куб, що містить деякі факти, у цього куба є логічно рівноправні вимірювання, описують в яких розрізах нам потрібна інформація, кожен вимір впорядковано і проагрегіровано по важливим для аналізу ознаками. Ця чітка структура дозволяє використовувати велику кількість функцій, недоступних в SQL.


Тому, на мою думку, для цілей побудови універсальних засобів аналізу, що дозволяють аналітику легко, в єдиному інтерфейсі аналізувати факти по довільним набором ознак більш перспективний стандарт MDX.


Які основні особливості програмних продуктів “ІНТАЛЄВ”? Чим вони відрізняються від інших подібних розробок?


Вадим Ляхін: Компанія “ІНТАЛЄВ” розробила продукт “ІНТАЛЄВ Корпоративна аналітика”, який на сьогоднішній день є унікальним по багатьом своїм характеристикам.


Продукт реалізований відповідно до концепції “нульового адміністрування”, тобто дозволяє, не виробляючи спеціальних налаштувань, отримати за обліковою базі “Корпоративних фінансів” на платформі 1С 8.1 аналітичну базу з кубом показників (фактично налаштованих звітів) і кубами проводок для довільного аналізу.


Більш ніж в 10 разів забезпечується збільшення швидкості отримання звітності, завдяки високопродуктивної архітектура на базі технології Microsoft Account Intelligence.


Аналітики можуть працювати з кубами або через Excel, І в цьому випадку їм не обов’язково знання облікової програми, або в середовищі 1С, в яку вбудований OLAP – клієнт.


Прискорюється робота в базі 1С, зменшуються взаємоблокування, оскільки користувачі отримують звіти з OLAP-бази.


У новій версії продукту з’явиться можливість будувати “гібридні” звіти, що дозволяють об’єднати гнучкість в налаштуванні звітності в 1С та швидкість отримання підсумків OLAP.


Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*