ERwin на службі у банків, CASE-засоби (моделювання), Програмування, статті

“ERwin настільки простий, що нового фахівця можна
навчити йому за день-другий, і настільки багатофункціональний, що
відповідає нашим найвищим потребам “.
Л. Хенде, Pricewaterhouse Coopers


Проектування сховищ даних

У Древній Греції тодішні банкіри давали звіт на площі в присутності всіх громадян, а потім цифри вибивалися на камені. Уявіть собі, скільки каменів було б потрібно для ведення записів сучасним банкам! Сьогодні для зберігання та обробки інформації в банківському бізнесі застосовуються передові досягнення в області IT-технологій – сховища даних, OLAP, B2B. У цій статті ми розглянемо процес створення та використання сховищ даних за допомогою засобу ERwin компанії Computer Associates.


Що таке Data Warehouse?

Сховище даних (Data Warehouse) – це окрема база даних, в якій акумулюється вся найрізноманітніша інформація, необхідна менеджерам банку для підготовки управлінських рішень: про клієнтів банку, операційних днями філій, кредитах, процентних ставках, курсах валют і т. д. При цьому сховищі оснащено інструментами для швидкої і нескладної настройки на нові види даних, тобто воно може безперервно розвиватися.

З метою економії часу керівників будь запитана інформація надається дуже швидко. Для цього в сховищі містяться заздалегідь обчислені показники, наприклад обороти балансових рахунків за день, квартал, рік.

Величезні обсяги даних сховища легко використовувати за рахунок того, що в сховище спочатку вбудовані зручні інструменти пошуку інформації, засоби оперативного аналізу (OLAP) і генератори звітів. Сховище забезпечено потужною системою завантаження даних з різних джерел, при цьому в процесі завантаження відбувається автоматичне узгодження та очищення даних від помилок.

З досвіду створення сховищ даних

До необхідності створення сховищ даних російські банки прийшли вже давно. Як правило, сховища даних оперують з величезними обсягами інформації, що пред’являє до їх проектування та реалізації підвищені вимоги. Вибір в якості платформи сховища даних такої високопродуктивної РСУБД дозволяє істотно підвищити загальну ефективність створюваної інформаційної системи. Для цих цілей використовуються потужні інструменти графічного проектування інформаційних систем – так звані CASE-засоби (CASE розшифровується як Computer Aided System Engineering), наприклад ERwin компанії Computer Associates.

У створенні сховищ даних ERwin стає незамінним інструментом, оскільки, з одного боку, ефективно підтримує на фізичному рівні проектування об’єктів РСУБД, з іншого боку, має спеціалізовані засоби моделювання сховищ даних. Нижче розглядаються основні можливості ERwin з проектування сховищ даних.

До проектування сховищ даних звичайно ставляться такі вимоги:

Саме виконання цих вимог відрізняє структуру сховищ даних від структури реляційних СУБД і сховищ даних. Нормалізація даних в реляційних СУБД призводить до створення безлічі пов’язаних між собою таблиць. В результаті виконання складних запитів неминуче тягне за собою об’єднання багатьох таблиць, що істотно збільшує час відгуку. Проектування сховища даних передбачає створення денормалізованной структури даних (допускається надмірність даних і можливість виникнення аномалій при маніпулюванні даними), орієнтованої в першу чергу на високу продуктивність при виконання аналітичних запитів. Нормалізація робить модель сховища занадто складною, ускладнює її розуміння і погіршує ефективність виконання запиту.

Як працює ERwin?

Розмірна (Dimensional) модель. Для ефективного проектування сховищ даних ERwin використовує розмірну модель. Розмірна модель – це методологія проектування, спеціально призначена для розробки сховищ даних. Найбільш простий спосіб перейти до нотації розмірної моделі при створенні нової моделі (меню File / New) в діалозі ERwin Teamplate Selection – вибрати зі списку пропонованих шаблонів DIMENSION. В шаблоні DIMENSION зроблені всі необхідні для підтримки нотації розмірного моделювання настройки, які, втім, можна встановити вручну.

Моделювання Dimensional схоже з моделюванням зв’язків і сутностей для реляційної моделі, але відрізняється цілями. Реляційна модель акцентується на цілісності та ефективності введення даних. Розмірна модель орієнтована в першу чергу на виконання складних запитів до БД.

Роль таблиці в схемі (Dimensional Modeling Role). За замовчуванням ERwin автоматично но визначає роль таблиці на підставі створених зв’язків. Таблиця без зв’язків визначається як таблиця розмірності, таблиця факту не може бути батьківського в зв’язку, таблиця розмірності може бути батьківського по відношенню до таблиці факту, консольна таблиця може бути батьківського по відношенню до таблиці розмірності.

Правила зберігання даних (Data Warehouse Rules). Для кожної таблиці можна задати шість типів правил роботи з даними: оновлення (Refresh), додаток (Append), резервне копіювання (Backup), відновлення (Recovery), архівування (Archiving) і очистка (Purge). Для завдання правила слід вибрати ім’я правила з відповідного списку вибору. Кожне правило має бути попередньо описано в діалозі Data Warehouse Rule Editor. Для кожного правила повинне бути задано ім’я, тип, визначення. Наприклад, визначення правила доповнення даних може включати частоту і час доповнення (щоденно, в кінці робочого дня), тривалість операції і т. д. Зв’язати правила з певною таблицею можна за допомогою діалогу Table Editor.

При проектуванні сховища даних важливо визначити джерело даних (для кожної колонки), метод, яким вихідні дані витягуються, перетворюються і фільтруються, перш ніж вони імпортуються в сховище даних. Сховище даних може об’єднувати інформацію з текстових файлів і багатьох баз даних, як реляційних (у тому числі інших БД на платформі Informix), так і нереляційних, в єдину систему підтримки прийняття рішень. Щоб підтримувати регулярні оновлення та перевірки якості даних, необхідно знати джерело для кожної колонки в сховище даних. Для документування інформації про джерела даних використовується редактор Data Warehouse Source Editor.

Підсумок

Як ми бачимо, ERwin є дійсно простим, а також надійним і гнучким засобом проектування сховищ даних для банківської діяльності.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*