Створення бази даних – ЧАСТИНА 5

Хороша організація вимірювань є ключем до успіху інтерактивних програм, оскільки більшість користувачів може просто накрити з головою хвиля доступних атрибутів Виняток невикористовуваних атрибутів не тільки допоможе спростити перегляд користувачем даних, а й значно підвищить продуктивність Особливо це стосується кубів з фактичними обчисленнями, оскільки, чим більше атрибутів, тим більшу число осередків повинно розглядати кожне обчислення

Список перевірки установок

Після створення основного вимірювання за допомогою майстра кубів або майстра вимірювань виконайте запропоновані в наступному списку першочергові перевірки Такий рівень уваги адекватний важливості обставин

■ Переконайтеся, що імена атрибутів зрозумілі і недвозначні в контексті всіх вимірювань моделі Якщо виникне потреба внести зміни, змініть імена в поданні джерела даних і регенерують вимір, щоб зберегти цілісність у масштабах моделі Як альтернатива можете змінити імена атрибутів і рівні користувацьких ієрархій безпосередньо

■ Передивіться всі користувальницькі ієрархії, створені майстром, і при необхідності скоректуйте рівні Додайте відсутні ієрархії Замініть імена, присвоєні за замовчуванням, смисловими альтернативами

■ Видаліть непотрібні атрибути та скоректуйте область їх видимості

■ Скорегуйте взаємозвязок атрибутів, щоб вона відповідала даним, що містяться в них

■ Передивіться всі джерела атрибутів (параметри KeyColumns і NameColumn) і впорядкування Для перегляду результатів частіше використовуйте уявлення браузера

■ Організуйте вимірювання з масою ієрархій в папки

Зміна даних у вимірах

Правильна обробка змін у даних вимірювань може являти собою досить складну задачу, і тут важливу роль відіграє ставлення компанії до відстеження історичних даних Наприклад, якщо співробітник змінив прізвище, чи важливо знати попереднє і сьогодення значення відповідного атрибута А як чинити з зміненим адресою клієнта А зі зміною кредитної ставки

Служба аналізу самовіддано відображає зміни, внесені до дані таблиць вимірювань при обробці вимірювання Вона не має можливості самостійно відслідковувати ис-

торію змін вимірювань – все має виконуватися на рівні вихідних таблиць Для відстежування історії таблиць вимірів зазвичай використовують чотири стандартних сценарію

■ Slowly Changing Dimension Type 1 Історія не відстежується, тому зміни застосовуються до виміру, поширюючись на весь часовий діапазон Наприклад, коли кредитний рейтинг клієнта падає з хорошого до поганого, немає ніякої можливості дізнатися, коли ця зміна відбулася і, взагалі, чи мав клієнт небудь інший рейтинг У цьому режимі відстеження складно пояснити, чому в минулому кварталі товар відпускався клієнту без передоплати У той же час цього простого підходу цілком достатньо для багатьох вимірів При реалізації бази даних служби аналізу на даних OLTP, а не сховища даних, це єдино можливий варіант, оскільки бази даних OLTP рідко відстежують історичні відомості

■ Slowly Changing Dimension Type 2 Кожна зміна в даних джерела відстежується як історія за допомогою додаткових рядків у таблиці вимірювання Наприклад, коли імя замовника вперше зявляється в таблиці OLTP, в таблицю вимірювання для нього вводиться рядок і відповідні рядки фактів звязуються з нею Пізніше, коли інформація про клієнта змінюється в початковій таблиці, існуюча рядок даного клієнта в таблиці вимірювання позначається як застаріла при цьому створюється новий рядок з новими даними атрибутів З цією новим рядком будуть асоційовані всі наступні рядки таблиці фактів, що мають відношення до даного клієнта

■ Slowly Changing Dimension Type 3 Комбінує концепції перших двох типів Відстежується історія деяких, але не всіх змін, заснована на заданих правилах бізнес-логіки Наприклад, підвищення посади співробітника в межах одного підрозділу може розцінюватися як зміна типу 1 (тільки оновлення), а його переклад в інший підрозділ – як тип 2 (вставка нового рядка виміру)

■ Rapidly Changimg Dimension Може статися так, що якийсь атрибут (або їх група) змінюється настільки часто, що другого підходу доводиться генерувати в таблиці вимірювання занадто багато рядків Такі атрибути часто повязані зі станом і пріоритетами Даний підхід передбачає висновок стрімко мінливого атрибута в окремий вимір, безпосередньо повязане з таблицею фактів Таким чином, замість відстеження змін в додаткових рядках таблиці вимірювання таблиця фактів в кожному рядку буде містити відповідне стан або пріоритет

Незважаючи на те що управління змінами вимірювань повинно здійснюватися на рівні сховища даних, майстер вимірів може допомогти в створенні вимірювання, що підтримує функціональність типу 2 Створіть вимір без використання джерела даних, а потім визначте, що воно буде мінливих Після цього майстер займеться конфігурацією стовпців, які будуть використані за підтримки історичних даних

■ Первинний ключ конфігурується як стовпець ідентичності (іноді званий сурогатним ключем) Він використовуватиметься для зворотного звязку з таблицею фактів

■ Стовпець Original_ID, іноді званий альтернативним ключем, зазвичай є первинним ключем джерела даних Наприклад, це може бути табельний номер співробітника або ідентифікатор клієнта в початковій таблиці OLTP

■ Стовпець Start_Date вказує на дату початку дії рядки вимірювання

■ Стовпець End_Date вказує на дату кінця дії рядки вимірювання

■ Стовпець State вказує на активне чи неактивний стан рядка

Згенерована майстром схема припускає, що дата кінця дії поточного рядка встановлюється в 31 грудня 9999, так що стовпець стану, сформований як обчислюваний, програмується наступним чином: case when [Customer_SCD_End_Date] = 12 / 31/9999 then Active else Inactive1 end

Після того як вимірювання буде налаштоване майстром, додайте в нього додаткові необхідні атрибути, а потім клацніть на посиланні панелі Data Source View вимірювання для генерації відповідної схеми

За межами звичайних вимірювань

Концепція вимірювання, описувана досі, стосувалася в основному загальної функціональності, характерною для більшості типів вимірювань У той же час не було дано пояснень самому поняттю тип вимірювання. Деякі першоджерела підрозділяють вимірювання на два типи: стандартні і розкриття даних Ці загальні типи увібрали в себе всі інші Кожен вимір має параметр типу, якому призначаються такі значення як Time, Geography, Customer, Accounts або Regular, які відповідають тому, що не міститься в списку Інші характеристики вимірювання, такі як структура відносин батьківських і дочірніх обєктів, дозвіл запису або посилань на вимірювання з інших баз даних, також можна розглядати як визначники різних типів вимірювань

Відразу відзначимо, що в цій главі ми обмежимося розглядом тільки стандартних вимірювань і будемо розглядати поняття тип тільки в контексті властивостей вимірювання Водночас, читаючи інші першоджерела, важливо розуміти, наскільки всеохоплюючим є поняття типу вимірювання

Часовий вимір

Практично кожен куб потребує в часовому вимірі, проте в більшості екс-пуатіруемих кубів цей вимір реалізовано з рук геть погано На щастя, майстер вимірювань автоматично створює тимчасове вимір і відповідну йому таблицю, а також заповнює цю таблицю даними Клацніть правою кнопкою миші на папці вимірювання на панелі Solution Explorer і виберіть у контекстному меню пункт New Dimension На сторінках відкрився майстра слід виконати наступні дії

■ Select Build Method На цій сторінці виберіть метод побудови Build the dimension without using a data source, встановіть прапорець Use a Dimension Template і виберіть Time зі списку шаблонів

■ Define Time Periods Виберіть діапазон дат і періоди, які повинні використовуватися в вимірі

■ Select Categories На додаток до стандартного календарем виберіть і налаштуйте інші календарі, які повинні бути впроваджені у вимір

■ Completing the Wizard При необхідності змініть імя вимірювання, при цьому не встановлюйте прапорець Generate schema now

Проаналізуйте створену майстром структуру вимірювання Зверніть увагу на те, що для параметра вимірювання Туре встановлено значення Time і всі атрибути також мають відповідний часовий тип: дні, місяці, квартали і тп Виконайте описані в попередньому розділі необхідні перевірки і підстроювання вимірювання, коригуючи їх у міру необхідності Параметри KeyColumns і NameColumn в даному випадку не вимагають пильної уваги, в той же час імена, присвоєні елементам ієрархій, слід адаптувати для цільової аудиторії Взаємозвязки атрибутів також вимагатимуть настройки Після виконання всіх налаштувань клацніть на посиланні на панелі Data Source View, щоб створити таблицю часового виміру, задавши для неї відповідне імя і місце розміщення

Джерело: Нільсен, Пол Microsoft SQL Server 2005 Біблія користувача : Пер з англ – М: ООО ІД Вільямс , 2008 – 1232 с : Ил – Парал тит англ

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*