Інтеграція OLAP

Розкриття даних в якості вхідних даних може використовувати куб, а не реляційні таблиці (див першу сторінку майстра розкриття даних) У цьому випадку режим роботи, на відміну від режиму роботи реляційних даних, має кілька суттєвих відмінностей

■ Незважаючи на те що таблиці можуть включатися з безлічі різних джерел даних, куб і структура розкриття, яка на нього посилається, мають бути визначені в одному і тому ж проекті

■ Якщо таблиця визначена за допомогою одного виміру і повязаними з ним групами заходів, при необхідності використання додаткових атрибутів розкриття даних додавайте їх за допомогою вкладених таблиць

■ При виборі ключів структури розкриття для реляційної таблиці зазвичай вибирають первинний ключ Намагайтеся вибирати ключі структури розкриття з якомога більш високого рівня даних вимірювання, що володіє найменшою гранулярністю Наприклад, при формуванні квартального прогнозу слід в якості ключового атрибута часу вибирати саме квартал, а не ключовий стовпець часового виміру (яким, найімовірніше, виявиться день або годину)

■ Значення за замовчуванням типу даних і вмісту для куба даних мають тенденцію бути менш достовірними, так що перевіряйте і в міру необхідності корегуйте параметри типу

■ Деякі атрибути вимірювання, засновані на датах або числах, можуть зявитися в інтерфейсі розкриття даних з текстовим типом Для того щоб зрозуміти причину такого режиму роботи, потрібно заглянути в теорію Справа в тому, що коли створюється уявлення, потрібно визначення параметра стовпця Key При необхідності може бути визначений і параметр Name, в якому ключовим значенням присвоюються імена, більш зрозумілі для кінцевого користувача (наприклад, значення June 2005 буде більш зрозумілим, ніж 2005-06-01Т0 0: 0 0: 0 0) Водночас розкриття даних буде використовувати дані з типом Name замість типу Key, що в результаті досить часто призводить до появи в структурі розкриття несподіваних текстових типів даних Іноді текстові дані добре справляються з роботою, проте в інших випадках (особливо це стосується атрибутів типів Key Time і Key Sequence) це може зробити неможливим створення структури розкриття або призвести до її некоректної роботи після створення

Вирішення цієї проблеми вимагає або видалення з атрибуту вимірювання параметра стовпця Name, або додавання в вимір копії стовпця, в якому вже буде відсутня параметр Name Якщо буде потрібно друга копія атрибуту, то його можна помітити як невидимий, щоб не заплутати кінцевого користувача

■ Фрагмент даних куба, який буде використовуватися для навчання, визначається за допомогою зрізу куба структури розкриття Скорегуйте цей зріз, щоб виключити стани, які не варто використовувати при навчанні (наприклад, товари з Перебійного поставками та майбутні періоди часу) Подумайте також про резервування частини даних для виконання оцінки моделі (наприклад, навчання можна виконувати на перших вісімнадцяти з останніх двадцяти чотирьох місяців, заключні ж шість місяців залишити для порівняння прогнозованих і фактичних значень)

■ Лінійний графік не може використовуватися для тестових даних куба Таким чином, оцінка моделі вимагає або тестування даних на базі реляційної таблиці, або використання деякої стратегії, яка не покладається на подання Mining Accuracy Chart

Використання куба як джерело даних розкриття може виявитися досить ефективним, відкриваючи доступ до великих масивів даних в процесі навчання і тестування та забезпечуючи можливості створення вимірювання або навіть цілого куба, заснованого на навченою моделі

Резюме

Розкриття даних дозволяє проаналізувати дані набагато глибше, ніж це можна зробити засобами звітності, а служба аналізу раціоналізує весь процес Незважаючи на те що дані потрібно попередньо підготовляти, моделі розкриття приховують статистичні та алгоритмічні деталі процесу, даючи користувачеві можливість сфокусуватися виключно на аналізі та інтерпретації інформації

Крім того, навчені моделі можуть використовуватися в додатках для розподілу критичних ресурсів, прогнозування трендів, ідентифікації сумнівних даних і безлічі інших цілей

Джерело: Нільсен, Пол Microsoft SQL Server 2005 Біблія користувача : Пер з англ – М: ООО ІД Вільямс , 2008 – 1232 с : Ил – Парал тит англ

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*