Цілісність даних

Функції забезпечення цілісності даних в службі аналізу вирішують проблеми неузгодженості, які в іншому випадку могли б викликати неточне уявлення даних Служба аналізу розглядає цю неузгодженість у двох аспектах

■ Обробка порожніх значень Коли в джерелі даних зустрічаються порожні значення, чи повинні вони інтерпретуватися як нулі або залишитися порожніми значеннями

■ Помилки ключів Коли ключі відсутні, дублюються або яким-небудь іншим чином не забезпечують відображення між таблицями Наприклад, як інтерпретувати ідентифікатор клієнта, що зустрічається в таблиці фактів, якщо не існує відповідного елемента у вимірі клієнтів

Базування традиційних сховищ даних на кубах дозволяє мінімізувати проблеми цілісності даних, оскільки практично всі вони вирішуються під час завантаження сховища

Л Ключовим гідністю OLAP в цілому і моделі UDM зокрема є со-

тасувати інтерпретація даних Налаштування цілісності даних і центрапі-заклику обчислення є прикладами безлічі засобів, за допомогою кото-Рь, х модель UDM уніфікує інтерпретацію даних їх споживачами Вирішуй-Перевірено ті ці питання на етапі проектування сховища даних і / або універсальної моделі вимірювань, і тоді ви зможете отримати дійсно корисний продукт Розглядайте цей етап як будівництво обєкта даних, наповненого прихованої інформацією і відкритими засобами її використання

Обробка порожніх значень

Режим інтерпретації порожніх значень залежить від налаштування параметра NullProcessing конкретного обєкта

У заходи цей параметр є частиною визначення джерела і може приймати кілька значень

■ ZeroOrBlank У числових даних порожні значення перетворюються в нулі, а в символьних – в прогалини

■ Automatic Те ж, що і ZeroOrBlank

■ Error Сервер ініціює помилку і відкидає запис

■ Preserve Зберігає порожні значення без зміни

Для обгрунтованого вибору значення цього параметра найкраще подивитися, як має обчислюватися середнє значення у такого заходу Якщо в усередненні краще використовувати тільки непорожні значення, то краще встановити значення Preserve В іншому випадку значення NullOrZero забезпечить усереднення, що розглядає порожні значення як нульові

У вимірах параметр Null Processing може приймати і додаткове значення

■ UnknownMember Пусте значення інтерпретується як невідомий член

У вимірах параметр Null Processing використовується в декількох контекстах

■ Кожен атрибут NameColumn вимірювання, якщо він визначений, містить параметр NullProcessing як частина визначення джерела Цей параметр використовується, коли при формуванні вимірювання зустрічаються порожні імена стовпців

■ Кожна колекція NameColumns вимірювання містить параметр NullProcessing для кожного свого стовпця Цей параметр використовується, коли при формування вимірювання зустрічаються порожні ключові стовпці

■ Кожна комірка в поданні Dimension Usage, повязана з групою заходів або вимірюванням звичайним відношенням, містить у вкладці Advanced діалогового вікна Measure Group Bindings параметр NullProcessing Цей параметр використовується, коли повязаний стовпець у таблиці фактів виявляється порожнім

У атрибутах вимірювань за умовчанням встановлено значення цього параметра Automatic, що в більшості випадків призводить до створення рядків з пробілами Як правило, краще встановлювати значення UnknownMember, якщо очікується наявність порожніх значень, або Error, в іншому випадку

У відносинах вимірювань використовується за умовчанням значення Automatic на практиці досить небезпечно Якщо у ключовому стовпці зустрілося порожнє значення, то воно буде перетворено в нуль, що може виявитися допустимим ключем в більшості вимірів, в результаті чого цьому члену відповідатимуть порожні записи Оптимальне рішення передбачає присвоєння цьому параметру значення UnknownMember, якщо очікується наявність порожніх значень, або Error, якщо не очікується Як альтернативу можна створити член вимірювання для нульового значення і привласнити йому імя Invalid, що буде відповідати режиму автоматичної обробки порожніх значень

Параметр UnknownMember

Вибір варіанту UnknowMember для параметра NullProcessing або при обробці помилок вимагає конфігурування невідомого члена (Unknown) у відповідному вимірі Коли у вимірі включено використання невідомого члена, він повинен бути доданий в усі атрибути цього виміру Параметр виміру UnknownMember може мати одне з трьох можливих значень

■ None Невідомий член відключений у вимірі, і будь-яка спроба привласнити йому значення завершиться помилкою Це значення прийнято за замовчуванням

■ Visible Невідомий член включений і доступний для запитів

■ Hidden Невідомий член включений, проте безпосередньо не доступний для запитів У той же час рівень вимірювання (All) буде містити внесок невідомого члена, а функція MDX UnknownMember може забезпечити до нього прямий доступ

За замовчуванням невідомий член має імя Unknown його можна змінити, встановивши значення параметра UnknownMemberName вимірювання

Конфігурування помилок

При виникненні помилок цілісності даних і деяких інших параметр ErrorConfiguration визначає, як ці помилки будуть оброблені Спочатку для цього параметра встановлено значення (default), однак якщо його змінити в списку на (custom), то стануть доступні вісім параметрів Параметр ErrorConfiguration присутній в безлічі обєктів, проте зазвичай його встановлюють тільки у вимірах і групах заходів

Параметри конфігурування обробки помилок описані нижче

■ KeyDuplicate Ця подія генерується, коли при побудові вимірювання зустрічаються дублікати ключів За замовчуванням параметр має значення IgnoreError (ігнорувати помилку), однак доступні й інші значення: ReportAndContinue (створити звіт і продовжити) і ReportAndStop (створити звіт і зупинити виконання) Установка параметра в значення IgnoreError призведе до вставки у вимір всіх значень атрибутів при цьому служба аналізу випадковим чином вибере те з них, яке буде асоційоване з ключем Наприклад, якщо таблиця виміру товарів містить два рядки товарів з ідентифікатором 73, один з назвою Apple, а інший – Orange, то і перший і другий зявляться як члени атрибута назви товару, але тільки один з цих атрибутів асоціюватиметься з даним товаром у транзакціях І навпаки, якщо в обох рядках імям буде Apple, то у вимірі імені товарів буде присутній тільки один атрибут Apple, і користувач куба навіть не помітить, що сталося дублювання записів у вихідній таблиці

■ KeyErrorAction Ця подія генерується, коли виникає помилка KeyNot Found, тобто коли в асоційованої таблиці не знайдено ключове значення У групах заходів таке трапляється, коли таблиця фактів містить ключ вимірювання, який не може бути знайдений в таблиці вимірювань Цей параметр може приймати значення ConvertToUnknown (Перетворити в невідомий член прийнято за замовчуванням) і DiscardRecord (відкинути запис)

■ KeyErrorLimit Кількість помилок ключа, допустимих до ініціювання дії, зазначеного в параметрі KeyErrorLimitAction За умовчанням встановлено значення 0 це означає, що дія буде виконано після першої ж помилки ключа Установка значення -1 не обмежує число допустимих помилок

■ KewErrorLimitAction Дія, що ініціюється при перевищенні кількістю помилок ключа значення, заданого в параметрі KeyErrorLimit За замовчуванням обробка припиняється (значення StopProcessing) Можна також використовувати значення StopLogging, при якому обробка продовжується, але реєстрація помилок у журналі припиняється

■ KeyErrorLogFile Файл, в який будуть заноситися помилки ключа

■ KeyNotFound Цей параметр визначає, як помилки відсутності ключа взаємодіють з параметром KeyErrorLimit За замовчуванням використовується значення ReportAndContinue, яке включає ці помилки в загальний підрахунок Значення ReportAndStop дозволяє занести помилку в журнал і негайно завершити обробку, незалежно від настройки параметрів KeyErrorLimit і KeyErrorAction Значення IgnoreError може виявитися корисним, коли очікується наявність безлічі помилок відсутності ключа це допускає відображення на невідомий член, перевіряючи щодо параметра KeyErorLimit тільки інші помилки

■ NullKeyConvertedToUnknown Концепція цього параметра ідентична KeyNotFound,

але всі порожні ключі перетворюються в невідомий член (значенням параметра

NullProcessing має бути UnknownMember) замість генерації помилки KeyNotFound За замовчуванням прийнято значення IgnoreError

■ NullKeyNotAllowed Концепція цього параметра ідентична KeyNotFound, однак порожні ключі не допускаються (параметр NullProcessing приймає значення Error) замість генерації помилки KeyNotFound За замовчуванням прийнято значення ReportAndContinue

Ті ж параметри можна встановити на рівні сервера, щоб визначити значення за замовчуванням Їх можна також визначити для конкретного процесу обробки і для забезпечення особливого підходу до певних даними

Пакети оновлень

Вихід пакетів оновлень SP1 і SP2 вніс деякі корективи в роботу служби аналізу

■ Оптимізовані запити до проекціям стали володіти таким же швидкодією, як і запити до базового кубу цих проекцій

■ Проект AdventureWorks Analysis Services був оновлений Якщо раніше ви вже розгортали його в екземплярі SQL Server, то тепер ви повинні його повторно розгорнути, щоб побачити всі зміни

■ Версія Microsoft Office 2007 вимагає установки SQL Server 2005 Analysis Services SP2 для підтримки всіх своїх функцій бізнес-аналітики Якщо встановити версію служби аналізу без пакету оновлень SP2, то всі кошти Microsoft Office, орієнтовані на цей пакет, будуть відключені

■ Якщо для користувача ієрархія не визначена як природна, на екран виводиться попередження

■ Функції MDX Drilldown мають новий аргумент, що дозволяє задавати проходження тільки заданих кортежів

■ У метод MDX CREATE додано нову властивість SCOPE_ISOLATION Ця властивість дозволяє вирішувати обчислення, певні запитами, в межах сесій перед обчисленням куба, а не після нього

■ Додана підтримка безлічі вкладених таблиць

■ Підвищено продуктивність прогнозів, що використовують наївний байесовский алгоритм, за рахунок кешування часто використовуваних атрибутів

■ Додана обмежена підтримка оглядачів розкриття даних моделями локального розкриття

■ Перерозподіл елементів управління оглядачів розкриття даних тепер залежить від ADOMDNET

Резюме

Будь-яка організація явно або неявно використовує засоби бізнес-аналітики, так як будь-який компанії потрібно маркетингова оцінка відбуваються на ринку Єдиною альтернативою цьому є прийняття рішень на основі інтуїції, а не даних Побудова рішень бізнес-аналітики зазвичай починається з простих запитів до даних OLTP і закінчується мішаниною чисел Служба аналізу є стратегічним центром компанії Microsoft, призначеним для задоволення потреб компаній в бізнес-аналітиці та перетворення безладного нагромадження результатів ручних запитів в цілісну систематизовану структуру підтримки прийняття рішень

Служба аналізу дозволяє створювати швидкі, узгоджені та відповідні для досліджуваної предметної області сховища даних, зручні як з точки зору розробника, так і кінцевого користувача В інших главах цій частині ви можете дізнатися про завантаження і аналізі даних бізнес-аналітики, виконанні запитів до них, а також про складання аналітичних звітів

Джерело: Нільсен, Пол Microsoft SQL Server 2005 Біблія користувача : Пер з англ – М: ООО ІД Вільямс , 2008 – 1232 с : Ил – Парал тит англ

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*