Використання компонентів Data Mining в продуктах Office 2007. Частина 1, Інтеграція додатків і даних, Бази даних, статті

Додаткові компоненти MS Office 2007 для інтелектуального аналізу даних на платформі SQL Server 2005 Analysis Services призначені для виявлення прихованих шаблонів і взаємозв’язків у даних для поліпшення якості та глибини їх аналізу. Для використання цих компонент ви повинні мати можливість підключатися до бази даних SQL Server 2005 Analysis Services. Однак, досвід роботи з компонентами SQL Server 2005 Analysis Services не обов’язковий.


Додаткові компоненти MS Office 2007 для інтелектуального аналізу даних доступні для безкоштовного завантаження і складаються з наступних компонент:



Далі в цій статті ми надамо оглядову інформацію з системним вимогам, процесу установки і функціональності додаткових компонент.


Підготовка до роботи


Перед початком роботи ви повинні переконатися в установці таких компонент:



  1. Microsoft .NET Framework 2.0 – Компоненти Data Mining для Office побудовані на платформі. NET Framework 2.0 і вимагають підтримки програмування під Office 2007 для. NET.
  2. Microsoft Office 2007 – Необхідно встановити Excel 2007 для роботи із засобами аналізу табличних даних і клієнтських компонент для Data Mining. Слід встановити Visio Professional 2007 для роботи з шаблонами Data Mining для Visio. Установка повинна включати опцію програмування під. NET (. NET Programmability Support).
  3. Додаткові компоненти MS Office 2007 для інтелектуального аналізу даних – Установка здійснюється завантаженням і запуском дистрибутива. На сторінці завантаження містяться посилання на сторінки завантаження обов’язкових компонент, необхідних для роботи системи.
  4. Засоби з’єднання з SQL Server 2005 Analysis Services – Робота з моделями Data Mining за допомогою програми MS Office вимагає зв’язку з сервером SQL Server 2005 Analysis Services. Він може знаходитися як на локальній машині, так і на віддаленому сервері, до якого у вас повинен бути доступ. У будь-якому випадку, сервер Analysis Services повинен бути правильно налаштований для підтримки компонент Data Mining для Office. Установка компонент містить майстер Getting Started, призначений для установки з’єднання та конфігурації сервера Analysis Services.

Після установки і конфігурування всіх необхідних додатків ми можемо далі досліджувати функціональність компонент Data Mining для Office.


Засоби аналізу табличних даних для Excel


Цей компонент надає можливість проведення поглибленого аналізу табличних даних з MS Excel. Незважаючи на той факт, що для виконання аналізу використовується вся міць алгоритмів Data Mining, реалізованих в Analysis Services 2005, кінцевому користувачеві Excel не потрібно знати всіх тонкощів роботи з Analysis Services і відповідних алгоритмів.


Так як ця компонента є засобом табличного аналізу, вам необхідно знати, як створити або конвертувати існуючу таблицю в таблицю Excel. Для отримання більш докладної інформації завантажте відео-приклад, що висвітлює роботу із засобами аналізу табличних даних.


Якщо після установки засоби аналізу табличних даних ви клацніть мишкою в будь-якому місці всередині таблиці Excel, ви побачите наступну панель інструментів під пунктом меню “Табличні Дані” – Table Tools:



Рисунок 1 Засоби аналізу табличних даних для Excel 2007.

Кожен інструмент на цій панелі викликає простий інтерфейс для виконання однієї з аналітичних завдань і формування зрозумілого звіту, що дозволяє отримати більш глибоке розуміння наявних даних:



Рисунок 2 Приклад інтерфейсу для виконання однієї з аналітичних завдань.

Давайте подивимося на кожен інструмент на панелі управління коштами для аналізу табличних даних.


Аналіз ключових факторів

Цей інструмент робить аналіз вхідних факторів у даних, які мають найбільший вплив на певний вихідний атрибут. Наприклад, якщо у вас є список всіх клієнтів, аналіз ключових факторів може проаналізувати чинники, які є ключовими для визначення того який з клієнтів витратить найбільшу суму грошей на ваші товари або послуги.

Задача визначення, які поля в таблиці є вирішальними, не є очевидною. Наприклад, поле, яке представляє річний дохід клієнта може бути не самим значимим фактором, що виділяють клієнтів, що укладають з вами найбільші угоди. Важливими можуть бути зовсім інші чинники, такі як число дітей, географічне положення або комбінація цих чинників.

Нижче наведено приклад результату аналізу, виконаного цим інструментом:





Рисунок 3 Приклад результату аналізу.Виділення категорій


Інструмент Detect Categories (виділення категорій) визначає рядки в табличних даних, що мають схожі значення характеристик, і об’єднує їх в однакові категорії.


Кожна виділена категорія описується набором характеристик входять до неї рядків. Ці характеристики відрізняються для різних категорій. Грунтуючись на цих характеристиках, ви можете дати категоріям більш зрозуміле найменування. Наприклад, категорія, яка містить клієнтів у віці 45-60 років з доходами понад 100 000, може бути перейменована в “успішних представників повоєнного покоління”. Розбиття даних в категорії дозволяє швидко ідентифікувати природні угруповання в ваших даних, що може бути використано, наприклад, для формування адресної маркетингової кампанії.


Цей інструмент також дозволяє позначати кожен рядок у вихідній таблиці назвою містить її категорії.




Рисунок 4 Інструмент Detect Categories (виділення категорій).
 
Читати частина 2

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*