Використання компонентів Data Mining в продуктах Office 2007. Частина 3, Інтеграція додатків і даних, Бази даних, статті

Клієнт Data Mining для Excel


Клієнт Data Mining для Excel дозволить вам провести повний цикл інтелектуального аналізу даних за допомогою клієнта Excel з використанням даних електронних таблиць або зовнішнього джерела, доступного базі даних Analysis Services.


Якщо ви встановили клієнт для Data Mining, ви побачите панель інструментів Data Mining:



Рисунок 9 Панель інструментів клієнта Data Mining для Excel 2007.
 

Організація зліва направо і групування кнопок на панелі інструментів відображає типовий порядок виконання завдань в проекті аналізу даних. Кожна секція докладно описана нижче.


Підготовка даних

Завдання вибору правильних атрибутів з джерела даних і подання їх в правильному форматі займає високий відсоток часу в процесі побудови аналітичних моделей. Ця секція надає інструменти для основних завдань підготовки даних до початку їх поглибленого аналізу.



  1. Дослідження даних – служить для побудови графіка розподілу дискретних і безперервних змінних, а також для додавання угруповань у вихідні дані.
  2. Очищення даних – служить для видалення викидів і для зміни значень міток дискретних даних (наприклад, якщо вихідні дані містять значення “M” і “F” в колонці статі, а ви віддаєте перевагу бачити ці значення як “чоловічий” і “жіночий” для ясності презентації результатів).
  3. Секціонування даних – служить для розбиття вихідних даних на навчальне і тестове безліч допомогою випадкових вибірок вихідних даних.

Нижче наведено знімок екрана, що зображає як ви можете видалити значення нижче заданого значення:



Рисунок 10 Очищення даних.

Побудова моделей

Ця секція призначена для створення й обробки моделей аналізу даних. Вона надає майстри, які допомагають вам побудувати поширені типи моделей Data Mining без необхідності розбиратися у відповідних алгоритмах і пов’язаних з ними параметрів, які виконуються на сервері. Також, в цій секції є можливості, що дозволяють користувачеві вибрати конкретний алгоритм та налаштувати додаткові параметри.

Нижче наведена сторінка з майстри асоціативних правил, що служить для знаходження асоціацій в транзакційних даних:



Рисунок 11 Майстер асоціативних правил.

Точність і перевірки

Ця секція містить виклик графіків для валідації і тестування точності моделей аналізу даних.



  1. Графік точності – графік точності результатів моделі в порівнянні з тестовими даними, представляється у вигляді діаграм росту (lift chart) для моделей класифікації або у вигляді діаграм розсіювання (scatter plot) для регресійних моделей.
  2. Класифікаційна матриця – таблиця правильних і неправильних результатів класифікації на підставі відомих результатів тестових даних.
  3. Діаграма прибутку – графічне моделювання прибутку для запланованих кампаній на основі заданих користувачем параметрів витрат.

Нижче наведено графік точності, сформований клієнтом аналізу даних в Excel, що зображає типову модель, точність прогнозу якої знаходиться між випадковим вибором і ідеальною моделлю:



Рисунок 12 графік точності, сформований клієнтом аналізу даних в Excel 2007.
 
Читати частина 4
 

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*