Дослідження моделей, Комерція, Різне, статті

Після того як моделі оброблені, ви можете переглянути їх, використовуючи закладку Mining Model Viewer в редакторі Data Mining. За допомогою списку, що випадає Mining Model у верхній частині закладки можна досліджувати моделі, що входять в структуру.


Модель Microsoft Decision Trees

Mining Model Viewer за замовчуванням відкриває модель Targeted Mailing першою в структурі. Tree viewer містить дві закладки, Decision Tree (Дерево рішень) і Dependency Network (Мережа залежностей).


Decision Tree (Дерево рішень)

На сторінці Decision Tree ви можете переглянути всі моделі дерев, що складають модель Targeted_Mailing. Для кожного прогнозованого атрибута моделі існує одне дерево, якщо тільки не задіяно feature selection. Так як ваша модель містить всього один прогнозований атрибут, Bike Buyer, то і дерево теж одне. Якби їх було кілька, можна було б вибрати потрібне за допомогою Tree box.


Tree viewer за замовчуванням показує тільки перші три рівні дерева. Щоб побачити більше використовуйте Show Level slider або Default Expansion box. Для більш детальної інформації по налаштуванню Tree viewer, зверніться до розділу “Viewing with Tree Viewer” в SQL Server Books Online.


Щоб створити дерево, показане на малюнку 6

  1. Встановіть Show Level 5
  2. У списку Background натисніть 1.
    Тут задається стан прогнозованого атрибута. Змінюючи це властивість, ви можете швидко дізнатися число випадків потрапляння покупця велосипеда в кожен вузол. Чим темніше вузол, тим більше випадків потрапляння він містить.


 
Рисунок 6 Сторінка Decision Tree для моделі Targeted Mailing

Кожен вузол в дереві рішень несе в собі наступну інформацію:



Якщо включений режим drillthrough (“провалювання” в вихідні дані), ви можете переглянути варіанти для вузла, якшо по ньому правою кнопкою миші і вибравши Drillthrough.


Мережа залежностей (Dependency Network)

На сторінці Dependency Network показані відносини між атрибутами, що впливають на прогнозуючу здатність моделі. Мережа залежностей для моделі Targeted Mailing представлена ​​на малюнку 7.


 
Рисунок 7 Сторінка Dependency Network моделі Targeted Mailing.

Центральний вузол на малюнку 7, Bike Buyer, представляє прогнозований атрибут моделі. Кожен з вузлів навколо нього відображає атрибут, що впливає на прогнозований. За допомогою повзунка на лівій стороні сторінки можна вказати силу показуються зв’язків. При переміщенні повзунка вниз будуть показуватися тільки сильні зв’язки.


За легендою квітів внизу вікна можна дізнатися, який вузол є прогнозованим і які вузли його визначають.


Модель Microsoft Clustering

Використовуйте combo box Mining Model для переходу до моделі TM_Clustering. Вікно цієї моделі, Cluster viewer, містить чотири закладки: Cluster Diagram, Cluster Profiles, Cluster Characteristics, і Cluster Discrimination. За замовчуванням при першому відкритті відображається сторінка Cluster Diagram.


Для більш детальної інформації по використанню Cluster viewer, зверніться до розділу “Viewing with Cluster Viewer” в SQL Server Books Online.


Кластерна діаграма (Cluster Diagram)

На сторінці Cluster Diagram ви можете вивчити відносини між кластерами, виявленими алгоритмом. Довжина ліній, що з’єднують кластери, відображає “близькість”, а їх інтенсивність показує, наскільки вони схожі. Колір кластера відповідає за частоту появи змінної і стану (вибрані в полях Shading Variable і State вгорі екрана) у кожному кластері. Мінлива за замовчуванням population, але ви можете поміняти її на будь-яку іншу з моделі і знайти потрібні вам кластери. Використовуючи смугу прокручування в лівій частині екрана, ви можете відфільтрувати слабкі зв’язки і знайти кластери, розташовані найближче до один одного.


Наприклад, встановіть поле Bike Buyer в якості Shading Variable і State в 1. Як показано на малюнку 8, кластер № 5 містить найбільшу кількість покупців велосипедів. А найсильніша зв’язок – між 4 і 7 кластерами.


 
Рисунок 8 Кластерна діаграма моделі TM_Clustering.

Профілі кластерів (Cluster Profiles)

Сторінка Cluster Profiles надає загальний вигляд моделі TM_Clustering. Як показано на малюнку 9, кожному кластеру моделі на цій сторінці відповідає стовпець з описують його даними. У першому стовпчику знаходиться список атрибутів, з якими пов’язаний принаймні один кластер. Всі залишилися стовпці відображають розподіл станів цих атрибутів для кожного кластера. Розподіл дискретної змінної показується кольоровим стовпцем, максимальне число кольорів-станів визначається в поле Bars per histogram. Безперервні значення відображаються diamond діаграмою, що показує середнє і стандартне відхилення в кожному кластері.


 
Рисунок 9 Сторінка Cluster Profiles моделі TM_Clustering.

Характеристики кластерів (Cluster Characteristics)

Сторінка Cluster Characteristics дозволяє більш детально розглянути характеристики кластеру. Для прикладу, на малюнку 10, ви можете бачити, що люди з Кластера № 5 (покупці велосипеда) володіють наступними характеристиками: вони пересуваються на короткі дистанції (0-1 миля), у них немає машини і вони одружені.


 
Рисунок 10 Вікно характеристик кластера моделі TM_Clustering.

Cluster Discrimination

На сторінці Cluster Discrimination ви можете подивитися характеристики, що відрізняють один кластер від іншого. Після вибору кластерів (поля First cluster і Second cluster) система визначає відмінності і показує їх, сортуючи по атрибутам, найбільш сильно відрізняє кластери.


На малюнку 11 наведено порівняння Кластера № 5 і Кластера № 7 моделі TM_Clustering. У кластері № 5 найбільш висока щільність покупців велосипедів, а в № 10, навпаки, найнижча. Видно, наприклад, що люди, що потрапили в Кластер № 10 швидше за все з Північної Америки і молодше (23-31), ніж жителі Європи з Кластера № 5.


 
Малюнок 11 Сторінка Cluster Discrimination моделі TM_Clustering.

Модель Microsoft Na? Ve Bayes

Використовуйте випадаючий список Mining Model для переходу до моделі TM_NaiveBayes. Вікно цієї моделі, Na? Ve Bayes viewer, містить чотири закладки: Dependency Network, Attribute Profiles, Attribute Characteristics, і Attribute Discrimination.


Для більш детальної інформації по використанню Na? Ve Bayes viewer, зверніться до розділу “Viewing with Na? Ve Bayes viewer” в SQL Server Books Online.


Мережа залежностей (Dependency Network)

Сторінка Dependency Network в Na? Ve Bayes viewer організована також як однойменна сторінка в Tree viewer. Кожен вузол представляє атрибут, а лінії, що зв’язують вузли відповідають відносинам. На малюнку 12 показані всі атрибути, що впливають на стан прогнозованого атрибута, Bike Buyer.


 
Малюнок 12 Сторінка Dependency Network для моделі TM_Na? VeBayes.

У міру пересування повзунка вниз, залишаються атрибути, найбільш сильно впливають стовпець Bike Buyer (який є прогнозованим). Діючи таким чином, ви виявите, що найсильнішим чинником, що визначає, купить людина велосипед, є число належних йому машин.


Профілі атрибута (Attribute Profiles)

Сторінка Attribute Profiles описує як різні стани вхідних атрибутів впливають на значення прогнозованого атрибута.


В поле Predictable виберіть Bike Buyer. Атрибути, що впливають на стан прогнозованого атрибута, перераховані разом зі значеннями кожного стану вхідних атрибутів і їх розподілами для кожного стану прогнозованого атрибута.


В поле Predictable виберіть Bike Buyer. Атрибути, що впливають на стан прогнозованого атрибута, перераховані для всіх значень вхідних параметрів спільно з їх розподілом для кожного стану прогнозованого атрибута.


На малюнку 13 показана сторінка Attribute Profiles для стовпця Bike Buyer для моделі TM_NaiveBayes model.


 
Малюнок 13 Сторінка Attribute Profiles для моделі TM_Na? VeBayes.

Характеристики атрибута (Attribute Characteristics)

Використовуючи сторінку Attribute Characteristics, ви можете вибрати атрибут і його значення, щоб побачити, значення яких атрибутів змінюються при цьому в більшій чи меншій мірі.


В поле атрибут виберіть Bike Buyer, в поле значення – 1.


Наприклад, з малюнка 14 видно, що люди, які не мають дітей, купують найбільшу кількість велосипедів.


 
Малюнок 14 Сторінка Attribute Characteristics для моделі TM_Na? VeBayes.

Attribute Discrimination

На сторінці Attribute Discrimination ви можете досліджувати відношення між двома дискретними значеннями вибраного прогнозованого атрибута і значеннями інших атрибутів.


Оскільки модель TM_NaiveBayes має всього два стани, 1 і 0, вам не доведеться робити будь-яких додаткових дій з налаштування вікна.


Наприклад, із малюнка 15 видно, що ті, у кого немає машини більш схильні до покупки велосипеда, а люди, що мають дві машини скоріше не будуть цього робити.


 
Малюнок 15 Сторінка Attribute Discrimination для моделі TM_NaiveBayes.
 
 Читати 3 частина

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*