Зведення для моделі

Малюнок 12-5

Вид

Вид – це миттєва візуальна зведення якості і різнорідності ансамблю

Якість Ця діаграма виводить точність остаточної моделі в порівнянні з опорною моделлю і наївною моделлю Точність представляється у форматі більше значить краще; Найкраща модель матиме найбільшу точність Для категоріальної цільової змінної точність – це просто відсоток записів, для яких передбачене значення збігається з наблюденним значенням Для безперервної цільової змінної точність – Це 1 мінус відношення середньої абсолютної помилки передбачення (середнього абсолютних значень різниць передвіщених і спостережених значень) до діапазону передбачених значень (різниці максимального і мінімального передбачених значень)

Моделі

Для ансамблів, створених за допомогою беггінга, опорна модель – це стандартна модель, побудована за всьому навчальному разбиению Для ансамблів, створених за допомогою бустінга, опорна модель – це перша компонентна модель

Наївна модель являє точність у разі, коли модель не була побудована, і відносить всі записи до модальної категорії Наївна модель не обчислюється для безперервних цільових змінних

Різнорідність Ця діаграма виводить розкид думок серед моделей компонент,

використовуваних для побудови ансамблю, представлений у форматі більше значить більш різнорідний. Це є міра того, наскільки сильно передбачення різняться в базових моделях Різнорідність недоступна для моделей ансамблів, створених за допомогою бустінга, і також не виводиться для безперервних цільових змінних

Важливість предикторів

Малюнок 12-6

Вид Важливість предикторів

Зазвичай при моделюванні зосереджують увагу на найбільш важливих предикторів і виключають або ігнорують найменш важливі Це допомагає зробити діаграма важливості предикторів, показуючи відносну важливість кожного предиктора при оцінці моделі Оскільки значення важливості є відносними, сума цих значень для всіх відображаються предикторів дорівнює 1,0 Важливість змінних не повязана з точністю

моделі Вона лише повязана з важливістю кожного предиктора для передбачення, а не з точністю цього пророкування

Важливість предикторів недоступна для всіх моделей ансамблів Набір предикторів може варіюватися за моделями компонентів, але важливість може бути обчислена для предикторів, що використовуються, принаймні, в одній моделі компонента

Частота предикторів

Малюнок 12-7

Вид Частота предикторів

Набір предикторів може варіюватися за моделями компонентів в силу вибору методу моделювання або вибору предикторів Діаграма частоти предикторів являє собою точкову діаграму, що показує розподіл предикторів за моделями компонент в ансамблі Кожна точка представляє одну або кілька моделей компонент містять конкретний предиктор Предиктори зображуються графічно уздовж осі y і сортуються в порядку зменшення частоти таким чином, самий верхній предиктор – це той, який використовується у найбільшій кількості моделей компонент, а самий нижній – це той, який був використаний в найменшому числі моделей Показуються 10 верхніх предикторів

Предиктори, які використовуються найчастіше, зазвичай є найбільш важливими Ця діаграма марна для методів, в яких набір предикторів не може змінюватися за моделями компонентів

Моделі

Точність моделей компонентів

Малюнок 12-8

Вид Точність моделей компонентів

Дана діаграма є точковою діаграмою точності передбачення для моделей компонентів Кожна точка представляє одну або кілька моделей компонентів з рівнем точності, зображеному графічно уздовж осі y Наведіть покажчик миші на будь-яку точку, щоб отримати інформацію про відповідну окремої моделі компонента

Опорні лінії Діаграма показує кодовані кольором лінії для ансамблів, а також опорну модель і наївні моделі Поруч з лінією, відповідної моделі, яка буде використана для скорингу, варто прапорець

Інтерактивність Діаграма оновиться, якщо змінити правило обєднання

Ансамблі, створені за допомогою бустінга Для ансамблів, створені за допомогою бустінга, виводиться діаграма з лініями

Малюнок 12-9

Вид Точність ансамблю ансамбль, створений за допомогою бустінга

Моделі

Подробиці про моделі компонентів

Малюнок 12-10

Вид Подробиці про моделі компонентів

Ця таблиця виводить інформацію про моделі компонентів, представлених построчно За замовчуванням моделі компонентів відсортовані в порядку зростання номерів моделі Рядки можна відсортувати в зростаючому чи спадному порядку за значеннями будь-якого стовпця

Модель Номер, що показує порядок, в якому моделі компонентів були створені

Точність Загальна точність, виражена у вигляді відсотка

Метод Метод моделювання

Предиктори Число предикторів, використаних у моделі компонента

Розмір моделі Розмір моделі залежить від методу моделювання: для дерев це число вузлів в дереві для лінійних моделей це число коефіцієнтів для нейронних мереж це число СИНАПСИС

Записи Виважена число вхідних записів у навчальній вибірці

Автоматична підготовка даних

Малюнок 12-11

Вид Автоматична підготовка даних

Цей вид виводить інформацію про те, які поля були виключені і як перетворені поля були отримані на етапі автоматичної підготовки даних (ADP) Для кожного поля, яке було перетворено або виключено, в таблиці перераховується імя поля, його роль в аналізі та дія, вчинена на етапі ADP Поля сортуються в алфавітному порядку імен полів по зростанню

Дія Урізати викиди, якщо показано, означає, що ті значення безперервних предикторів, які лежать поза межами відсікання (що визначаються трьома стандартними відхиленнями від середнього значення), замінюються значенням кордону відсікання

Засіб перегляду розщеплених моделей

Засіб перегляду розщеплених моделей відображає моделі для кожного розщеплення і надає зведення по розщепленим моделями

Моделі

Малюнок 12-12

Засіб перегляду розщеплених моделей

Розщеплення Заголовок стовпця показує поля, використовувані для створення розщеплення, і осередки є значеннями розщеплення Двічі клацніть по будь-якому розщепленню, щоб відкрити засіб перегляду моделей з моделлю, побудованою для цього розщеплення

Точність Загальна точність, виражена у вигляді відсотка

Розмір моделі Розмір моделі залежить від методу моделювання: для дерев це число вузлів в дереві для лінійних моделей це число коефіцієнтів для нейронних мереж це число СИНАПСИС

Записи Виважена число вхідних записів у навчальній вибірці

Джерело: Керівництво користувача за базовою системою Statistics 20

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*