Автоматичне формування категорій інтервалів

Діалогове вікно Межі інтервалів дозволяє автоматично сформувати категорії інтервалів на основі обраного критерію

Як користуватися діалоговим вікном Межі інтервалів:

E Виберіть змінну в списку Відскановані змінні

E Клацніть по кнопці Межі інтервалів

E Виберіть критерії меж інтервалів, які визначають категорії інтервалів

E Клацніть по кнопці Застосувати

Малюнок 7-17

Діалогове вікно Межі інтервалів

Примітка: Діалогове вікно Межі інтервалів недоступно, якщо відскановано нуль спостережень

Рівні інтервали Формуються категорії інтервалів з рівною шириною (наприклад,

1-10, 11-20, 21-30 і тд) на основі будь-яких двох з наступних трьох критеріїв:

n Місцезнаходження перший кордону Значення, яке визначає верхню межу

самого нижньої категорії інтервалу (наприклад, значення 10 вказує на те, що

інтервал включає всі значення від найменшого до 10)

n Кількість кордонів Кількість категорій інтервалів дорівнює кількості кордонів плюс

одиниця Наприклад, 9 кордонів визначають 10 категорій інтервалів

n Ширина Ширина кожного інтервалу Наприклад, значення 10 розбило б вік у роках на інтервали по 10 років

Підготовка даних

Рівні процентилю (для відсканованих спостережень) Формуються категорії

інтервалів з рівним числом спостережень в кожному інтервалі (з використанням емпіричного алгоритму для процентилей) на основі одного з наступних критеріїв:

n Кількість кордонів Кількість категорій інтервалів дорівнює кількості кордонів

плюс одиниця Наприклад, три межі визначають чотири інтервалу процентилей

(Квартили), кожен з яких містить по 25% спостережень

n Ширина (%) Ширина кожного інтервалу, виражена у відсотках від загального числа

спостережень Наприклад, значення 3,33 задавало б три категорії інтервалів (два кордони), кожен з яких містив би 33,3% спостережень

Якщо вихідна змінна містить відносно мале число розрізняються значень або велика кількість однакових значень, може бути сформовано меншу інтервалів, ніж Ви запитали Якщо значенням кордону інтервалу відповідають декілька ідентичних значень, вони всі потраплять в один і той же інтервал, тому фактичний відсоток може не бути в точності рівним тому, який повинен виділятися

Кордони – в середньому значенні і в стандартних відхиленнях від нього (для відсканованих спостережень) Формуються категорії інтервалів на основі значень

середнього і стандартного відхилення розподілу значень змінної

n Якщо Ви не вибрали жодного з інтервалів стандартних відхилень, формуються дві категорії інтервалів з кордоном в середньому значенні змінної

n Ви можете вибрати будь-яку комбінацію інтервалів на основі одного, двох і / або трьох стандартних відхилень Наприклад, якщо вибрати всі три варіанти, то це призведе до створення восьми категорій інтервалів: шість інтервалів з шириною в одне стандартне відхилення і два інтервали з відхиленням більше трьох стандартних відхилень від середнього значення

У разі нормального розподілу 68% всіх спостережень потрапляють в інтервал плюс / мінус одне стандартне відхилення від середнього, 95% – плюс / мінус два стандартних відхилення і 99% – плюс / мінус три стандартних відхилення Формування категорій інтервалів, заснованих на стандартних відхиленнях, може призводити до того, що деякі інтервали будуть перебувати поза діапазону фактичних значень змінної і навіть поза діапазону можливих значень змінної (наприклад, негативні значення величини заробітної плати)

Примітка: Розрахунки процентилей і стандартних відхилень виконуються на основі відсканованих спостережень Якщо Ви обмежили число сканованих спостережень, результуючі інтервали можуть не містити точну частку спостережень, яку Ви хотіли б бачити в інтервалах, особливо, якщо файл даних був впорядкований по початкової змінної Наприклад, якщо Ви обмежили число сканованих спостережень першими 100 спостереженнями у файлі даних, що містить 1000 спостережень, який був відсортований в порядку зростання значень віку респондента, то замість чотирьох інтервалів, кожен з яких містить по 25% спостережень, Ви можете виявити, що перші три інтервали містять приблизно по 3,3% спостережень кожен, тоді як останній містить 90% спостережень

Джерело: Керівництво користувача за базовою системою Statistics 20

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*