Агрегація даних

Процедура агреговані дані дозволяє перетворити групи спостережень у спостереження, що містять агреговану інформацію по відповідній групі, і створювати новий – агрегований – файл даних або створювати нові змінні в активному наборі даних, що містять агреговану інформацію Спостереження

агрегуються на основі значень нуля або більшої кількості группирующих змінних Якщо группирующие змінні не задані, то весь набір даних являє собою єдину групу для агрегування

n Якщо ви створюєте новий агрегований файл даних, то новий файл буде містити по одному спостереженню на кожну групу, яка визначається групуючій змінної Наприклад, якщо є одна групує змінна з двома значеннями, то новий файл даних буде містити тільки два спостереження Якщо не задані группирующие змінні, то новий файл даних буде містити одне спостереження

n Якщо агреговані змінні додаються в активний набір даних, сам файл даних не агрегируется Кожне спостереження з однаковими значеннями группирующих змінних отримує однакові значення для нових агрегованих змінних Наприклад, якщо є єдина групує мінлива gender, То всі чоловіки будуть мати однакове значення нової агрегированной змінної, що представляє середній вік Якщо не задано группирующих змінних, то всі спостереження будуть отримувати одне і те ж значення для нової агрегіруемий змінної, що представляє середній вік

Робота з файлами

Малюнок 9-7

Діалогове вікно агреговані дані

Группирующие змінні Спостереження групуються на основі значень группирующих змінних Кожна унікальна комбінація значень группирующих змінних визначає групу Якщо створюється новий, агрегований файл даних, все группирующие змінні зберігаються в новому файлі під своїми колишніми іменами і з інформацією зі словника даних Групує змінна, якщо задана, може бути числовий або текстової

Агрегіруемий змінні Для створення нових змінних використовуються вихідні змінні з функціями агрегування За імям агрегированной змінної йде необовязкова мітка змінної, імя агрегує функції і імя вихідної змінної в дужках

Можна змінювати імена агрегіруемих змінних, задані за замовчуванням, додавати описові мітки змінних, а також змінювати функції, використовувані для розрахунку агрегованих значень Можна також створити змінну, що містить число спостережень, що потрапили в кожну групу при агрегування

Як агрегувати файл даних

E Виберіть у меню:

Дані> Агрегувати дані ..

E Можна задати группирующие змінні, що визначають, як спостережень групуються при агрегування даних Якщо группирующие змінні не задані, то весь набір даних є єдиною групою для агрегування

E Виберіть одну або кілька агрегіруемих змінних

E Виберіть агрегує функції для кожної агрегіруемий змінної

Збереження агрегованих результатів

Ви можете додати агреговані змінні в активний набір даних або створити новий, агрегований файл даних

n Додати агреговані змінні в активний набір даних В активний набір

даних додаються нові змінні, засновані на функціях агрегування Сам файл даних не агрегируется Кожне спостереження з однаковими значеннями группирующих змінних отримує однакові значення для нових агрегованих змінних

n Створити новий набір даних, що містять тільки агреговані змінні

Зберігає агреговані дані в новому наборі даних в поточному сеансі роботи Файл включає группирующие змінні, що задають агреговані спостереження, і всі агреговані змінні, задані функціями агрегування Активний набір даних не змінюється

n Записати новий файл даних, який містить лише агреговані змінні

Зберігає агреговані дані в зовнішньому файлі даних Файл включає

группирующие змінні, що задають агреговані спостереження, і всі агреговані змінні, задані функціями агрегування Активний набір даних не змінюється

Параметри сортування для великих файлів даних

Для дуже великих файлів даних більш ефективним може бути агрегування попередньо відсортованих даних

Дані вже відсортовані за групуючій (їм) змінної (им) Якщо дані вже відсортовані за значеннями группирующих змінних, то цей параметр дозволяє процедурі виконуватися швидше і використовувати менше памяті Користуйтеся цим параметром з обережністю

n Дані повинні бути відсортовані за значенням группирующих змінних в тому ж порядку, в якому группирующие змінні вказані у процедурі агреговані дані

n Якщо Ви додаєте змінні в активний набір даних, вибирайте цей параметр, тільки якщо дані відсортовані в порядку зростання значень группирующих змінних

Робота з файлами

Відсортувати дані перед агрегированием У дуже рідкісних випадках з великими

файлами даних вам, можливо, буде потрібно впорядкувати файл даних за значеннями группирующих змінних до агрегування Використовувати цей параметр не рекомендується, поки у вас не виникнуть проблеми з памяттю або швидкодією

: агрегує функції

У цьому діалоговому вікні задається функція, яка використовується для обчислення агрегованих значень даних для обраних змінних зі списку агрегіруемий змінні в діалоговому вікні агреговані дані Агрегує функції включають:

n підсумовує функції для числових змінних, включаючи середню, медіану,

стандартне відхилення і суму

n Число спостережень, включаючи не зважені, зважені, що не пропущені й пропущені

n Відсоток або частка значень більше або менше зазначеного значення

n Відсоток або частка значень усередині або поза зазначеного діапазону значень

Малюнок 9-8

Діалогове вікно агреговані дані: агрегує функції

: Імя та мітка змінної

При агрегування даних імена агрегованих змінних в новому файлі даних задаються за умовчанням Діалогове вікно агреговані дані: Імя та мітка змінної дає можливість змінити імя і мітку змінної, обраної в списку агрегіруемий змінні Додаткову інформацію см дана тема Імена змінних в Дана глава 5 на стор 79

Малюнок 9-9

Діалогове вікно агреговані дані: Імя та мітка змінної

Джерело: Керівництво користувача за базовою системою Statistics 20

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*