Конструктор імпорту текстових файлів SPSS

Конструктор імпорту текстових файлів може зчитувати текстові файли даних,

відформатовані різним способом:

n Файли з даними, розділеними знаками табулятора

n Файли з даними, розділеними пробілами

n Файли з даними, розділеними комою

n Файли з полями даних фіксованої ширини

Для файлів з роздільниками даних, можна визначити й інші символи як роздільник, а також можна визначити кілька роздільників для одного файлу

Як відкрити текстовий файл даних

E Виберіть у меню:

Файл> Відкрити текстові дані ..

E Виберіть текстовий файл в діалоговому вікні «Відкрити файл даних»

E У наступних вікнах Конструктора імпорту текстових файлів вкажіть параметри зчитування

Конструктор імпорту текстових файлів: Крок 1

Малюнок 3-13

Конструктор імпорту текстових файлів: Крок 1

Текстовий файл відображається у вікні попереднього перегляду Ви можете застосувати заздалегідь встановлений формат (попередньо збережений за допомогою Конструктора імпорту текстових файлів) або пройти наступні кроки Конструктора імпорту текстових файлів, щоб вказати параметри читання текстових даних

Файли даних

Конструктор імпорту текстових файлів: Крок 2

Малюнок 3-14

Конструктор імпорту текстових файлів: Крок 2

На цьому кроці задається інформація про змінних Мінлива подібна полю в базі даних Наприклад, кожне питання в анкеті – змінна

Змінні у файлі .. Для того щоб прочитати дані, Конструктор імпорту текстових файлів повинен знати де закінчується значення однієї переменнойі починається значення іншої Організація змінних визначає спосіб відділення однієї змінної від іншої

n З роздільником Для відділення змінних використовуються пробіли, коми,

табулятори та інші символи Для кожного спостереження змінні записані в однаковому порядку, але не обовязково в однакових стовпчиках

n Фіксованої довжини У файлі даних кожна змінна записана в одному і тому ж

місці (стовпці) для кожного спостереження Ніяких роздільників між змінними не потрібно Часто в текстових файлах даних, згенерованих компютерними програмами, значення змінних можуть бути записані безперервно без будь-яких роздільників Для визначення того, яка змінна зчитується, використовується положення (номер стовпця) зчитуваного значення

Імена змінних знаходяться вгорі файлу Якщо перший рядок файлу даних

містить мітки для кожної змінної, Ви можете використовувати ці мітки як імена змінних Значення, що не узгоджуються з правилами утворення імен змінних, перетворюються в коректні імена змінних

Конструктор імпорту текстових файлів: Крок 3 (файли з роздільниками)

Малюнок 3-15

Конструктор імпорту текстових файлів: Крок 3 (файли з роздільниками)

На даному кроці вказується інформація про спостереженнях Спостереження в IBM SPSS Statistics подібні записам у базі даних Наприклад, кожен респондент в даних опитування є спостереженням

У якому рядку починається перше спостереження У цьому полі необхідно вказати перший рядок файлу даних, що містить дані Якщо у верхніх рядках файлу даних містяться коментарі або інший текст, який не є даними, число, вказане в цьому полі, не повинно дорівнювати 1

Як представлені Ваші спостереження Здається, яким чином Конструктор імпорту текстових файлів визначає, де дане спостереження закінчується і починається наступне

n Кожен рядок відповідає одному спостереженню Кожен рядок відповідає

одному спостереженню Це досить поширений випадок, незважаючи на те,

що при великій кількості змінних, рядки стають дуже довгими

Файли даних

Якщо не всі рядки містять однакову кількість значень даних, то число змінних визначається за рядку, що містить найбільше число значень Спостереження з меншою кількістю значень міститимуть пропущені значення в додаткових змінних

n У спостереженні – задане число змінних Зазначене число змінних,

складових одне спостереження, повідомляє Конструктору імпорту текстових файлів, коли припинити читати одне спостереження і почати читати наступне В одному рядку можуть бути кілька спостережень Спостереження можуть починатися в середині одного рядка і тривати у наступному рядку Конструктор імпорту текстових файлів визначає кінець кожного спостереження, грунтуючись на числі лічених значень незалежно від числа розглянутих рядків Кожне спостереження повинно містити значення даних (або пропущені значення, позначені роздільниками) для всіх змінних Інакше файл даних вважається невірно

Скільки спостережень Ви хочете імпортувати Ви можете імпортувати всі спостереження, що містяться у файлі даних, перші n спостережень (n визначаєте

Ви), або випадково відібрані спостереження, складові заданий відсоток Так як алгоритм випадкової вибірки приймає незалежне псевдовипадкове рішення по кожному спостереженню, то відсоток відібраних спостережень може тільки приблизно відповідати зазначеному відсотку Чим більша кількість спостережень міститься у файлі даних, тим ближче відсоток відібраних спостережень до заданому відсотку

Конструктор імпорту текстових файлів: Крок 3 (файли фіксованої довжини)

Малюнок 3-16

Конструктор імпорту текстових файлів: Крок 3 (файли фіксованої довжини)

На даному кроці вказується інформація про спостереженнях Спостереження в IBM SPSS Statistics подібні записам у базі даних Наприклад, кожен респондент в даних опитування є спостереженням

У якому рядку починається перше спостереження У цьому полі необхідно вказати перший рядок файлу даних, що містить дані Якщо у верхніх рядках файлу даних містяться коментарі або інший текст, який не є даними, число, вказане в цьому полі, не повинно дорівнювати 1

Скільки рядків в 1-му спостереженні Здається, яким чином Конструктор імпорту текстових файлів визначає, де дане спостереження закінчується і починається наступне Кожна змінна визначена номером рядка в межах спостереження та її місцем розташування в шпальтах Необхідно вказати кількість рядків в одному спостереженні, щоб коректно прочитати дані

Скільки спостережень Ви хочете імпортувати Ви можете імпортувати всі спостереження, що містяться у файлі даних, перші n спостережень (n визначаєте

Ви), або випадково відібрані спостереження, складові заданий відсоток Так як алгоритм випадкової вибірки приймає незалежне псевдовипадкове рішення по кожному спостереженню, то відсоток відібраних спостережень може тільки приблизно

Файли даних

відповідати зазначеному відсотку Чим більша кількість спостережень міститься у файлі даних, тим ближче відсоток відібраних спостережень до заданому відсотку

Конструктор імпорту текстових файлів: Крок 4 (файли з роздільниками)

Малюнок 3-17

Конструктор імпорту текстових файлів: Крок 4 (файли з роздільниками)

На цьому кроці Конструктор імпорту текстових файлів показує найкращий, з його точки зору, варіант формату даних, і дозволяє коригувати вибрані параметри

Вкажіть роздільник Тут необхідно вказати символи, що розділяють значення даних Ви можете вибрати будь-яку комбінацію з зазначених роздільників, а також скористатися варіантом Інший, щоб вказати інший символ Кілька роздільників поспіль в даних інтерпретуються як пропущені значення

Вкажіть кваліфікатор тексту Символи, які використовуються, щоб оточувати ними значення, що містять роздільники Наприклад, якщо кома є роздільником, то значення, що містять коми, будуть лічені некоректно, якщо тільки не задати кваліфікатор тексту, який виділяє значення, запобігаючи інтерпретацію запитах в тексті як роздільників змінних Файли даних у форматі CSV, експортовані з Excel, в якості кваліфікатора тексту містять лапки () Кваліфікатор тексту повинен бути на початку і в кінці значення, виділяючи таким чином все значення

Конструктор імпорту текстових файлів: Крок 4 (файли фіксованої довжини)

Малюнок 3-18

Конструктор імпорту текстових файлів: Крок 4 (файли фіксованої довжини)

На цьому кроці Конструктор імпорту текстових файлів показує найкращий, з його точки зору, варіант формату даних, і дозволяє коригувати вибрані параметри Вертикальні лінії у вікні попереднього перегляду вказують певні Конструктором кордону між змінними

При необхідності, для розділення змінних вставте, перемістіть або видаліть кордону Якщо використовується кілька рядків для кожного спостереження, дані відображаються в одному рядку для кожного спостереження, з подальшими рядками, доданими в кінці рядка

Зауваження:

Для машинно-генеруються файлів даних, що містять безперервний потік значень даних без пробілів або інших роздільників, можуть виникнути труднощі при визначенні початку кожної змінної Для читання таких файлів зазвичай використовується файл визначення даних або інший опис (словник) даних, яке визначає номер рядка та номер стовпця для кожного значення кожної змінної

Файли даних

Конструктор імпорту текстових файлів: Крок 5

Малюнок 3-19

Конструктор імпорту текстових файлів: Крок 5

На цьому кроці визначаються імена і формати змінних Також можна вказати змінні, які не слід імпортувати

Імя змінної Ви можете замінити імена змінних пропоновані конструктором на будь-які зручні Вам імена, що задовольняють вимогам IBM SPSS Statistics Якщо імена змінних зчитуються з файлу даних, Конструктор автоматично змінить імена змінних таким чином, щоб вони задовольняли вимогам до імен змінних в IBM SPSS Statistics Виберіть змінну у вікні попереднього перегляду, і потім введіть імя змінної

Формат змінної Для зміни формату змінної, виберіть змінну у вікні попереднього перегляду, і потім виберіть необхідний формат у списку Ви можете використовувати клавішу Shift для виділення декількох послідовно стоять змінних і клавішу Ctrl для виділення декількох змінних розташованих непослідовно

Формат за замовчуванням визначається на основі значень даних у перших 250 рядках Якщо в перших 250 рядках зустрічаються дані різних форматів (наприклад, чисельний, дата, строковий), то за замовчуванням встановлюється строковий формат

Параметри форматів змінних, доступні в Конструкторі імпорту текстових файлів

Параметри форматів змінних в Конструкторі імпорту текстових файлів включають:

Чи не імпортувати Зазначена змінна не буде імпортуватися в IBM SPSS Statistics

Числова Допустимі значення включають числа, випереджаються знаком плюс чи мінус,

і десятковий роздільник

Текстова Допустимі значення включають фактично будь-які символи, що вводяться з клавіатури і прогалини Для файлів з роздільниками можна вказати число знаків у значеннях текстових змінних, вказавши максимум 32767 За замовчуванням Конструктор встановлює число знаків по найдовшому значенням, зустрінутому в обраній змінної (их) в першій 250 рядках файлу Для файлів з змінними фіксованої довжини число знаків в текстових змінних визначається розміщенням кордонів між змінними, заданих на Кроці 4

Дата / Час Допустимі значення включають дати загального формату dd-mm-yyyy, mm/dd/yyyy, ddmmyyyy, yyyy/mm/dd, hh:mm:ss, І інші формати дат і часу Місяці можуть зазначатися за допомогою чисел, римських чисел, за допомогою трибуквених скорочень або цілком Формат вибирається зі списку

Долар Допустимі значення – числа з необовязковими провідним знаком $ та комами як роздільник розрядів

Кома Допустимі значення включають числа, в яких точка використовується для відділення дробової частини числа від цілої, а коми можуть використовуватися для розділення розрядів

Точка Допустимі значення включають числа, в яких кома використовується для відділення дробової частини числа від цілої, а точки можуть використовуватися для розділення розрядів

Примітка: Значення, які містять неприпустимі символи для зазначеного формату, будуть інтерпретовані як припущення Значення, що містить будь-які з заданих роздільників, буде інтерпретуватися як кілька значень

Файли даних

Конструктор імпорту текстових файлів: Крок 6

Малюнок 3-20

Конструктор імпорту текстових файлів: Крок 6

Це заключний крок Конструктора Можна зберегти вказані Вами параметри у вигляді файлу для подальшого використання при імпорті подібних текстових файлів Можна також вставити синтаксис, створений Конструктором імпорту текстових файлів SPSS, в Редактор синтаксису Далі можна модифікувати і / або зберегти синтаксис для використання в наступних сеансах роботи

Кешувати дані Кеш даних – це повна копія файлу даних, збережена тимчасово на диску Кешування файлу даних може підвищити продуктивність

Джерело: Керівництво користувача за базовою системою Statistics 20

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*