Читання файлів баз даних

Дані можна вважати з будь-якого формату баз даних, для якого встановлено відповідний драйвер У локальному режимі аналізу необхідні драйвери повинні бути встановлені на Вашому локальному компютері У розподіленому режимі аналізу (доступному при наявності серверної версії IBM ® SPSS ® Statistics) драйвери повинні бути встановлені на віддаленому сервереДополнітельную інформацію см дана тема Режим розподіленого аналізу в Дана глава 4 на стор 69

Файли даних

Примітка: Якщо Ви використовуєте 64-бітну Windows версію SPSS Statistics, читання джерел даних Excel, Access і dBASE буде неможливо, навіть незважаючи на те, що вони можуть зявлятися в списках доступних джерел даних 32-бітові драйвери ODBC несумісні з 64-бітної Windows версією

Як читати файли баз даних

E Виберіть у меню:

Файл> Відкрити базу даних> Новий запит ..

E Виберіть джерело даних

E За необхідності (залежно від джерела даних) виберіть базу даних Вам може знадобитися ввести імя та пароль

E Виберіть таблицю (таблиці) і поля, які Ви хочете завантажити У джерелах OLE DB (наявних тільки в операційних системах Windows) можна обрати лише одну таблицю

E Змініть звязку між таблицями

E Додатково можна:

n Задати критерій відбору даних

n Задати запит значення для того, щоб при подальшому читанні даних можна було б змінювати параметри запиту

n Збережіть створений запит, перш ніж запускати його

Редагування збереженого запиту до бази даних

E Виберіть у меню:

Файл> Відкрити базу даних> Змінити запит ..

E Виберіть файл запиту (*spq), Який Ви хочете відредагувати

E Дотримуйтесь інструкцій по створенню нового запиту

за допомогою збережених запитів

E Виберіть у меню:

Файл> Відкрити базу даних> Виконати запит ..

E Виберіть файл запиту (*spq), Який Ви хочете запустити

E За необхідності (залежно від бази даних) введіть імя та пароль

E Якщо в запиті запитується значення, Вам, можливо, буде необхідно ввести й іншу інформацію (наприклад, квартал, за який ви хочете прочитати дані з продажу)

Вибір джерела даних

У першому діалоговому вікні Конструктора читання баз даних виберіть тип джерела даних

Джерела даних ODBC

Якщо у Вас немає сконфигурированних джерел даних ODBC, або якщо Ви хочете додати нове джерело даних ODBC, клацніть по кнопці Додати джерело даних

n В системі сімейства Linux ця кнопка відсутня Джерела даних ODBC описані у файлі odbcini, А змінна середовища ODBCINI повинна вказувати на розташування цього файлу Додаткові відомості див в документації до драйверів бази даних

n У розподіленому режимі аналізу даних (якщо є сервер IBM ® SPSS ® Statistics) ця кнопка недоступна Щоб додати джерела даних в розподіленому режимі аналізу, зверніться до Вашого системного адміністратора

Джерело даних ODBC описується двома видами інформації: драйвер, який буде використовуватися для доступу до даних, і місце розташування бази даних, до якої потрібно отримати доступ Для завдання джерела даних повинен бути встановлений відповідний драйвер Засіб установки (носій) містить драйвери для різноманітних форматів баз даних

Файли даних

Малюнок 3-1

Конструктор читання баз даних

Джерела даних OLE DB

Щоб мати доступ до джерел даних через інтерфейси OLE DB (тільки для операційної системи Microsoft Windows), необхідно мати наступне встановлене програмне забезпечення:

n NET framework Щоб отримати останню версію NET framework, зайдіть за адресою http://wwwmicrosoftcom/net

n IBM ® SPSS ® Data Collection Survey Reporter Developer Kit За інформацією про отримання сумісної версії SPSS Survey Reporter Developer Kit зверніться на wwwibmcom / support (http://wwwibmcom/support)

Наступні обмеження відносяться до джерел даних OLE DB:

n Для джерел даних OLE DBС команда обєднання таблиць не підтримуються

Дані можуть зчитуватися одночасно тільки з однієї таблиці

n Джерела даних OLE DB можна додавати тільки в локальному режимі аналізу

Щоб додати джерела даних OLE DB при роботі в розподіленому режимі на сервері, зверніться до Вашого системного адміністратора

n У розподіленому режимі аналізу (доступному для SPSS Statistics Server), джерела даних OLE DB доступні тільки для серверів Windows Крім того, на сервері повинні бути зупинені NET і SPSS Survey Reporter Developer Kit

Малюнок 3-2

Конструктор читання баз даних з доступом до джерел даних OLE DB

Щоб додати джерело даних OLE DB:

E Клацніть Додати джерело даних OLE DB

E У діалоговому вікні Data Link Properties клацніть по закладці Provider і потім виберіть провайдера OLE DB

E Клацніть Next або клацніть на закладці Connection

E Виберіть базу даних, ввівши директорію і імя бази даних або клацнувши по кнопці вибору бази даних (Може знадобитися ввести імя та пароль)

Файли даних

E Клацніть ОК після введення всієї необхідної інформації (Ви можете переконатися в доступності зазначеної бази даних, клацнувши по кнопці Test Connection)

E Введіть імя бази даних, підключення до якої потрібно перевірити (Це імя буде відображатися в списку доступних джерел даних OLE DB)

Малюнок 3-3

Діалогове вікно Зберегти інформацію про підключення до OLE DB як

E Клацніть по ОК

Після цього Ви потрапляєте в першому діалогове вікно Конструктора читання баз даних, де Ви можете вибрати імя, під яким зберігаються джерела даних OLE DB, і перейти до наступного кроку конструктора

Видалення джерел даних OLE DB

Щоб видалити імена джерел даних зі списку джерел даних OLE DB, видаліть файл UDL з імям джерела даних, який знаходиться в:

[drive]:\Documents and Settings\[user login]\Local Settings\Application Data\SPSS\UDL

Вибір полів даних

За крок Вибір даних можна задати інформацію про те, які таблиці і поля зчитуються в IBM SPSS Statistics Поля бази даних (стовпчики) зчитуються в IBM SPSS Statistics

як змінні

Якщо в таблиці обрані поля, то в наступних вікнах конструктора читання баз даних будуть видні всі поля цієї таблиці, однак імпортуються в якості змінних тільки ті поля, які обрані на цьому кроці Це дозволяє створювати зєднання таблиць і задавати критерії відбору з використанням полів, які не потрібно імпортувати

Малюнок 3-4

Конструктор читання баз даних, вибір даних

Відображення імен полів Щоб отримати список полів таблиці, клацніть по значку плюс (+) зліва від імені таблиці Щоб прибрати інформацію про полях, клацніть по значку мінус (-) зліва від назви таблиці

Як додати поле Двічі клацніть по потрібному полю в списку Наявні таблиці або перетягніть його за допомогою миші в список Отримати поля в наступному порядку Поля можуть бути переупорядкувати у вибраному списку полів шляхом перенесення в потрібне місце

Як видалити поле Для цього потрібно двічі клацнути мишею по полю, яке потрібно видалити, у списку Отримати поля в наступному порядку або перетягнути його за допомогою миші в список Наявні таблиці

Сортування назв полів Якщо встановлено прапорець Сортувати імена полів,

Конструктор читання баз даних виводить доступні для читання поля в алфавітному порядку

За умовчанням в списку доступних таблиць відображаються тільки стандартні таблиці баз даних Можна керувати типами елементів, які будуть відображатися в списку:

n Таблиці Стандартні таблиці баз даних

Файли даних

n Уявлення Уявлення є віртуальними або динамічними таблицями, заданими за допомогою запитів Вони можуть включати обєднання декількох таблиць і / або полів, отриманих шляхом обчислень на основі значень інших полів

n Синоніми Синоніми є альтернативними іменами для таблиць або вибірок,

зазвичай задаються в запитах

n Системні таблиці У системних таблицях задаються властивості баз даних У деяких випадках стандартні таблиці баз даних можуть бути класифіковані як системні таблиці і будуть відображатися тільки при виборі цього варіанту Доступ до системних таблиць часто обмежується адміністраторами

Примітка: У джерелах OLE DB (доступних тільки для операційних системах Windows) можна вибрати поля тільки в одній таблиці Звязки між таблицями не підтримуються джерелах даних OLE DB

Створення звязків між таблицями

Крок Задати звязку дозволяє задати звязки між таблицями джерел даних ODBC Якщо поля обрані з декількох таблиць, необхідно задати, принаймні, одну звязок

Малюнок 3-5

Конструктор читання баз даних, завдання звязків

Завдання звязків Щоб задати звязок, перетягніть поле однієї таблиці в поле іншій таблиці, з яким Ви хочете його звязати Конструктор читання баз даних намалює сполучну лінію між двома полями, яка показує цей звязок Ці поля повинні бути одного типу

Зєднати таблиці автоматично Якщо встановлено прапорець Зєднати таблиці автоматично, то автоматично зявиться лінія, що зєднує будь-які два поля з однаковими іменами і типами даних

Тип звязку Якщо драйвер підтримує зовнішні зєднання, можна задавати внутрішні,

ліві зовнішні чи праві зовнішні звязки

n Внутрішні звязку Внутрішні звязку включає тільки ті рядки, в яких повязані

поля рівні У даному прикладі будуть включені всі рядки з двох таблиць, значення ID

в яких узгоджуються

n Зовнішні звязки Крім обєднання таблиць по внутрішнім звязкам один-до-одного,

можна також використовувати зовнішні звязки, щоб обєднувати таблиці за схемою

один-до-багатьох Наприклад, можна було б обєднати таблицю з невеликим числом

Файли даних

записів, що представляють значення даних та відповідні мітки значень, з таблицею, що містить сотні або тисячі записів з результатами опитування респондентів Ліві зовнішні звязки включають всі записи з таблиці ліворуч, і тільки ті записи з таблиці праворуч, де повязані поля рівні Праві зовнішні звязки включають всі записи з таблиці праворуч, і тільки ті записи з таблиці ліворуч, де повязані поля рівні

Обмеження запитуваних спостережень

На кроці Обмежити запитувані спостереження можна задати критерій відбору підмножин спостережень (рядків) Обмеження спостережень зазвичай зводиться до заповнення сітки критеріїв одним або декількома критеріями Критерії складаються з двох виразів і деякого відносини між ними Вирази повертають для кожного спостереження значення істина, брехня або пропущене

n Якщо результат – істина, То спостереження відбирається

n Якщо результат – брехня або пропущене значення, То спостереження не відбирати

n У більшості критеріїв використовуються один або декілька з шести операторів відносин (<,>, <=,> =, = і <>)

n Вирази можуть містити імена полів, константи, арифметичні оператори, числові та інші функції, а також логічні змінні Для завдання критеріїв можна використовувати поля, які Ви не збираєтеся імпортувати

Малюнок 3-6

Конструктор читання баз даних, обмеження запитуваних спостережень

Для побудови критерію необхідні, принаймні, два вирази і відношення між ними

E Побудувати вираз можна одним з перерахованих нижче способів:

n У полі Вираз можна вводити імена полів, константи, арифметичні оператори,

числові та інші функції, а також логічні змінні

n Двічі клацніть по полю в списку Поля

n Перетягніть поле зі списку Поля в поле Вираз

n Виберіть поле із списку в активній клітинці поля Вираз

E Щоб вибрати оператор відносини (наприклад, = або>), помістіть курсор в комірку

Ставлення і або введіть потрібний оператор, або виберіть його у списку

Файли даних

Якщо в SQL містяться пропозиції з виразами для вибору спостережень, що починаються з WHERE, дати і час у виразах повинні вводитися спеціальним чином (включаючи фігурні дужки, показані в прикладах):

n Рядки даних повинні бути вказані в форматі {d рррр-ММ-дд}

n Рядки часу повинні бути зазначені в форматі {t чч: мм: сс}

n Рядки даних і часу (мітки часу) повинні бути вказані в форматі {ts

‘Рррр-ММ-дд гг: мм: сс}

n Повне значення дати і / або часу має бути укладена в прості лапки

Рік має бути вказаний в повній формі, в дата і час повинні містити по два символи в кожній частині значення Наприклад, «1 січня 2005, 1:05 ночі» має бути зазначено як:

{ts 2005-01-01 01:05:00}

Функції У списку Функції є вбудовані арифметичні, логічні, текстові

функції, функції дат і часу, а також функції SQL Ви можете вибрати функцію в списку і перетягнути її у вираз, або ввести вручну будь-яку допустиму функцію SQL Перелік доступних SQL-функцій дивіться в документації до вашої базі даних Список стандартних функцій міститься в:

http://msdn2microsoftcom/en-us/library/ms711813aspx

Випадкова вибірка При виборі цього варіанту відбирається випадкова вибірка спостережень з джерела даних Для скорочення часу обробки даних великого обсягу може знадобитися обмежити число спостережень невеликий репрезентативною вибіркою Випадкова вибірка засобами IBM ® SPSS ® Statistics, якщо вона можлива для даного джерела даних, виконується швидше, ніж випадкова вибірка SPSS Statistics, оскільки в останньому випадку потрібно завантажити всі дані з джерела, щоб витягти випадкову вибірку

n Приблизно При виборі цього параметра генерується випадкова вибірка, розмір

якої визначається (приблизно) задається відсотком спостережень Так як процедура генерації вибірки приймає незалежне псевдовипадкове рішення для кожного спостереження, відсоток відбираються спостережень може тільки апроксимувати відсоток, вибраний у діалоговому вікні Чим більша кількість спостережень міститься у файлі даних, тим ближче відсоток відібраних спостережень до заданому відсотку

n Точно Із загального заданого числа спостережень випадково вибирається задане число

спостережень Якщо загальна задане число спостережень перевершує число спостережень у файлі даних, в формованої вибірці буде пропорційно менше спостережень, ніж задано

Примітка: Якщо запитується випадкова вибірка, то агрегування (доступне в режимі підключення до SPSS Statistics Server) недоступно

Запит значення Ви можете вбудувати в створюваний запит до бази даних запит параметра у користувача Коли користувач запустить такий запит, у нього на екрані зявиться діалогове вікно, в яке він повинен буде ввести інформацію Це може знадобитися, якщо, наприклад, різним користувачам потрібні будуть різні підмножини

одного безлічі даних Наприклад, можна за допомогою одного і того ж запиту зчитувати показники продажів для різних кварталів

E Щоб створити запит значення, помістіть курсор в будь-яку клітинку вираження, і клацніть по кнопці Запропонувати ввести значення

Створення запиту параметра

Використовуйте діалогове вікно Запит значення для створення запитів, що запитують інформацію у користувачів, при кожному запуску запиту Це корисно, якщо Ви хочете зчитувати різні підмножини даних з одного і того ж джерела даних, використовуючи різні критерії

Малюнок 3-7

Запит значення

Щоб сформувати запит значення, потрібно ввести текст запиту значення і значення за замовчуванням Вікно запиту значення буде зявлятися кожен раз, коли користувачі будуть запускати запит Текст запиту повинен містити відомості про те, яку інформацію потрібно ввести Якщо користувач не вибирає значення зі списку, текст повинен давати

підказку про те, в якому форматі слід ввести інформацію Приклад: Введіть квартал

(Кв 1, Кв2, КВ3, ..)

Дозволити користувачеві вибирати значення зі списку Встановивши цей прапорець, Ви можете обмежити вводяться значення Після кожного значення слід натискати клавішу Enter

Тип даних Задайте тут тип даних: Число, Текстові або Дати

Файли даних

Результат виглядає наступним чином:

Малюнок 3-8

Запит, створений користувачем

Агрегація даних

При роботі в режимі підключення до IBM ® SPSS ® Statistics Server можна агрегувати дані, перед тим як завантажувати їх в IBM ® SPSS ® Statistics

Малюнок 3-9

Конструктор читання баз даних, агрегування даних

Можна також агрегувати дані після завантаження їх в SPSS Statistics, але попереднє агрегування може скоротити час завантаження даних великого обсягу

E Виберіть одну або кілька группирующих змінних, що визначають, як дані групуються для агрегування

E Виберіть одну або кілька агрегіруемих змінних

E Виберіть агрегує функції для кожної агрегіруемий змінної

E Також можна створити змінну, значеннями якої будуть кількості спостережень,

спіткало кожну групу при агрегування

Примітка: Якщо використовується випадкова вибірка SPSS Statistics, агрегування недоступно

Завдання змінних

Імена і мітки змінних У якості мітки змінної використовується повне імя поля бази даних (шпальти) Якщо Ви не зміните імена змінних, Конструктор баз даних присвоїть імена кожному колонку бази даних одним із таких способів:

n Якщо імя поля бази даних утворює допустимий, унікальне імя змінної, воно використовується в якості імені змінної

n Якщо імя поля бази даних не утворює допустимий, унікальне імя змінної,

унікальне імя генерується автоматично

Клацніть по будь-якій комірці, щоб відредагувати імя змінної

Перетворення текстових значень в числові значення Встановіть прапорець

Перекодувати в числове значення для текстової змінної, якщо хочете, щоб вона автоматично була перетворена в числову змінну Текстові значення

перетворюються в послідовні цілі числа відповідно до алфавітного порядку вихідних значень Вихідні значення зберігаються в мітках значень нових змінних Ширина довгих текстових змінних Цей параметр задає ширину значень

довгих текстових змінних За замовчуванням ширина встановлюється рівною 255

байтам, при цьому будуть лічені тільки перші 255 байтів (зазвичай відповідає 255 символам для мов з однобайтное кодуванням) Ширина може бути до 32 767 байт Хоча Ви напевно не захочете обрізати текстові значення, Ви також не захочете задавати необгрунтовано великі значення довжин змінних, так як це призводять до зниження продуктивності обробки даних

Мінімізуйте ширину текстових змінних на основі спостережуваних значень Автоматично встановіть ширину всіх текстових змінних до найдовшого спостережуваного значення

Файли даних

Малюнок 3-10

Конструктор читання баз даних, завдання властивостей змінних

Сортування спостережень

При роботі в режимі підключення до IBM ® SPSS ® Statistics Server можна сортувати дані, перед тим як завантажувати їх в IBM ® SPSS ® Statistics

Малюнок 3-11

Конструктор читання баз даних, сортування спостережень

Дані можна також сортувати після завантаження їх в SPSS Statistics, але попередня сортування допоможе заощадити час для даних великого обсягу

Результати

На кроці Результати показаний створений запит на мові SQL

n Запит можна відредагувати перед його виконанням, але якщо після редагування клацнути по кнопці Назад, щоб внести зміни в попередні вікна, внесені

зміни будуть втрачені

n Щоб мати можливість використовувати запит надалі, використовуйте поле

Зберегти у файлі

n Виберіть варіант Вставити його в редактор синтаксису, щоб вставити команду GET DATA у вікно Редактора синтаксису Просте копіювання і вставка запиту SQL не приведе до отримання повноцінної команди синтаксису

Примітка: Вставлений синтаксис містить пробіл перед кожною закривається лапками в кожному рядку SQL, згенерованої конструктором Ці прогалини не є зайвими При виконанні команди всі рядки SQL-запиту зливаються разом У відсутність цих прогалин не було б прогалин між останнім символом одного рядка і першим символом наступного рядка

Файли даних

Малюнок 3-12

Конструктор читання баз даних, панель результатів

Джерело: Керівництво користувача за базовою системою Statistics 20

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*