СТАТИСТИЧНІ ПОКАЗНИКИ БАЗИ ДАНИХ

На стадіях 3 і 4 загального процесу оптимізації (званих стадіями вибору шляху доступу) використовуються статистичні показники бази даних, що зберігаються в її каталозі (додаткові відомості про те, як використовуються ці статистичні показники, наведені в розділі 187) У демонстраційних цілях нижче коротко розглядаються (з невеликими додатковими коментарями) деякі з основних статистичних показників, які у двох комерційних продуктах, – СУБД DB2 і Ingres Наведемо деякі з основних статистичних показателей5, застосовуваних в СУБД DB2

■ Для кожної базової таблиці фіксуються наступні показники:

■ кардинальність

■ кількість сторінок, зайнятих таблицею

■ частка табличного простору, займаного таблицею

■ Для кожного стовпця кожної базової таблиці фіксуються наступні показники:

■ кількість різних значень в стовпці

■ другий найбільше значення в стовпці

■ другий найменше значення в стовпці

■ десять значень в стовпці (тільки для індексованих стовпців), які зустрічаються найчастіше, а також кількість входжень кожного з цих зна чений

. ■ Для кожного індексу фіксуються такі показники:

■ індикатор, який вказує, чи є індекс кластеризувати (тобто індек сом, в якому логічний порядок значень ключа збігається з фізичним порядком розміщення цих значень на диску)

■ для кластеризованих індексів – частка індексованої таблиці, знаходячи щейся в кластеризуються послідовності

5 Оскільки СУБД DB2 і Ingres відносяться до категорії систем з підтримкою SQL, в них замість термінів змінна відносини і атрибут використовуються терміни таблиця і стовпець У звязку з цим зазначені терміни використовуються і в цьому розділі Крім того, слід зазначити, що в обох продуктах фактично мається на увазі, що базові таблиці відображаються безпосередньо на збережені таблиці

Глава 18 Оптимізація697

■ кількість листових сторінок в індексі

■ кількість рівнів в індексі

Примітка Перераховані вище статистичні показники не оновлюються в реальному масштабі часу (Тобто при кожному оновленні бази даних) через великі витрат, які потрібні були б при використанні такого підходу Замість цього статистичні показники оновлюються вибірково, за допомогою системної утиліти RUNSTATS, яка запускається на вимогу адміністратора бази даних, наприклад після реорганізації бази даних Аналогічне твердження можна застосувати і до більшості інших комерційних продуктів (але не до всіх), в тому числі до системи Ingres (див наступний абзац), де відповідна утиліта називається OPTIMIZEDB

Перерахуємо деякі з основних статистичних показників бази даних, що накопичуються в СУБД Ingres

Примітка В системі Ingres індекс розглядається як окремий випадок збереженої таблиці Тому наведені нижче статистичні показники для базових таблиць і

стовпців обчислюються також для індексів

■ Для кожної базової таблиці фіксуються такі показники:

■ кардинальність

■ кількість первинних сторінок для таблиці

■ кількість сторінок переповнення для таблиці

■ Для кожного стовпця в кожної базової таблиці фіксуються наступні показники:

■ кількість різних значень в стовпці

■ максимальне, мінімальне та середнє значення для стовпця

■ реальні значення в стовпці і частота їх входжень

Джерело: Дейт К Дж, Введення в системи баз даних, 8-е видання: Пер з англ – М: Видавничий дім «Вільямс», 2005 – 1328 с: Ил – Парал тит англ

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*