Класифікація систем зберігання даних, Комп’ютери, огляди

Введення

Розглядаючи будь-яку інформаційну систему, не можна не виділити такий процес як зберігання інформації. Саме інформація представляє основну цінність в будь-якій організації, а вся інфраструктура, призначена для її обробки, зберігання, передачі – лише наслідок цього факту. Хотілося б приділити увагу процесу зберігання інформації, методи апаратного захисту інформації від втрати та управління зберіганням інформації. У сучасному світі будь-яка компанія відчуває на собі наступні тенденції: інформація відіграє ключову роль у роботі організації, зростання даних відбувається в експоненційної пропорції. Приміром, IDC стверджує, що обсяг щорічно створюваної і дублюється інформації збільшиться в 6 разів у період з 2006 по 2010 рр..

У першу чергу, цікавить тривалий у часі зберігання на жорстких дисках (у перспективі на SSD накопичувачах). Даний матеріал дає уявлення про апаратні методи організації збереження і захисту даних. Розглянуто ієрархія систем зберігання даних на жорстких дисках, їх загальні класи. Такі системи як NAS сервери або VTL не розглядалися, хоча можуть мати місце як надбудова до описаних системам.

Загрози для інформації, що ведуть до її втрати при зберіганні на жорстких дисках

Отже, починаючи від простого до складного.

Пряме підключення HDD

Жорсткий диск підключається до інтегрованого контролера материнської плати. Мається на увазі, що ніяких додаткових пристроїв зберігання немає. Якщо даний тип підключення майже завжди реалізується в домашніх умовах, то для будь-якої фірми він абсолютно неприйнятний як засіб збереження хоч скільки-небудь важливої ​​інформації.

 

Дані не захищені та будь-який збій (апаратний або програмний) може привести і одного разу призведе до втрати даних. Цінність Вашої інформації протиставлена ​​не лише прогнозами фірми виробника на гарантійні витрати, але і якості електроенергії, кваліфікації персоналу, софта та інших надсистемного факторів.

Інформація не захищена від:

Внутрішній RAID контролер

RAID (англ. redundant array of independent / inexpensive disks) – надлишковий масив незалежних / недорогих жорстких дисків – матриця з декількох дисків, керованих контролером, взаємопов’язаних швидкісними каналами і сприймаються як єдине ціле. Залежно від типу використовуваного масиву може забезпечувати різні ступені відмовостійкості та швидкодії.

Два або більше дисків підключаються до контролера в сервері або зовнішня дискова полку підключається до контролера, залежно від обраного рівня відмовостійкості, захищає від поломки одного або більше дисків, зберігаючи працездатність.

При наявності енергонезалежного кеша і використанні SAS дисків, захищає від проблем, пов’язаних з перебоями електроживлення, за винятком тих випадків, коли відбувається електричне пошкодження обладнання. Але при пошкодженні сервера можлива втрата даних.

Захищає дані від:

Не захищає від:

Основна мета застосування – захист даних від втрати при відмові жорсткого диска, так само, одна з причин впровадження – потреба в підвищеній продуктивності дискової підсистеми.

RAID контролери поставляють багато компаній: IBM, DELL, SUN, HP, Adaptec, 3ware, LSI, та інші.

Зовнішній RAID масив

Початковий рівень. Диски і контролер винесені в окрему зовнішню систему. Один або декілька серверів можуть бути підключені до зовнішнього масиву різними інтерфейсами, наприклад SAS, iSCSI, FC. Майже всі такі системи мають дублювання вентиляторів і блоків живлення, багато передбачають можливість установки дублюючого контролера. Самі по собі, зовнішні RAID масиви більш продуктивні і надійні в порівнянні з внутрішніми RAID контролерами і можуть розширюватися до більш ніж сотні дисків (за допомогою дискових полиць).

На даний момент у багатьох моделях є просунуті засоби моніторингу та управління, як самим масивом, так і даними на ньому. Засоби контролю за станом дисків заздалегідь сповіщають про можливу відмову, більшість гідних виробників міняють диски тільки на підставі даних повідомлень, до факту непрацездатності. У деяких моделей є можливо робити миттєві знімки – (snapshot), що дозволяє захистити дані і спрощує резервне копіювання.

Захищає дані від:

Не захищають від:

Причиною впровадження є або потреба у консолідації ресурсів зберігання, їх більш простому управлінні, можливості одночасного доступу (наприклад при створенні кластера), або потреба у високій продуктивності, або потреба в більшій надійності (дублювання шляхів до контролера).

Типові представники класу: Xyratex 5xxx/6xxx, Dell MD3000, IBM 3XXX, HP MSA 2000.

Дисковий масив рівня підприємства

Середній рівень. Іноді досить складно провести межу між Entry level і Midrange, але в основному провідні виробники сходяться в тому що основний критерій це надійність системи та її функціонал. Продуктивність або масштабованість, які, природно більше, також мають значення, але не на першому плані. Природно, що в системах середнього рівня є все, що і в entry level і навіть більше – обов’язковим вважається дублювання всіх систем у тому числі контролерів, інтерконектов, харчування, можна сказати що 99,99% доступності для таких систем це вже мінімум (менше години простою в рік) і новий стандарт це 99,999. І, відповідно, багатий набір засобів управління і моніторингу. До кожної системи можливий широкий набір опцій приміром, синхронна і асинхронна реплікація, копіювання томів, набір утиліт як для сервера так і для масиву.

 

Таким чином, за допомогою реплікації можна домогтися від системи стійкості до аварій і навіть катастрофостійкості, засобами одного лише масиву.

Захищає дані від:

Коли застосовується. Причиною переходу на системи такого рівня може стати або потреба в додаткових сервісах для резервування, або скорочення витрат на підтримку інфраструктури. Так само компанія може бути зацікавлена ​​в більш раціональному розподілі ресурсів (а отже і економії), що досягається за рахунок високої масштабованості таких систем, застосування технологій віртуалізації. Не можна забувати і про високі стандарти надійності.

 

Типові представники серії: HP EVA (на малюнку), DELL EqualLogic, IBM DS 4xxx

Системи зберігання даних класу Hi-End

Hi-end системи. Дані системи затребувані тільки великими корпораціями, що, враховуючи їх вартість, цілком зрозуміло. Надаючи високу надійність, на рівні близькому до абсолютного, і унікальні функціональні можливості. Не маючи можливості розкрити весь функціонал в рамках даного матеріалу, можна однозначно сказати, що дані рішення виправдовують свою вартість, якщо, звичайно у вас є кілька мільйонів доларів.

Дані системи будуються на базі, так званих non-stop систем. Дублюються всі компоненти системи, у тому числі процесори, операційна система проходить тестування для виключення будь-яких помилок, тому ймовірність відмови вкрай мала. На додаток значну цінність представляє і програмне забезпечення, що постачається з цією системою.

Фактично ці пристрої є вже не засобом зберігання інформації, а рішенням з управління та віртуалізації даних, представляючи собою комплексне рішення, що виходить за рамки організації простого зберігання інформації.

Дане обладнання поставляють провідні виробники HDS, HP, IBM, EMC, SUN. (На малюнку Hitachi USP V).

Кілька слів про RAID – масивах

RAID (англ. redundant array of independent / inexpensive disks) надлишковий масив незалежних / недорогих жорстких дисків – матриця з декількох дисків керованих контролером, взаємопов’язаних швидкісними каналами і сприймаються як єдине ціле. Залежно від типу використовуваного масиву може забезпечувати різні ступені відмовостійкості та швидкодії. Служить для підвищення надійності зберігання даних та / або для підвищення швидкості читання / запису інформації (RAID 0).

RAID 0

RAID 0 («Striping») являє собою дисковий масив з 2 або більше дисків, в якому інформація розбита на блоки Аnі послідовно записана на жорсткі диски. Відповідно інформація записується і читається одночасно, що збільшує швидкість.

На жаль, при відмові одного з дисків інформація необоротно втрачається, тому застосовується або в домашніх умовах, або для зберігання файлу підкачки, своп файлу.

RAID 1

RAID 1 (Mirroring – «віддзеркалення»). В даному випадку один диск повністю повторює інший, що гарантує працездатність при поломці одного диска, але обсяг корисного простору зменшується вдвічі. Оскільки диски купуються одночасно, у разі бракованої партії можлива відмова обох дисків. Швидкість запису приблизно дорівнює швидкості запису на один диск, можливо читання відразу з двох дисків (Якщо контролер підтримує цю функцію), що збільшує швидкість.

Застосовується найчастіше в малих офісах під бази даних, або для зберігання операційної системи.

RAID 5

RAID 5. В даному випадку всі дані розбиваються на блоки і для кожного набору вважається контрольна сума, яка зберігається на одному з дисків – циклічно записується на всі диски масиву (поперемінно на кожен), і використовується для відновлення даних. Стійкий до втрати не більше ніж одного диска.

RAID 5 має високі показники читання – інформація зчитується майже з усіх дисків, але зменшену продуктивність при записі – потрібно обчислювати контрольну суму. Але сама критична операція перезапис, так як вона проходить у кілька етапів:

Застосовуються при необхідності великого обсягу, і високої швидкості читання.

RAID 6

RAID 6 (ADG). Логічне продовження RAID 5. Відмінність полягає в тому що контрольна сума вираховується 2 рази, і, як наслідок має більшу надійність (стійкий при поломці більше 2 дисків), і меншу продуктивність.

 

RAID 10

RAID 10 (RAID 1 +0). Поєднує в собі принципи RAID 0 і RAID 1. При його застосуванні кожен жорсткий диск має свою «дзеркальну пару», при це використовується половина корисного об’єму. Працездатний поки існує один робочий диск з кожної пари. Найбільш високі показники запису / перезапису, порівнянні з RAID 5 по швидкості читання. Застосовується для зберігання баз даних, при високому навантаженні.

Дмитро Нечаєв

10/03.2009

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*