Черговий снепшот технології баз даних

24-25 квітня 2008 р. в Червоному залі Президії РАН відбулася чергова технічна конференція "Корпоративні бази даних". Конференція проводилась за підтримки Російського фонду фундаментальних досліджень. Генеральним спонсором конференції була компанія Microsoft, спонсором – компанія Intersystems, і партнером – компанія Релекс. Склад учасників був дуже строкатим: представники великих комерційних компаній, державних установ, військових організацій, ВНЗ "ів і дослідницьких інститутів з Центрального регіону, Уралу, Сибіру, Далекого Сходу, України, Казахстану, Латвії і т.д.

За два дні роботи конференції на ній було зроблено 17 доповідей фахівцями компаній Microsoft, Oracle, IBM, Intersystems, Релекс, MySQL, Айбейс, Російської групи PostgreSQL, Інституту системного програмування РАН, Санкт-Петербурзького державного університету. У доповідях обговорювалися особливості нових продуктів і технологій, підходи до розробки та налаштування додатків, перспективи розвитку технологій засобів управління даними та їх аналізу.

24 квітня перші два доповіді були присвячені новій версії одного з провідних продуктів компанії Microsoft – SQL Server 2008. Доповідь "Microsoft SQL Server 2008: огляд продукту" представив Андрій Хромов. Новий випуск MS SQL Server офіційно оголошений (у Росії – 18 березня 2008 р. на конференції "Герої серед нас", але реально система з'явиться у вигляді продукту тільки в третьому кварталі.

У доповіді основні нові можливості SQL Server 2008 були згруповані в чотири класи: (1) можливості, що підтримують використання MS SQL Server в якості корпоративної платформи даних; (2) можливості, розширюють межі використання MS SQL Server як тільки реляційної платформи, (3) кошти динамічною розробки додатків і (4) нові можливості бізнес-аналізу. До першого класу відносяться можливості прозорого шифрування даних, зовнішнього управління ключами, аудиту даних, дзеркалювання баз даних, оптимізації продуктивності системи, забезпечення передбачуваного рівня продуктивності, управління інфраструктурою баз даних на основі політик. Другий клас нових можливостей забезпечується за рахунок підтримки технології FILESTREAM (робота з зовнішніми файлами засобами СУБД), довгоочікуваних типів даних Data / Time, нових засобів повнотекстового пошуку, типів даних GEOMETRY і GEOGRAPHY. Третій клас спирається, головним чином, на технологію LINQ, що забезпечує засоби створення додатків баз даних в термінах бізнес-об'єктів (іншими словами, підтримуючу єдині засоби об'єктно-реляційного відображення для всіх мов платформи. NET). Нарешті, засоби бізнес-аналізу SQL Server 2008 у багатьох відношеннях перевершують відповідні кошти SQL Server 2005, і їх огляду був присвячений окремий доповідь 25 квітня.

Доповідь Кирила Панова "Microsoft SQL Server 2008: нові засоби безпеки та управління" був присвячений двом темам: прозорого шифрування і засобів управління на основі політик. Фактично, більш докладно, з демонстраціями конкретних варіантів використання обговорювалися дві нові можливості SQL Server 2008.

Марк Рівкін (Oracle) цього року відійшов від традиції розповідати про основні рисах нових випусків СУБД Oracle і виступив з найбільш широким доповіддю "Тенденції розвитку комерційних СУБД", у якому спробував узагальнити тенденції, властиві продуктам основних постачальників СУБД. Він виділив 13 таких тенденцій: віртуалізація ресурсів і GRID-технології; ILM (Information LifeCycle Management) в СУБД; самоврядування, самодіагностика, самолікування; Real Application Testing – механізми промислового тестування версій і змін; вдосконалення архітектур максимальної доступності, мінімізація часу планових простоїв, модифікація додатків і версій СУБД; включення вимірювання часу в СУБД; нові типи даних (XML, RFID, Semantic Web, геном, медицина, швидкі LOB і т.д.); розумні механізми стиснення та усунення надмірності; удосконалення захисту даних (Data Vault, Audit Vault, Access & Identity); спотворення даних; СУБД реального часу з підтримкою баз даних в основній пам'яті як кеш для комерційних СУБД; інтеграція даних, універсальні і спеціалізовані підходи (динамічні DW, BDW – Banking Data Warehouse); включення баз даних у простір пошуку пошукових систем. Важко сказати, наскільки ці тенденції дійсно виявляться єдиними для всіх SQL-орієнтованих СУБД, але, схоже, що це певний варіант дорожньої карти компанії Oracle.

З абсолютно несподіваним для публіки доповіддю "IBM Information Management: побудова високопродуктивних OLTP систем" виступив Григорій Власов (IBM). Він сказав, що для компаній, які потребують схерхпроізводітельних системах категорії OLTP (таких компаній небагато в усьому світі і поки немає в Росії), не годяться SQL-орієнтовані СУБД. На його думку, для таких систем підходить лише найстаріша СУБД компанії IBM IMS, функціонуюча на потужних мейнфреймах. Хоча IMS має майже 40-річну історію, в даний час це сучасна і потужна система, в якій історично підтримується ієрархічна модель даних. За словами пана Власова, зараз IMS – це і краща в світі XML-СУБД, оскільки ієрархічна модель даних ідеально відповідає моделі XML, і для IMS є повна і ефективна реалізація XQuery. На питання, яке ж місце він відводить DB2, Григорій Власов відповів, що DB2 повинна підтримувати сховища даних та аналітичну обробку. Доповідь породив в умах учасників конференції масу сумнівів і непорозумінь про подальшу стратегію компанії IBM в Росії. Втім, цілком можливо, що пан Власов висловив лише свою приватну точку зору, на користь чого, зокрема, говорить той факт, що він виступав без слайдів, і які-небудь документальні підтвердження його виступу відсутні.

Доповідь Бориса Єгорова (Intersystems) "Процес проектування інформаційних систем в постреляціонной СУБД Cache" був досить традиційним для фахівців цієї компанії. У СУБД Cache підтримуються чотири різновиди інтерфейсів з базами даних, доступні розробникам додатків: "природний" навігаційний інтерфейс на основі доступу до "глобальна" (B-деревам); об'єктно-орієнтований інтерфейс; SQL-інтерфейс і Web-інтерфейс. Кожен з цих інтерфейсів може виявитися кращим при розробці конкретного додатка, і в кожному випадку Intersystems надає відповідні інструментальні засоби.

У доповіді про СУБД Лінтер "Особливості роботи СУБД Лінтера в операційних системах реального часу", який цього року представляв Михайло Єрмаков, дійсно порушувалися тільки ті риси системи, які пов'язані з її використанням у системах (м'якого) реального часу. Вражає, що на сьогоднішній день СУБД Лінтер працює в середовищі операційних систем QNX 4 і QNX 6, VxWorks, ОС РВ, ОС / 9, OS9000, Windows CE, Linux. У системі підтримується ряд спеціальних властивостей, що сприяють досягненню характеристик реального часу в додатках: асинхронний виклик операцій SQL, секціонування даних, пріоритетність запитів і т.д. Г-н Єрмаков також розповів про плани компанії Релекс по повній, хоча і поступової переробки ядра СУБД Лінтер з використанням принципів мікроядра.

Три останні доповіді 24-го квітня присвячувалися СУБД категорії open source. З доповіддю "Firebird в 2008 році: еволюція чи революція" традиційно виступив Дмитро Кузьменко. В еволюції системи автор відніс вихід у першому кварталі 2008 р. версії системи 2.1, в якій підтримуються засоби моніторингу стану сервера, розширення SQL (Common Table Expressions, Replace / Merge), тимчасові таблиці, аутентифікація в стилі Windows, тригери рівня БД. Можливою революцією виявиться версія 2.5 (і наступна за нею версія 3.0), в якій очікується підтримка кешу бази даних з розміром більше 2 гігабайт; підтримка регулярних виразів в умовах розділу WHERE (SIMILAR); розширення списку 64-розрядних дистрибутивів для нових операційних систем; підтримка автономних транзакцій, гетерогенних запитів, архітектури СуперКлассік і т.д.

Дмитро Ленева (MySQL) виступив з доповіддю "Нове в MySQL 5.1 та 6.0". Основними напрямами розробки версії MySQL 5.1, випуск якої намічений на другий квартал 2008 р., доповідач вважає засоби, що полегшують адміністрування баз даних: розподіл даних (partitioning), диспетчер подій, нові засоби аудиту, поліпшені можливості підтримки високого рівня доступності (в тому числі, можливість збереження частини даних у кластерному варіанті MySQL на диску) і нові засоби маніпуляції даних (повнотекстовий пошук, підтримка XPath для доступу до XML-даними). У версії 6.0, випуск якої планується на четвертий квартал 2008 р., буде присутня можливість використання нової підсистеми управління зберіганням і транзакціями Falcon. Ця підсистема забезпечує управління ACID-транзакціями на основі підтримки версій, добре масштабується на багатоядерних архітектур та для деяких класів застосувань є більш ефективною, ніж InnoDB. Крім того, у версії 6.0 повинна бути реалізована можливість оперативного резервного копіювання баз даних і поліпшені засоби оптимізації запитів.

Доповідь "Що нового в PostgreSQL 8.3 та інші новини" представляли Микола Самохвалов і Олег Бартунов. Г-н Самохвалов розповів про основні нові можливості PostgreSQL 8.3. Він виділив чотири категорії нововведень, що відносяться, відповідно, до продуктивності системи, розробці додатків, адміністрування баз даних і проектам-супутникам. Продуктивність системи вдалося суттєво підвищити за рахунок нової реалізації операції UPDATE, що не вимагає модифікації індексів, ключі яких не змінюються; введення асинхронного режиму фіксації транзакцій; "згладжування" операції установки контрольної точки; появи можливості синхронного сканування однієї і тієї ж таблиці декількома транзакціями і т.д. Для розробників додатків у версії 8.3 підтримуються поліпшені можливості повнотекстового пошуку; введений тип даних XML та забезпечується підтримка XPath; реалізовані оновлювані курсори, табличні функції й т.д. У допомогу адміністратору з'явилася можливість автоматичного видалення з бази даних усіх об'єктів, що належать даному користувачеві, якщо сам користувач видаляється з системи. Нарешті, серед проектів-супутників Микола відзначив ряд засобів, розроблених компанією Skype. Про інші новини, які стосуються PostgreSQL, і плани на майбутнє розповів Олег Бартунов. Учасників конференції дуже зацікавила новина про реалізацію компанією EnterprizeDB, яка цього року отримала солідне фінансування від компанії IBM, open source системи GridSQL, що є масивно-паралельних (sharing-nothing) варіантом PostgreSQL. Г-н Бартунов розповів про очікувані можливості PostgreSQL 8.4, випуск якої планується на початку 2009 р.

Другий день роботи конференції також почався з двох доповідей представників компанії Microsoft. Андрій Хромов виступив з доповіддю "SQL Server 2008 BI:" Швидше, вище, сильніше "". Г-н Хромов показав загальний стек рішень бізнес-аналітики компанії Microsoft і відзначив, що в основі платформи BI SQL Server 2008 лежать служби інтеграції даних, звітності та аналізу даних. У службі інтеграції даних SQL Server 2008 забезпечуються поліпшені можливості виконання процедури ETL шляхом ідентифікації потрібних даних у великих таблицях, зниження обсягу переданих даних за рахунок передачі тільки змінених даних, профілювання інформації для виявлення "брудних" даних. Спеціальним чином оптимізуються запити до сховищ даних. У службі звітності з'явилися новий дизайнер звітів, масштабований процесор звітів, можливість відображення і генерації звітів у Microsoft Word, покращена можливість їх відображення і генерації в Microsoft Excel і т.д. З приводу служби аналізу даних було показано запис ефектною презентації, озвученої Олексієм Шуленін на конференції "Герої серед нас" у березні 2008 р.

Андрій Прохоров виступив з доповіддю "PerformancePoint Server – центр управління ефективністю бізнесу". Microsoft Office PerformancePoint Server – це програма для управління ефективністю роботи компаній, дозволяє більш обгрунтовано приймати бізнес-рішення та здійснювати більший контроль за бізнес процесами. Додаток забезпечує необхідні засоби для управління і контролю ефективності роботи компанії, включаючи карти показників ефективності (scorecards), інструментальні панелі (dashboards), управлінську звітність, аналітику, засоби планування, бюджетування, прогнозування та консолідації. PerformancePoint Server дозволяє будувати прогнози, здійснювати планування і бюджетування, а також проводити оперативний моніторинг поточних показників і порівняння запланованої і фактично досягнутої ефективності.

Доповідь "Стратегія і продукти Oracle в області бізнес-аналізу" представила Ольга Горчинська. Як і компанії Microsoft, гаслом BI-напрямку Oracle є "Pervasive BI ", що пані Горчинська перекладає як" BI для всіх ". Аналітична платформа Oracle тепер представляється у вигляді трьох шарів, нижнім з яких є шар сховищ і вітрин даних, середнім – шар інструментів бізнес-аналізу та верхнім – шар додатків управління ефективністю бізнесу і додатків BI. У своєму виступі Ольга практично не стосувалася верхнього рівня, відзначивши лише, що додатки управління ефективністю бізнесу майже цілком взяті Oracle з продуктів придбаній нею в минулому році компанії Hyperion. Що стосується нижчого шару, основну роль у ньому відіграє СУБД Oracle 11.g, в якій підтримуються нові засоби підвищення продуктивності та рівня масштабованості, забезпечується ряд нових і дуже потужних аналітичних функцій і підтримуються розвинені вбудовані засоби інтелектуального аналізу даних (data mining). Для ефективної підтримки OLAP Oracle покладає великі надії на сервер багатовимірних даних Hyperion Essbase, що є тепер власністю компанії Oracle. Основою середнього шару платформи є Siebel Analytics Server, який перейшов у власність компанії Oracle після придбання нею компанії Siebel.

Євген Велесевіч (Cognos) виступив з доповіддю "Єдиної інформаційно-аналітична система організації на платформі IBM Cognos 8 Business Intelligence". Відомо, що на початку цього року компанія Cognos була поглинена компанією IBM, і учасники конференції очікували почути в цій доповіді якісь новини про майбутнє основного продукту Cognos і перспективи його інтеграції з продуктами IBM. Проте пан Веселевіч заявив, що Cognos настільки активно контактувала з IBM протягом багатьох років, що їм немає чого інтегруватися, і що об'єднання вплине тільки на стратегію розповсюдження і продажів продукту. Фактично, доповідь Євгена Веселевіча виявився повторенням минулорічної доповіді про Cognos 8 Business Intelligence, зробленого на конференції минулого року Андрієм Ведешіним з Robertson & Blums Corporation.

Андрій Грачов зробив доповідь "Нові можливості BI в СУБД Cache". Свою доповідь пан Грачов почав з того, що на ринку практично не залишилося незалежних постачальників рішень BI та ETL. На його думку, підтверджує думку аналітиків, це позбавляє споживачів можливостей створення кінцевих аналітичних систем з найбільш відповідних для них компонентів. Далі Андрій перейшов до розповіді про рішення BI компанії Intersystems. На відміну від підходів інших компаній, це рішення грунтується на придбаній Intersystems системі DeepSee, виготовленої одним з партнерів Intersystems компанією Speedminer на основі СУБД Cache. Для зберігання багатовимірних кубів застосовується базова структура зберігання даних СУБД Cache на основі дерев. DeepSee можна буде використовувати безпосередньо з Cache або поверх інтеграційної платформи Ensemble. В останньому випадку для DeepSee будуть доступні всі можливості доступу до зовнішніх даних, підтримувані адаптерами Ensemble. Продукт DeepSee був неофіційно оголошений наприкінці березня на конференції InterSystems DEVCON2008, але дата його офіційного випуску, наскільки я розумію, поки не визначена.

Валерій Юдін у своїй доповіді "Система підтримки прийняття рішень для практикуючих лікарів" розповів про застосування технології виведення по прецедентах, застосованої при створенні системи "Супутник лікаря". При розгляді нового випадку система знаходить один або кілька схожих прецедентів і радить лікарю використовувати їх рішення, можливо, адаптувавши його до поточного нагоди. Після того, як даний випадок буде оброблений, він вноситься в базу прецедентів разом зі своїм рішенням для подальшого використання в майбутньому. На відміну від застосовуваних у медицині експертних систем, "Супутник лікаря" не нав'язує лікаря рішення, а лише рекомендує врахувати знайдені прецеденти.

На цьому частина другого дня роботи конференції, присвячена аналізу даних, була завершена, і зовсім на іншу тему перед учасниками виступив професор СПбДУ і консультант фінської компанії @ Business OY Борис Новиков, що представив доповідь "Практичні методи і прийоми налаштування додатків баз даних". Протягом багатьох років пан Новіков сам займається налаштуванням додатків баз даних з метою оптимізації їх продуктивності і збирається відомості про проблеми і вирішення, які використовували в інших компаніях. На думку Бориса, основні проблеми, пов'язані з продуктивністю додатків, виникають з недостатньої кваліфікації їх розробників, використання ними патернів об'єктно-орієнтованої розробки у випадках, для яких вони не були призначені. Дії, (ненавмисно) здійснюються розробниками для зниження продуктивності додатків баз даних, доповідач називає "пессимізації" додатків. На ряді прикладів у доповіді були продемонстровані прийоми оптимізації "пессімізірованних" додатків.

Нарешті, завершив конференцію ваш покірний слуга, який виступив з доповіддю "Криза технологій СУБД та шляхи його подолання".

В області СУБД має місце криза. "Безрозмірні" універсальні системи, що поставляються основними виробниками СУБД, з кожним випуском стають все більш складними. У кожному конкретному додатку використовуються частки відсотків функціональних можливостей цих систем. Складність стандарту мови SQL робить його незбагненним і практично не реалізованим.

Майкл Стоунбрейкера пропонує революційний шлях до подолання цієї кризи за рахунок переходу до спеціалізованих систем управління даними, орієнтованим на обмежені класи додатків.

Однак є сумніви в тому, що користувачі баз даних і розробники додатків дійсно бажають такої революції, а також у тому, що пропозиції та розробки Стоунбрейкера дійсно забезпечують реальну основу для революційних змін технології. Подробиці див в замітці "Універсальність і спеціалізація: час розбивати камені?".

Конференція пройшла як ніколи активно. Кожному доповідачу задавалася маса питань, і часу на Q & A не вистачало. Тим не менше, і доповідачі, і слухачі залишилися задоволені, але просили на наступній конференції більш правильно планувати час і, можливо, все-таки перейти до триденного формату конференції. Потрібно подумати … Можливо, я не дуже об'єктивний у своїй оцінці, але мені конференція дуже сподобалася. Навіть мені, хоча в цілому я знав, про що будуть говорити доповідачі, було дуже цікаво. Навіть мені, хоча я командував часом, цього часу на питання не вистачало. Навіть мені не вдалося добре поговорити ні з доповідачами, ні зі слухачами. Бог дасть, наступна конференція буде (ще) краще.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*