Служба індексування на кінчиках пальців

Кен Спенсер


Щоб уникнути втрати дорогоцінного часу і ресурсів, співробітникам компаній необхідно швидко і точно визначати місцезнаходження документів. При широкому використанні Microsoft Office, Web-документів, систем електронної пошти та інших інформаційних систем, можливість відстеження документів в різних системах має першорядне значення. Для вирішення завдання фахівці Microsoft вбудувала в Windows NT службу Index Server. Остання версія Index Server 2.0 для NT поставляється в пакеті NT 4.0 Option Pack. Вона перейменована в Indexing Service 3.0 і поставляється як частина Windows 2000.


Нова служба Indexing Service працює так. Після інсталяції Indexing Service знаходить системний каталог і будує свої каталоги, які містять індекси елементів файлової системи і інформацію про їх властивості. Програма періодично запускається для поновлення каталогів. Кожного разу, коли користувач виконує пошук в каталогах, пошуковий механізм задіює ці індекси.


За замовчуванням Indexing Service створює системний каталог (System catalog), який містить індекси всіх файлів на локальних дисках, за винятком тимчасових файлів і файлів змін (temporary Internet and history files). Якщо на даному сервері працює Microsoft IIS, то Indexing Service також створює каталог Web і індексує папки, які показані в Таблиці 1.


Фахівці Microsoft рекомендують на час роботи Indexing Service вимикати сканування вірусів. Тому, можливо, доведеться використовувати вірусний сканер, налаштований на роботу за розкладом, щоб він відключався, коли виконується процес індексування.


Indexing Service використовує механізми фільтрації для читання та обробки інформації з файлів та інших підсистем. Indexing Service включає в себе фільтри для MIME повідомлень, Microsoft Office, HTML і відкритих текстових файлів. Можна також розробити та встановити власні фільтри.


У процесі інсталяції Windows 2000 служба Indexing Service встановлюється автоматично (прапорець Indexing Service встановлений за замовчуванням). Для управління даною службою використовується утиліта Computer Management або оснастка (snap-in) Indexing Service консолі Microsoft Management Console (MMC). Для запуску Indexing Service вибирається меню Start \ Programs \ Administrative Tools \ Computer Management. У папці Services and Applications потрібно клацнути правою кнопкою на папці Indexing Service і вибрати Start. Після запуску Indexing Service буде сканувати систему і готувати каталог за замовчуванням. Цей процес вимагає часу, так як дана служба сканує і читає файли; при цьому жорсткий диск або диски в системі відчувають сильне навантаження.


Після завершення процесу індексування користувачі можуть задіювати один з декількох інтерфейсів і методів пошуку об’єктів. Коли можливо, функція пошуку з меню Start буде використовувати індексні каталоги. Користувачі також можуть задіяти Web-форму або користувальницький додаток для виконання запитів. Для програми розробнику просто потрібно додати запит, який зможе обробити Indexing Service. Для виконання запиту адміністратор може використовувати сторінку Query the Catalog у MMC для будь-якого індексу в папці Indexing Service. Користувальницький додаток може точно вказати конкретний каталог для запиту.


Створення каталогів


Модулі snap-in в MMC можна застосувати для створення каталогів. Користувальницькі каталоги потрібні в тих випадках, коли необхідно створити індекс, який представляє підмножину або надмножество файлів або даних. Припустимо, необхідно створити каталог усіх інженерних документів організації, пов’язаних з розробкою. Потрібно тільки сформувати новий каталог і налаштувати його для індексування того каталогу, який містить відносяться до розробки документи.


При створенні каталогу необхідно вказати його ім’я і папку, де він буде зберігатися. Зберегти цю папку можна на будь-якому локальному диску. Щоб не виникло плутанини, для цієї папки слід використовувати ім’я, яке вказувало б на її зміст. На Малюнку 1 показана папка IndexingServiceCatalogs, яку я використовую для зберігання каталогів.


Для створення каталогу потрібно натиснути правою кнопкою мишки на папці Indexing Service в Computer Management, вибрати New Catalog, ввести ім’я каталога, вибрати папку для каталогу, потім зупинити і перезапустити службу. Останній крок необхідний, тому що програма додає каталог тільки після рестарту служби.


Після створення каталогу додають підкаталоги або інші об’єкти, пошук по яким будуть виконувати користувачі. Можна динамічно додавати підкаталоги каталогу під час роботи служби. Для додавання підкаталогу в каталог слід натиснути правою кнопкою мишки на папці каталогу і вибрати New, Directory із контекстного меню. Потім потрібно задати шлях до директорії або ввести UNC-ім’я і натиснути OK. Якщо каталог, до якого йде звернення, вимагає авторизації, то необхідно ввести ім’я користувача і пароль. Indexing Service підтримує і використовує систему безпеки Windows 2000, тому дана служба не буде реєструвати у своєму файлі результатів відсутність у користувача прав доступу.


Після додавання підкаталогу Indexing Service індексує його. NTFS використовує для файлів атрибут Update Sequence Number Changed, який дає службі можливість перевіряти лише змінені файли.


Можна індексувати і Web-файли. Для установки індексування Web слід натиснути правою кнопкою на каталозі, в який треба додати Web-індексування, вибрати Properties. У діалоговому вікні Properties потрібно вказати на закладку Tracking, потім зі списку WWW Server вибрати Web-сервер, який потрібно проіндексувати. На На Малюнку 2 показано, що зі списку WWW Server обраний сервер Default Web Site. Після вибору Web-сервера слід натиснути OK і перезапустити Indexing Service. Після цього служба почне «підключати» елементи Web-вузла, як показано на Малюнку 3 . Видно, що каталог KensDocs містить папку My Documents, і служба підключає всі віртуальні каталоги з сервера Default Web Site. Не розміщуйте каталог пошуку для Web-сервера в кореневому каталозі Web сервера (Web root) або у віртуальному каталозі, тому що IIS може заблокувати каталог і перешкодити оновленню.


Службу індексування можна використовувати і для формування анотацій документів. Якщо виконати пошук, наприклад за http://www.microsoft.com, В результаті буде створена анотація. Кожен документ в списку результатів містить короткий опис. Щоб Indexing Service початку генерувати анотацію, треба відкрити діалогове вікно Properties для даного каталогу, вибрати закладку Generation, потім вибрати опцію Generate Abstracts. За замовчуванням максимальний розмір анотації становить 320 символів. Можна змінити цю величину в полі Maximum size на вкладці Generation. За замовчуванням кожен каталог успадковує свої властивості від Indexing Service. Для установки конкретних властивостей потрібно зняти для даного каталогу прапорець Inherit above settings from Service на вкладці Generation.


За допомогою модуля Indexing Service в MMC каталоги можна і видаляти. Щоб видалити каталог, слід зупинити Indexing Service, вибрати каталог, натиснути кнопку Delete і перезапустити службу.


В MMC можна також проводити пошук по каталогу. Відкрийте закладку Query the Catalog і введіть запит. Ця функція проводить тестування і шукає об’єкти в каталозі, поки йде робота з каталогом. При спробі послати запит до каталогу до запуску Indexing Service буде виведено повідомлення про помилку – Service is not running.

Індексування файлів

Одним важливим, але залишилися без уваги аспектом використання служби індексування є індексування властивостей файлу. Для індексування якого-небудь документа Indexing Service переглядає властивості файлу, і для їх коректного читання творець файлу або той, хто працює з ним, повинен заповнити властивості цього документа. Для додавання властивостей в офісний документ користуються діалоговим вікном Properties з меню File. Для того щоб діалогове вікно автоматично з’являлося при збереженні нового документа, слід вибрати в Microsoft Word меню Tools, потім Options, закладку Save, і встановити прапорець Prompt for document properties. Місцезнаходження даної настройки різному для різних офісних додатків.


Для Web-файлів, користувач, який створює файл, повинен забезпечити відповідні метатеги (meta tag), щоб служба індексування могла правильно зібрати дані. Indexing Service використовує кілька метатегів, показаних в Таблиці 2., Які відповідають властивостям файлів. При бажанні можна пошукати в Internet вузли, які надають інформацію про HTML meta tag.

Розробка додатків.

Розробники програмного забезпечення можуть створювати додатки, які по-різному взаємодіють з Indexing Service. Можна написати фільтруючі програми (filter applications) або ж створити додатки, які використовують можливості даної служби по обробці запитів. Такі додатки забезпечують простий інтерфейс, за допомогою якого користувачі можуть виконувати пошук безпосередньо з додатку.


Технічна документація Microsoft Developer Network (MSDN) надає інформацію про розробку додатків для Indexing Service. У главі Programming for Indexing Service розділу MSDN Platform SDK показано, як реалізувати завдання служби Indexing Service на різних мовах програмування.


Indexing Service – корисний інструмент, що забезпечує доступ до різних типів документів. Інтеграційна спроможність даної служби дозволяє додавати пошукові можливості в будь-який додаток. Розробники Microsoft зробили дану службу в Windows 2000 більш простий у застосуванні, включивши її в стандартну комплектацію і інтегрувавши зі службою пошуку і файловою системою.


Кен Спенсер – Працює в навчальному центрі 32X Tech, який проводить семінари для професіоналів по пропонованих корпорацією Microsoft технологіям розробки і SQL Server. Кен є автором та співавтором низки книг, включаючи “OLE Remote Automation with Visual Basic”, “Client / Server Programming with Microsoft Visual Basic” і “Inside Visual InterDev”, випущених видавництвом Microsoft Press. З ним можна зв’язатися по адресою: kenspencer@32x.com

Врізки:

  • os291_1
  • os291_2

    Схожі статті:


    Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

    Коментарів поки що немає.

    Ваш отзыв

    Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

    *

    *