Новий компонент Windows 7 – Windows TIFF IFilter, Windows, Операційні системи, статті

Введення


Windows TIFF IFilter надає можливість пошуку документів TIFF заснованих на текстовому вмісті. При завантаженні Windows TIFF IFilter виконує оптичне розпізнавання символів (optical character recognition OCR), обробляючи зображення TIFF, а потім надає отриманий текст для побудови пошукового індексу.


Windows TIFF IFilter виконує пошук тих документів, які містять ясно розпізнається текст (наприклад, чорний текст на білому фоні) і менш успішний для документів, які містять змішане вміст (Наприклад, нестандартні шрифти або текст, що містить малюнки). Зображення низької якості і змішані мови можуть негативно впливати на обробку OCR. В цьому випадку якість пошукових результатів знижується.


Windows TIFF IFilter підтримує всі документи TIFF, які визначені специфікаціями Adobe TIFF Revision 6.0 і включають найпоширеніші формати, наприклад, LZW, JPG, CCITT v4, CCITT v6, а також стиснені формати.


Оскільки OCR – дія, яка споживає багато часу, Windows TIFF IFilter не встановлюється за умовчанням на операційних системах Windows 7 і Windows Server 2008 R2 і файли TIFF індексуються, грунтуючись на базових властивостях файлу (наприклад, ім’я файлу, розмір і дата зміни). Користувачі, яким необхідно шукати файли TIFF грунтуючись на текстовому вмісті, можуть встановити Windows TIFF IFilter за допомогою поточного керівництва.


У цьому керівництві описуються способи установки компонента Windows TIFF IFilter та його використання в Windows Desktop Search.



Установка Windows TIFF IFilter в Windows 7


Для установки Windows TIFF IFilter в Windows 7 виконайте наступні дії:



  1. Натисніть на кнопку “Пуск” для відкриття меню, відкрийте “Панель управління”, Зі списку компонентів панелі управління виберіть “Програми та компоненти”. Перейти за посиланням “Включення або відключення компонентів Windows”.

  2. *


  3. Встановіть прапорець на опції “Фільтр Windows TIFF IFilter”

  4. Натисніть на кнопку “ОК”.

  5. *


    Після того, як ви завершите ці три кроки, нові TIFF зображення, які додаються в директорії, будуть індексуватися за своїм вмістом. Якщо в індексованих директоріях вже присутні TIFF зображення, вони не будуть проіндексовані до тих пір, поки користувач не відновить індекс, як описано нижче. Для цього:



    1. Натисніть на кнопку “Пуск”, Введіть “Параметри індексування” в поле пошуку меню “Пуск” і натисніть на клавіші ENTER.

    2. Натисніть на кнопку “Додатково”, А потім виберіть команду “Перебудувати”.


Налаштування Windows TIFF IFilter



Установки бажаних мов для оптичного розпізнавання символів


Ця настройка дозволяє вам вибрати мови розпізнавання тексту, які належать до однієї з підтримуваних кодових сторінок. Якщо цей параметр активний, то вибрані мови використовуються при виконанні розпізнавання тексту в ході індексування TIFF-файлів. До тих пір, поки мова системи, що використовується за умовчанням, не буде обраний в якості мови розпізнавання тексту, він буде ігноруватися. Якщо цей параметр політики відключений або не заданий, використовується тільки мову системи, що використовується за умовчанням.


Всі вибрані мови розпізнавання повинні належати одній кодовій сторінці. Якщо вибрані мови, що належать різним кодовою сторінкам, використовується тільки мову системи, вибраний за замовчуванням, а все інші мови ігноруються.


Установка бажаних мов OCR



  1. Відкрийте “Редактор локальної групової політики”. Для цього натисніть на меню “Пуск”, Введіть gpedit.msc в текстовому полі пошуку меню “Пуск” і виберіть об’єкт зі списку знайдених результатів.

  2. Розгорніть папку “Конфігурація компьютераАдминистративные шаблони”.

  3. Розгорніть папку “Компоненти WindowsНайтіРаспознаваніе тексту”.

  4. Два рази клацніть на “Виберіть мови розпізнавання тексту з кодової сторінки”.

  5. Виберіть опцію “Включити” для вибору одного чи більше мов.

  6. Натисніть на кнопку “ОК”.

Або скористайтеся твіков реєстру (наприклад, Кирилиця 1251 – Російська та Українська мови):

Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINESOFTWAREPoliciesMicrosoftWindowsWindows SearchOCR]
“SelectOCRLangs”=dword:00000001
“Russian”=dword:00000419
“Ukrainian”=dword:00000422


Примусове розпізнавання оптичних символів для кожної сторінки зображення документів TIFF


Ця настройка дозволяє вам відключити оптимізацію продуктивності. При відключенні оптимізації продуктивності фільтр TIFF IFilter виконує розпізнавання кожної сторінки в документі TIFF, що дозволяє індексувати весь розпізнаний текст. За замовчуванням, для оптимізації продуктивності при розпізнаванні фільтр TIFF IFilter пропускає сторінки документа, які містять нетекстові вміст (наприклад, зображення). У деяких випадках сторінки з текстом можуть неправильно класифікуватися, наприклад як сторінки без текстового вмісту, а значить, текст на цих сторінках не індексується.



  1. Відкрийте “Редактор локальної групової політики”. Для цього натисніть на меню “Пуск”, Введіть gpedit.msc в текстовому полі пошуку меню “Пуск” і виберіть об’єкт зі списку знайдених результатів.

  2. Розгорніть папку “Конфігурація компьютераАдминистративные шаблони”.

  3. Розгорніть папку “Компоненти WindowsНайтіРаспознаваніе тексту”.

  4. Два рази клацніть на “Використовувати фільтр TIFF IFilter при розпізнаванні тексту для кожної сторінки документа TIFF”.

  5. Виберіть опцію “Включити” для вибору одного чи більше мов.

  6. Натисніть на кнопку “ОК”.

Або скористайтеся твіков реєстру:

Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINESOFTWAREPoliciesMicrosoftWindowsWindows SearchOCR]
“OCREveryPage”=dword:00000001

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*