Прості ідеї нейронного пошуку

Андрій Іванов, AKWProject

Пролог

Слова "нейронний пошук" у
більшості людей, як правило, асоціюються з
нейрокомп'ютера, нейроалгорітмамі і якимись
високими технологіями. Причиною тому
усталена зв'язок між словом "нейронний" і
ідеями математичних моделей, розроблених
Тейво Кохоненом і його послідовниками. Ідеї
"Нейропоіска", що пропонуються компанією "Нейрон
РУ "(http://mynameis.narod.ru), не
мають нічого спільного з моделями Кохонена, а суть
їх ясна і дитині. Система дуже проста, дивіться
самі.

Скільки питань задають
люди?

Російська пошукова система Яndex
щодня обробляє приблизно 60 тисяч
запитів користувачів. Як ви думаєте, всі ці
запити – різні? 365 днів на рік по 60 тисяч
запитів на день, це майже двадцять два мільйони
запитів на рік. І серед них немає жодного, який
в точності повторився хоча б один раз? Є,
звичайно.

Серед запитів є такі,
які щодня повторюються сотні разів. А є
запити, що зустрічаються, в середньому, п'ять разів на
день, три рази, один раз на тиждень і так далі.
Іноді запит виглядає так: "юПРЮЛНМНБЮ
бЮКЕМРХМЮ ", але може і ось так:" Список
автомобільних фірм Москви ". Ви легко можете
побачити, як виглядають запити, глянувши на
сторінку "Прямого Ефіру" Яндекса
(Http://www.yandex.ru/last20.html), вона виводить 20 останніх
запитів до системи. Дивимося: є формулювання
запиту, є стрілка, яка пропонує
"Перезадать" запит системі і є цифра,
показує кількість відповідей системи на
даний запит. Одного немає – частоти, інформації про
те, як часто люди задають системі це питання.

Що нам дає інформація про
частоті?

Припустимо, хтось по секрету вам
шепнув, що запит "фото кленового листа"
щодня повторюється в середньому 5,2 рази. Зірвати
лист, відсканувати його, створити сторінку,
розмістити на безкоштовному хості,
спозиціонувати в пошукову систему і
поставити три платних банера – все цій займе
у вас максимум пару годин. Ефект: 365 х 5,2 = 1998,
майже дві тисячі показів на рік помножимо на один
долар за тисячу і на три банери. Отримали $ 6 на
рік.

Доведемо ситуацію до маленького
абсурду. 42 робочих години на тиждень ділимо на два
години, витрачених на "проект" і множимо на 52
тижня в році. Отримали 1092 "реалізованих
проекту ", кожен з яких принесе на рік за $ 6. У
сумі – $ 6552, або по п'ятсот з гаком баксів на місяць.

Подумаємо разом, а що тут
абсурдного? П'ять відвідувачів на день – це дуже
невисока цифра, таких сторінок в Мережі сотні
тисяч. Дані за часом, цінами і термінами
виконання стандартні. Хостинг, дійсно,
безкоштовний. Роби і роби собі "фото кленового
аркуша "," фото динозавра "," фото Володимира
Ворошилова "," список автомобільних фірм
Москви "," кращі mp3 сайти "," купуємо
полімери "," реферати з політології "," кактус
велика квітка "," оренда нежитлових приміщень у
Москві "," зображення градусника ",
"Квартирне трифазний введення" і т.п. Все це
абсолютно реальні запити користувачів і вони
повторюються. У чому проблема?

Немає інформації про
затребуваності відповідей на дані запити, і ви
не зможете розрахувати свій бізнес, а наосліп
працювати нерозумно – от і вся проблема. Одним з
головних принципів нейронної пошукової системи
є повна відкритість інформації про
частотах і формулюваннях запитів, в ній ви
отримаєте цю інформацію.

Як відповідати на запитання?

Задамо Яндексу вже відомий
питання: "Список автомобільних фірм Москви".
Перше посилання на сервер "Бізнес-Волга"
відкривається словами "список автомобільних фірм
Тольятті ". Дивно … Запитаємо у Апорту … ще більше
дивно: на першій позиції "Техмаркетс
Компьютерс – комп'ютери, периферія,
комплектуючі ".

Ви зрозуміли запитання? Так. Можете
відповісти? Ні, якщо у вас, звичайно, немає цього
списку. Тому і не відповідаєте. А пошукова
система запит не зрозуміла, це очевидно, але
"Відповіла". Обговорення питання, чому іноді
індексує Пошукова система (Яндекс, Апорт,
Альтависте та ін) відповідає абсолютно точно,
іноді "в молоко", а найчастіше –
приблизно, у завдання цієї статті не входить.
Нейронна Пошукова система завжди відповідає
точно, тому що на будь-який запит відповідає не
"Система", не алгоритм, а живий, реальний
людина, яка бачить запит, розміщуючи в системі
посилання на веб-сторінку з відповіддю. А що
відбувається, коли система не знає точного
відповіді на запит? Нічого особливого, немає відповіді –
і все. Іноді краще не відповідати, ніж відповідати
невпопад.

Для того, щоб нейронна система
знала, що відповідати на якийсь запит, її треба
навчити. Загальна схема цього процесу така:
перший користувач вводить новий запит, відповіді
на нього ще немає; перший експерт бачить
незареєстрований запит і реєструє його,
тобто ставить посилання на сторінку, де знаходиться
відповідь. Другий користувач вводить точно такий же
запит і отримує відповідь першого експерта –
посилання та анотацію (запрошення відвідати
сторінку). Інші експерти теж можуть
реєструвати даний запит на свої варіанти
відповідей, але суть в тому, що будь-яку кількість
відповідей завжди концентрується навколо
одного-єдиного унікального запиту.
Відома перша фраза з пісні Фредді Меркюрі
"I want to ride my bicycle" не дорівнює другій фразі тієї ж
пісні того ж співака "I want to ride my bike" – для
нейронної системи це два РІЗНИХ запиту. І
система, отримавши запит користувача "I want to ride my
bike "стане шукати відповіді ТІЛЬКИ на цей запит і
ні на який інший, навіть на "I want to ride my bicycle". Так
треба.

Сказане називається принципом
повної ідентифікації, і повну теорію цього
питання я тут не розбираю.

Скільки ж може бути
запитів?!

Багато. І навіть дуже багато – сотні
мільйонів на мільйони різних тем. Але ж, коли
ви звертаєтеся в пошукову систему, вас же не
цікавлять усі теми одночасно. Цікавить
одна, і ви формулюєте свій запит, як умієте.
Це, до речі, теж одна з особливостей нейронних
пошукачів: у користувача немає ніяких
обмежень у виборі формулювання запиту – як
розумієш, що тобі треба, то й пиши.

Але ось в області однієї теми
кількість можливих формулювань запитів
різко обмежено і, як правило, не перевищує
сотні, а найбільш частими є від однієї до
п'яти-шести залежно від теми. Обмеження це
не системне, і не обумовлене якимись
штучними правилами складання запитів,
просто нормальна людина не стане придумувати
якусь дуже незвичну формулювання, а
кількість звичайних невелика. Ось що я мав на
увазі, говорячи про "обмеженості" кількості
формулювань.

Скільки людей повинні
відповідати на запити і навіщо?

При слові Експерт (див. трохи вище)
представляється досить мастита особистість, "весь
покритий зеленню "із зображеннями американських
президентів, отриманої в якості гонорарів за
послуги. І скільки ж треба таких експертів і грошей
на зарплату їм, щоб навчити нейронну систему
відповідати на сотні мільйонів запитів? Можна
підрахувати практично з точністю до одного:
кількість експертів нейронної пошукової
системи дорівнює кількості вебмайстрів,
підтримують сайти в Інтернеті. Експерт,
реєструючий посилання на сторінки сайту – це
вебмайстер цього сайту. А навіщо йому це треба –
реєструвати посилання на свій сайт, писати
анотації, відбирати запити? ..

Зустрічне запитання: а навіщо йому
треба вміти заповнювати мета теги, знати основи
позиціонування в індексується пошукових
системах і реєструвати в них свій сайт, навіщо
ставити посилання в каталогах, брати участь у
банерообмінних мережах, обмінах посиланнями,
розсилках, форумах? Нормальний майстер все це
робить – навіщо? От ви самі і відповіли на запитання.

Процедура відбору та реєстрації
запитів в нейронній системі набагато простіше і
швидше, ніж техніка позиціонування по
ключовими словами і заповнення Метатег в
індексуючих пошукових системах.

Що в результаті?

Дуже красива система в підсумку
виходить. Користувачі задають питання, а
вебмайстра (плюс розробники, автори,
контент-провайдери, дизайнери, програмісти і
ін) на них відповідають. Користувачі запитують, що
хочуть, а професіонали бачать, що потрібно
користувачам, і керуються цими знаннями
у своїй роботі. Все, як у житті: попит –
пропозиція. Будь-який запит, і практично завжди
точну відповідь, повну відповідь, осмислену відповідь.

Такий завтрашній день пошуку в
Мережі.

Запрошення до діалогу

Більш повну інформацію про ідеї
нейронної організації інформації, пошуку,
конкуренції посилань, поділі баз даних і
організації циклів, частотної та комерційної
підсистемах реєстрації, протистоянні
тенденції лаконізму і "закону Бредбері",
системі пошуку по масці в запитах і анотаціях,
принципи реклами в нейронних системах,
універсальності системи для будь-якої зони Мережі,
механізмах окупності і прибутковості проекту і
ряді інших питань ви можете дізнатися на сайті
фірми "Нейрон РУ" (http://mynameis.narod.ru)
– Піонера в області розробки систем нейронного
пошуку.

Задавайте свої питання, відповіді
будуть.


Андрій Іванов,
керівник команди розробників проекту Neiron.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*