Прості ідеї нейронного пошуку, Різне, Інтернет-технології, статті

Андрій Іванов, AKWProject

Пролог

Слова “нейронний пошук” у більшості людей, як правило, асоціюються з нейрокомп’ютерів, нейроалгорітмамі і якимись високими технологіями. Причиною тому усталена зв’язок між словом “нейронний” та ідеями математичних моделей, розроблених Тейво Кохоненом і його послідовниками. Ідеї “Нейропоіска”, запропоновані компанією “Нейрон РУ “( mynameis.narod.ru ), Не мають нічого спільного з моделями Кохонена, а суть їх ясна і дитині. Система дуже проста, дивіться самі.

Скільки питань задають люди?

Російська пошукова система Яndex щоденно обробляє приблизно 60 000 запитів користувачів. Як ви думаєте, всі ці запити – різні? 365 днів на рік по 60 000 запитів в день, це майже двадцять два мільйони запитів на рік. І серед них немає жодного, який в точності повторився хоча б один раз? Є, звичайно.

Серед запитів є такі, які щодня повторюються сотні разів. А є запити, що зустрічаються, в середньому, п’ять разів на день, три рази, один раз в тиждень і так далі. Іноді запит виглядає так: “юПРЮЛНМНБЮ бЮКЕМРХМЮ “, але може і ось так:” Список автомобільних фірм Москви “. Ви легко можете побачити, як виглядають запити, глянувши на сторінку “Прямого Ефіру” Яндекса (Http://www.yandex.ru/last20.html), вона виводить 20 останніх запитів в систему. Дивимося: є формулювання запиту, є стрілка, що пропонує “Абоперезадани” запит системі і є цифра, показує кількість відповідей системи на даний запит. Одного немає – частоти, інформації про те, як часто люди задають системі це питання.

Що нам дає інформація про частоті?

Припустимо, хтось по секрету вам шепнув, що запит “фото кленового листа” щодня повторюється в середньому 5,2 рази. Зірвати лист, відсканувати його, створити сторінку, розмістити на безкоштовному хості, спозиціонувати в пошукову систему і поставити три платних банера – все цієї займе у вас максимум пару годин. Ефект: 365 х 5,2 = 1998, майже дві тисячі показів на рік помножимо на один долар за тисячу і на три банери. Отримали $ 6 в рік.

Доведемо ситуацію до маленького абсурду. 42 робочих години на тиждень ділимо на два години, витрачених на “проект” і множимо на 52 тижня в році. Отримали 1092 “реалізованих проекту “, кожен з яких принесе на рік за $ 6. В сумі – $ 6552, або по п’ятсот з гаком баксів на місяць.

Подумаємо разом, а що тут абсурдного? П’ять відвідувачів в день – це дуже невисока цифра, таких сторінок в Мережі сотні тисяч. Дані за часом, цінами і термінами виконання стандартні. Хостинг, дійсно, безкоштовний. Роби й роби собі “фото кленового листа “,” фото динозавра “,” фото Володимира Ворошилова “,” список автомобільних фірм Москви “,” кращі mp3 сайти “,” купуємо полімери “,” реферати з політології “,” кактус велика квітка “,” оренда нежитлових приміщень в Москві “,” зображення градусника “, “Квартирне трифазний виклик” і т.п. Все це абсолютно реальні запити користувачів і вони повторюються. У чому проблема?

Немає інформації про затребуваності відповідей на дані запити, і ви не зможете розрахувати свій бізнес, а наосліп працювати безглуздо – от і вся проблема. Одним з головних принципів нейронної пошукової системи є повна відкритість інформації про частотах і формулюваннях запитів, в ній ви отримаєте цю інформацію.

Як відповідати на запитання?

Задамо Яндексу вже відомий питання: “Список автомобільних фірм Москви”. Перше посилання на сервер “Бізнес-Волга” відкривається словами “список автомобільних фірм Тольятті “. Дивно … Запитаємо у Апорт … ще більш дивно: на першій позиції “Техмаркетс Компьютерс – комп’ютери, периферія, комплектуючі “.

Ви зрозуміли питання? Так. Можете відповісти? Ні, якщо у вас, звичайно, немає цього списку. Тому й не відповідаєте. А пошукова система запит не зрозуміла, це очевидно, але “Відповіла”. Обговорення питання, чому іноді індексує Пошукова система (Яндекс, Апорт, Альтавіста та ін) відповідає абсолютно точно, іноді “в молоко”, а найчастіше – приблизно, в завдання даної статті не входить. Нейронна Пошукова система завжди відповідає точно, тому що на будь-який запит відповідає не “Система”, не алгоритм, а живий, реальний людина, яка бачить запит, розміщуючи в системі посилання на веб-сторінку з відповіддю. А що відбувається, коли система не знає точного відповіді на запит? Нічого особливого, немає відповіді – і все. Іноді краще не відповідати, ніж відповідати невпопад.

Для того, щоб нейронна система знала, що відповідати на якийсь запит, її треба навчити. Загальна схема цього процесу така: перший користувач вводить новий запит, відповіді на нього ще немає; перший експерт бачить незареєстрований запит і реєструє його, тобто ставить посилання на сторінку, де знаходиться відповідь. Другий користувач вводить такий самий запит і отримує відповідь першого експерта – посилання і анотацію (запрошення відвідати сторінку). Інші експерти теж можуть реєструвати даний запит на свої варіанти відповідей, але суть в тому, що будь-яку кількість відповідей завжди концентрується навколо одного-єдиного унікального запиту. Відома перша фраза з пісні Фредді Меркюрі “I want to ride my bicycle” не дорівнює другій фразі тієї ж пісні того ж співака “I want to ride my bike” – для нейронної системи це два РІЗНИХ запиту. І система, отримавши запит користувача “I want to ride my bike “стане шукати відповіді ТІЛЬКИ на цей запит і ні на який інший, навіть на “I want to ride my bicycle”. Так треба.

Сказане називається принципом повної ідентифікації, і повну теорію цього питання я тут не розбираю.

Скільки ж може бути запитів?!

Багато. І навіть дуже багато – сотні мільйонів на мільйони різних тем. Але ж, коли ви звертаєтеся в пошукову систему, вас же не цікавлять всі теми одночасно. Цікавить одна, і ви формулюєте свій запит, як вмієте. Це, до речі, теж одна з особливостей нейронних пошукачів: у користувача немає ніяких обмежень у виборі формулювання запиту – як розумієш, що тобі треба, так і пиши.

Але ось в області однієї теми кількість можливих формулювань запитів різко обмежено і, як правило, не перевищує сотні, а найбільш частими є від однієї до п’яти-шести залежно від теми. Обмеження це не системне, і не обумовлене якимись штучними правилами складання запитів, просто нормальна людина не стане придумувати якусь дуже незвичну формулювання, а кількість звичайних невелика. Ось що я мав на увазі, кажучи про “обмеженість” кількості формулювань.

Скільки людей повинні відповідати на запити і навіщо?

При слові Експерт (див. трохи вище) представляється вельми мастита особистість, “весь покритий зеленню “із зображеннями американських президентів, отриманої в якості гонорарів за послуги. І скільки ж треба таких експертів і грошей на зарплату їм, щоб навчити нейронну систему відповідати на сотні мільйонів запитів? Можна підрахувати практично з точністю до одного: кількість експертів нейронної пошукової системи дорівнює кількості веб-майстрів, підтримують сайти в Інтернеті. Експерт, реєструючий посилання на сторінки сайту – це вебмайстер цього сайту. А навіщо йому це треба – реєструвати посилання на свій сайт, писати анотації, відбирати запити? ..

Зустрічне питання: а навіщо йому треба вміти заповнювати мета теги, знати основи позиціонування в індексуючих пошукових системах і реєструвати в них свій сайт, навіщо ставити посилання в каталогах, брати участь в банерообмінних мережах, обмінах посиланнями, розсилках, форумах? Нормальний майстер все це робить – навіщо? От ви самі і відповіли на запитання.

Процедура відбору та реєстрації запитів в нейронної системі набагато простіше і швидше, ніж техніка позиціонування по ключовими словами і заповнення метатегов в індексуючих пошукових системах.

Що в результаті?

Дуже красива система в підсумку виходить. Користувачі задають питання, а вебмастера (плюс розробники, автори, контент-провайдери, дизайнери, програмісти і ін) на них відповідають. Користувачі запитують, що хочуть, а професіонали бачать, що потрібно користувачам, і керуються цими знаннями у своїй роботі. Все, як у житті: попит – пропозицію. Будь-який запит, і практично завжди точну відповідь, повну відповідь, осмислений відповідь.

Такий завтрашній день пошуку в Мережі.

Запрошення до діалогу

Більш повну інформацію про ідеї нейронної організації інформації, пошуку, конкуренції посилань, поділі баз даних і організації циклів, частотної та комерційної підсистемах реєстрації, протистоянні тенденції лаконізму і “закону Бредбері”, системі пошуку по масці в запитах і анотаціях, принципах реклами в нейронних системах, універсальності системи для будь-якої зони Мережі, механізмах окупності і прибутковості проекту і ряді інших питань ви можете дізнатися на сайті фірми “Нейрон РУ” (mynameis.narod.ru) – Піонера в області розробки систем нейронного пошуку.

Задавайте свої питання, відповіді будуть.


Андрій Іванов, керівник команди розробників проекту Neiron.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*