SEO: Порівняльні характеристики пошукових машин Рамблер

На жаль, дані, представлені в цій таблиці, відносяться до 1999 року. Але таблиця може чудово дати зрозуміти, за якими критеріями потрібно порівнювати пошукові машини і якими особливостями володіють наші провідні пошукачі.




















































































































































































































































































































  Rambler  Yandex  Aport 

I. Основні характеристики поісоквих систем 
 
Адреса www.rambler.ru  www.yandex.ru  www.aport.ru 
 
Кількість унікальних користувачів пошукової системи в день (середнє за тиждень з 25 по 31 січня 1999 року) 19 344 13 323 6 714
 
Кількість унікальних користувачів пошукової системи в місяць (січень 99) 137 300 94 775 55 200
 
Кількість запитів до пошукової системи в день (середнє за тиждень з 25 по 31 січня) 138 983*  50 235 24 057
 
Розмір пошукової системи (на 31.01.99) 3 815 679 (DOC)
5 143 907 (URLs)
24 897 (SERV)
4 512 231 (DOC)
24 772 (SERV)
 
1 757 208 (DOC)
2 999 585 (URL)
13 264 (SERV)** 
 
Кількість індексованих в день сторінок (середнє за тиждень з 25 по 31 січня) 130 000 URLs 40 000 NEW 900 000 URLs
 
Період оновлення сторінки в індексах від тижня до місяця 7 днів від тижня до місяця
 
Поява в індексах після реєстрації найближчий вихідний 10 хв для доменів "ru", "su", 7 днів для інших 7 днів
 
Поява в індексах незареєстрованих сторінок від тижня до місяця близько 7 днів від тижня до місяця
 
Глибина індексування не обмежена не обмежена не обмежена
 
Підтримка фреймів + + +
 
Підтримка ImageMaps + + +
 
Індексація закритих розділів + + +
 
Популярність веб-сайту планується
 
Визначення частоти оновлення + +
 
Robots.txt + + +
 
Meta Robots + + +
 
Можливість перевірки сторінки на наявність в індексах + + +
 
Можливість перевірки на наявність посилань з інших сторінок планується +
 
*-Включаючи пошук по TOP100
**-Дані на 02.12.1998
 

II. Фактори, що впливають на визначення рельовантності сторінки 
 
Популярність сторінок
 
Мета-теги планується +
 
Індексація в полі ALT + планується +
 
Індексація тексту в коментарях + +
 
Стоп слова зустрічаються в більше 600 тис. документів список список
 
Морфологічний пошук + + +
 
Облік регістра + +
 
Meta-refresh ОК (робот переходить) ОК (робот не переходить) ОК (робот переходить)
 
Зайва повторюваність ключових слів SPAM SPAM SPAM
 
Невидимий текст SPAM SPAM SPAM
 
Дрібний текст SPAM SPAM SPAM
 

III. Фактори, що впливають на відображення сторінок в результатах пошуку 
 
Довжина заголовка (title) не більше 512 символів не більше 203 символів не більше 256 символів
 
Якщо немає заголовка URL видається "Без заголовка" видається "Документ без назви"
 
Вид опису (мета-тег, перший текст на сторінці і так далі) перший 513 символів з основного тексту документа перший 203 символів з основного тексту документа уривки пропозицій (до 10), де зустрічаються ключові слова
 
Довжина опису три опції: відсутній, не більше 513 символів, не обмежена не більше 203 символів цитата до 500 слів
 
Дата поновлення документа + + +
 
Дата індексації документа + +
 
Розмір документа + +
 
Кодування документа + + +
 
Кількість результатів на сторінці 15 – 30 – 50 10 – 20 – 50 10
 
Варіанти відображення стандартний, короткий, повний простий і академічний пошук стисла, звичайна, докладна
 
 

Пояснення до таблиці




  1. Основні характеристики пошукових систем


    Розмір пошукової системи


    Параметр, що характеризує обсяг інформації, проіндексованої системою:


    (URL) – Кількість зберігаються в індексах адрес сторінок;


    (DOC) – Кількість проіндексованих документів (останніх, як правило, менше, ніж (URL), так як за кількома URL може знаходитися один і той же документ).


    (SERV) – Кількість проіндексованих серверів.


    На одному сервері може розташовуватися від однієї до декількох тисяч сторінок, тому дана цифра більше свідчить про широту обхвату системи, ніж про її інформаційному обсязі. Від розміру пошукової системи залежить, чи буде Ваш веб-сайт представлений в її індексах, скільки сторінок веб-сайту буде проіндексовано і т.д.


    Кількість індексованих в день сторінок


    Кількість сторінок, які індексуються роботами пошукових систем за одну добу. Чим вище даний параметр, тим частіше відбувається переідексація сторінок, тим актуальніше інформація в системі.


    Період оновлення сторінки в індексах


    Середня і максимальний час, через який відбувається повторна індексація сторінки.


    Вміст багатьох веб-сторінок часто міняється, деякі сторінки просто зникають, тому для пошукової системи важливо підтримувати актуальну інформацію в своїх індексах. Проте посилання в пошуковій системі можуть бути як одноденною давності, так і не оновлюється кілька місяців. Причина в тому, що робот не повертається на всі сторінки через однаковий проміжок часу. На швидкість оновлення впливають такі фактори:



    • реєстрація по запиту користувача, при цьому вказана сторінка заноситься в індекс "поза чергою";
    • залежність швидкості оновлення від популярності сторінки;
    • залежності швидкості оновлення від динамічності сторінки.

    Поява в індексах після реєстрації


    Час, через який зареєстрована користувачем сторінка з'явиться в індексах системи. За ідеєю, робот пошукової системи рано чи пізно знайде сторінку, якщо на неї вказують інші веб-ресурси. Але на практиці набагато швидше це відбудеться при їх безпосередній реєстрації (зазвичай add URL).


    Поява в індексах незареєстрованих сторінок


    При реєстрації (add URL) користувачі, як правило, вказують URL головної сторінки сайту. При цьому пошукові системи зазвичай оперативно поміщають в індекси вказану сторінку і ставлять весь інший сайт в чергу на індексацію. Даний пункт указує період, через який решта сторінки сайту з'являться в індексах.


    Глибина індексування


    Даний пункт показує, скільки сторінок крім зазначеної буде індексувати пошукова система. Як правило, у великих пошукових машин немає обмеження на глибину, і їх роботи намагаються проіндексувати всі сторінки веб-сайту. Це не завжди виходить, тому що на їх шляху можуть виникнути перешкоди, наприклад, такі як фрейми, ImageМaps, динамічно створені сторінки і т.д. (Див. нижче). Ряд пошукових систем (Наприклад, Infoseek, Lycos) при індексації обмежуються лише деякою кількістю сторінок веб-сайту. Кількість сторінок залежить як від самої системи, так і від популярності індексуємого ресурсу.


    Підтримка фреймів


    Деякі пошукові системи не розуміють фреймової структури сайту. Внаслідок цього практично всі сторінки сайту можуть бути не проіндексовані. Про те, як впоратися з цією напастю, написано вище.


    Підтримка ImageMaps


    Не всі пошукові системи можуть слідувати по посиланнях, вказаних за допомогою ImageМaps. Внаслідок цього деякі сторінки Вашого сайту можуть бути не проіндексовані. Про те, як впоратися з цією напастю, ви можете прочитати вище Індексація закритих розділів Ряд пошукових машин можуть індексувати захищені розділи на серверах, якщо їм вказати login і пароль. Користувач не зможе відразу перейти на захищену сторінку і вивчити всю інформацію, але завдяки пошуковій системі він буде знати, що така інформація існує і, можливо, прийме рішення заплатити і отримати до неї доступ.


    Популярність веб-сайту


    Пошукова система може визначити "популярність" веб-сайту по кількості посилань на нього з інших веб-ресурсів. Популярність може бути одним з чинників в ухваленні системою рішення про те, індексувати цей веб-сайт чи ні.


    Визначення частоти оновлення


    Деякі пошукові машини визначають, наскільки часто оновлюються ті або інші сторінки. Дана інформація допомагає відповідним чином спланувати графік повторних візитів роботів для переіндексації сторінок. Регулярно оновлювані ресурси відвідуються частіше, статичні сторінки – рідше.


    Robots.txt, Meta Robots


    В силу деяких обставин адміністратор сайту може не бажати індексації всіх або певних сторінок свого веб-ресурсу. Уникнути індексації можна двома шляхами. За допомогою файлу Robots.txt, розміщеного на веб-сервері, (його специфікації можна вивчити за адресою http://info.webcrawler.com/mak/projects/robots/exclusion.html.) А також за допомогою спеціального мета-тега, який поміщається на конкретну сторінку веб-сайту і наказує роботам не заносити її в індекси системи. Виглядає таким чином: <META NAME="ROBOTS" CONTENT="NOINDEX">


    Можливість перевірки сторінки на наявність в індексах


    Дуже корисна опція, якою володіють далеко не всі пошукові машини. Дозволяє визначити наявність в індексах системи тієї або іншої сторінки і подивитися, як вона виглядає в системі.
    Синтаксис запиту для Rambler – $URL: host/url_name
    Синтаксис запиту для Yandex – спробувати додати сторінку на http://yandex.ru/addurl.html, якщо сторінка вже є в індексах, система видасть відповідне повідомлення.
    Синтаксис запиту для Апорт! – URL=www.promotion.aha.ru


    Можливість перевірки наявності посилань з інших сторінок


    Для людини, що займається просуванням сервера, важливо знати, які ресурси Мережі містять на нього посилання, в якому контексті це посилання використовується і т.д. Тому можливість виведення сайтів, що містять подібні посилання, додає пошуковій системі додаткову ценность.Сінтаксіс запиту для Апорт! – link=www.promotion.aha.ru (Поки можна вказувати тільки ім'я сервера).


  2. Фактори, що впливають на визначення рельовантності сторінки

    Популярність сторінок


    Для кожної сторінки пошукова система може визначити, яку кількість веб-ресурсів мають на неї посилання. Деякі системи враховують даний параметр "популярності" і вважають подібні сторінки більш релевантними запитом. У цьому дійсно є логіка, тому що наявність великої кількості посилань, як правило, свідчить про корисність і інформативності сторінки.


    Мета-теги


    Не всі системи підтримують мета-теги: description і keywords, тобто враховують ключові слова, що містяться в цих тегах, при визначенні рельовантності сторінки. Докладніше про ці тегах можна прочитати вище.
    Індексація в полі ALT
    Не всі системи враховують ключові слова, що містяться в полі ALT тега IMG, при визначенні рельовантності сторінки.
    Для довідки: у полі ALT заноситься альтернативна текстовий підпис до картинок на сторінці.


    Індексація тексту в коментарях


    Не всі системи враховують ключові слова, що містяться в коментарях, при визначенні рельовантності сторінки.
    Для довідки: Коментарі не відображаються в браузере, і відвідувачі сайту їх зазвичай не бачать. В основному, використовуються для службової розмітки Html-сторінки і містять інформацію, не призначену для широкого кола користувачів.


    Стоп-слова


    Для економії місця і збільшення продуктивності деякі пошукові системи не включають в індекси слова, що зустрічаються на веб-сторінках дуже велика кількість разів. Наприклад, "www", артиклі "а", "the" і т.д.


    Морфологічний пошук


    Якщо пошукова система підтримує морфологію, то пошук буде здійснюватися не тільки за вказаною слову, але і по всіх його морфологічним формам. Наприклад, при запиті "банер" така пошукова машина знайде також сторінки, що містять слова "банера", "банерів", "банері" і т.д.


    Облік регістра


    Деякі пошукові системи чутливі до запитів з урахуванням регістра, інші – ні. Наприклад, пошукова система AltaVista при запиті "banner" видасть всі сторінки, що містять слово "banner", де букви можуть бути в будь-якому регістрі, але при запиті "Banner" – тільки сторінки, що містять це слово з великої першою літерою.


    Meta-refresh


    У мережі існують сторінки, які автоматично переносять користувача на інші веб-ресурси. Причин, за якими вони створюються, може бути багато: сайт переїхав на нове місце і знаходиться за іншою адресою; сторінки з перенаправленням створені спеціально для пошукової системи, так як основні сторінки сайту генеруються автоматично і не можуть бути проіндексовані і т.д.


    Зазвичай такий автоматичний редирект реалізується за допомогою мета-тега refresh. Його синтаксис:
    <META HTTP-EQUIV="Refresh" CONTENT="10; URL=www.urlname.ru">


    Пошукові системи ведуть себе в цьому випадку по-різному:



    • одні вважають такі сторінки спамом пошукових систем і не індексують їх;
    • інші не індексують дану сторінку, але переходять по посиланню редіректа і виробляють індексацію на сторінці призначення;
    • треті не розуміють даного мета-тега, індексують саму сторінку, але по редирект не переходять …

    Спам пошукових систем


    Цілком зрозуміло прагнення кожного веб-майстра добитися того, щоб при запиті по певним ключовим словами його сторінка видавалася якомога ближче до початку списку. Іноді таке бажання штовхає деяких використовувати непривабливі прийоми штучного збільшення релевантності своєї сторінки – спамить пошукові системи.


    В основному, спам полягає у використанні невиправдано великої кількості ключових слів на сторінці. Причому їх намагаються використовувати там, де вони мають найбільшу "вагу" для пошукової системи, – у заголовку сторінки (теге title), назвах розділів і т.д. Часто для того, щоб подібні додаткові слова не псували відвідувачам враження від сторінки, їх пишуть текстом, що збігається з фоном сторінки, кольором або дрібним шрифтом і т.д.


    Зрозуміло, адміністрація пошукачів не схвалює подібні дії. Системи пошуку покликані знаходити і відображати документи відповідно до того, що містить текст, призначений для відвідувачів, а не по "збагаченій суміші" ключових слів.


    Великі міжнародні пошукачі застосовують ряд заходів по боротьбі зі спамом. Якщо таких систем попадеться сторінка, яка містить в мета-теге keywords одне і те ж слово більше 5 разів або, наприклад, невидимий для відвідувачів текст, вона не буде проіндексована системою.


    Наші пошукові системи, на жаль, поки не підтримують автоматичних засобів боротьби зі спамом, і в таблиці просто представлені ті дії, які розцінюються адміністрацією як спам. Незважаючи на відсутність автоматичного контролю, я рекомендую не використовувати описані вище прийоми, оскільки:



    • спам пошукових систем сильно утрудняє пошук інформації в Інтернеті;
    • подібну сторінку при виявленні можуть викинути з індексів вручну;
    • не за горами час введення автоматичних засобів спостереження за спамерами в російських пошукових системах.


  3. Фактори, що впливають на відображення сторінок в результатах пошуку


    Довжина заголовка (title)


    Максимальна кількість символів із заголовка документа, яке відображає система.


    Якщо немає заголовка


    У мережі зустрічаються сторінки з порожнім або відсутнім тегом title (заголовком документа). Цей пункт показує, що система виводить у такому випадку.


    Вид опису (мета-тег, перший текст на сторінці і так далі)


    Знайдені документи кожна з систем відображає по-своєму. Це можуть бути перші N-символів тексту зі сторінки, опис з мета-тега description, уривки тексту сторінки, що містять слова пошуку і т.д.


    Довжина опису


    Максимальна кількість символів в описі сторінки.


    Дата поновлення документа


    При відображенні веб-документов в результатах пошуку деякі системи вказують час створення або оновлення даної сторінки.


    Дата індексації документа


    При відображенні веб-документов в результатах пошуку деякі системи вказують час останньої індексації даної сторінки.


    Розмір документа


    При відображенні веб-документов в результатах пошуку деякі системи указують розмір даної сторінки в кілобайтах.


    Кодування документа


    При відображенні веб-документов в результатах пошуку деякі системи вказують, в якому кодуванні створена дана сторінка.


    Кількість результатів на сторінці


    Знайдені веб-документи відображаються в системі певними порціями, зазвичай по 10 -20 документів.


    Варіанти відображення


    Деякі пошукові системи передбачають декілька варіантів відображення знайдених веб-документів.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*