SEO: Порівняльні характеристики пошукових машин Рамблер, Яндекс і Апорт, HTML, XML, DHTML, Інтернет-технології, статті

На жаль, дані, представлені в цій таблиці, відносяться до 1999 року. Але таблиця може чудово дати зрозуміти, за якими критеріями потрібно порівнювати пошукові машини і якими особливостями володіють наші провідні пошукачі.




















































































































































































































































































































  Rambler  Yandex  Aport 

I. Основні характеристики поісоквих систем 
 
Адреса www.rambler.ru  www.yandex.ru  www.aport.ru 
 
Кількість унікальних користувачів пошукової системи в день (середнє за тиждень з 25 по 31 січня 1999 року) 19 344 13 323 6 714
 
Кількість унікальних користувачів пошукової системи в місяць (січень 99) 137 300 94 775 55 200
 
Кількість запитів до пошукової системи в день (середнє за тиждень з 25 по 31 січня) 138 983*  50 235 24 057
 
Розмір пошукової системи (на 31.01.99) 3 815 679 (DOC)
5 143 907 (URLs)
24 897 (SERV)
4 512 231 (DOC)
24 772 (SERV)
 
1 757 208 (DOC)
2 999 585 (URL)
13 264 (SERV)** 
 
Кількість індексованих в день сторінок (середнє за тиждень з 25 по 31 січня) 130 000 URLs 40 000 NEW 900 000 URLs
 
Період оновлення сторінки в індексах від тижня до місяця 7 днів від тижня до місяця
 
Поява в індексах після реєстрації найближчий вихідний 10 хв для доменів “ru”, “su”, 7 днів для інших 7 днів
 
Поява в індексах незареєстрованих сторінок від тижня до місяця близько 7 днів від тижня до місяця
 
Глибина індексування не обмежена не обмежена не обмежена
 
Підтримка фреймів + + +
 
Підтримка ImageMaps + + +
 
Індексація закритих розділів + + +
 
Популярність веб-сайту планується
 
Визначення частоти оновлення + +
 
Robots.txt + + +
 
Meta Robots + + +
 
Можливість перевірки сторінки на наявність в індексах + + +
 
Можливість перевірки на наявність посилань з інших сторінок планується +
 
*-Включаючи пошук по TOP100
**-Дані на 02.12.1998
 

II. Фактори, що впливають на визначення релевантності сторінки 
 
Популярність сторінок
 
Мета-теги планується +
 
Індексація в полі ALT + планується +
 
Індексація тексту в коментарях + +
 
Стоп слова зустрічаються в понад 600 тис. документів список  список
 
Морфологічний пошук + + +
 
Облік регістра + +
 
Meta-refresh ОК (робот переходить) ОК (робот не переходить) ОК (робот переходить)
 
Зайва повторюваність ключових слів SPAM SPAM SPAM
 
Невидимий текст SPAM SPAM SPAM
 
Дрібний текст SPAM SPAM SPAM
 

III. Фактори, що впливають на відображення сторінок в результатах пошуку 
 
Довжина заголовка (title) не більше 512 символів не більше 203 символів не більше 256 символів
 
Якщо немає заголовка URL видається “Без заголовка” видається “Документ без назви”
 
Вид опису (мета-тег, перший текст на сторінці і т.д.) перші 513 символів з основного тексту документа перші 203 символів з основного тексту документа уривки пропозицій (до 10), де зустрічаються ключові слова
 
Довжина опису три опції: відсутній, не більше 513 символів, не обмежена не більше 203 символів цитата до 500 слів
 
Дата поновлення документа + + +
 
Дата індексації документа + +
 
Розмір документа + +
 
Кодування документа + + +
 
Кількість результатів на сторінці 15 – 30 – 50 10 – 20 – 50 10
 
Варіанти відображення стандартний, короткий, повний простий і академічний пошук стисла, звичайна, докладна
 
 


Пояснення до таблиці




  1. Основні характеристики пошукових систем


    Розмір пошукової системи


    Параметр, що характеризує обсяг інформації, проіндексованої системою:


    (URL) – Кількість зберігаються в індексах адрес сторінок;


    (DOC) – Кількість проіндексованих документів (останніх, як правило, менше, ніж (URL), так як по декількох URL може знаходитися один і той же документ).


    (SERV) – Кількість проіндексованих серверів.


    На одному сервері може розташовуватися від однієї до кількох тисяч сторінок, тому дана цифра більше свідчить про широту обхвату системи, ніж про її інформаційному обсязі. Від розміру пошукової системи залежить, чи буде Ваш веб-сайт представлений в її індексах, скільки сторінок веб-сайту буде проіндексовано і т.д.


    Кількість індексованих в день сторінок


    Кількість сторінок, які індексуються роботами пошукових систем за одну добу. Чим вище цей параметр, тим частіше відбувається перєїдексация сторінок, тим актуальніше інформація в системі.


    Період оновлення сторінки в індексах


    Середнє і максимальний час, через який відбувається повторна індексація сторінки.


    Вміст багатьох веб-сторінок часто міняється, деякі сторінки просто зникають, тому для пошукової системи важливо підтримувати актуальну інформацію в своїх індексах. Проте посилання в пошуковій системі можуть бути як одноденною давності, так і не оновлювалися декілька місяців. Причина в тому, що робот не повертається на всі сторінки через однаковий проміжок часу. На швидкість оновлення впливають такі чинники:



    • реєстрація по запиту користувача, при цьому вказана сторінка заноситься в індекс “поза чергою”;
    • залежність швидкості оновлення від популярності сторінки;
    • залежності швидкості оновлення від динамічності сторінки.

    Поява в індексах після реєстрації


    Час, через яке зареєстрована користувачем сторінка з’явиться в індексах системи. За ідеєю, робот пошукової системи рано чи пізно знайде сторінку, якщо на неї вказують інші веб-ресурси. Але на практиці набагато швидше це відбудеться при їх безпосередній реєстрації (зазвичай add URL).


    Поява в індексах незареєстрованих сторінок


    При реєстрації (add URL) користувачі, як правило, вказують URL головної сторінки сайту. При цьому пошукові системи зазвичай оперативно поміщають в індекси зазначену сторінку і ставлять весь інший сайт в чергу на індексацію. Даний пункт вказує період, через який інші сторінки сайту з’являться в індексах.


    Глибина індексування


    Даний пункт показує, скільки сторінок окрім вказаної індексувати пошукова система. Як правило, у великих пошукових машин немає обмеження на глибину, і їх роботи намагаються проіндексувати всі сторінки веб-сайту. Це не завжди виходить, тому що на їх шляху можуть виникнути перешкоди, наприклад, такі як фрейми, Imageмaps, динамічно створені сторінки і т.д. (Див. нижче). Ряд пошукових систем (Наприклад, Infoseek, Lycos) при індексації обмежуються лише деякою кількістю сторінок веб-сайту. Кількість сторінок залежить як від самої системи, так і від популярності індексуємого ресурсу.


    Підтримка фреймів


    Деякі пошукові системи не розуміють фреймової структури сайту. Внаслідок цього практично всі сторінки сайту можуть бути не проіндексовані. Про те, як впоратися з цією напастю, написано вище.


    Підтримка ImageMaps


    Не всі пошукові системи можуть слідувати по посиланнях, вказаних за допомогою Imageмaps. Внаслідок цього деякі сторінки Вашого сайту можуть бути не проіндексовані. Про те, як впоратися з цією напастю, ви можете прочитати вище Індексація закритих розділів Ряд пошукових машин можуть індексувати захищені розділи на серверах, якщо їм вказати login і пароль. Користувач не зможе відразу перейти на захищену сторінку і вивчити всю інформацію, але завдяки пошуковій системі він буде знати, що така інформація існує і, можливо, прийме рішення заплатити і отримати до неї доступ.


    Популярність веб-сайту


    Пошукова система може визначити “популярність” веб-сайту по кількості посилань на нього з інших веб-ресурсів. Популярність може бути одним з чинників в ухваленні системою рішення про те, індексувати даний веб-сайт чи ні.


    Визначення частоти оновлення


    Деякі пошукові машини визначають, наскільки часто оновлюються ті чи інші сторінки. Дана інформація допомагає відповідним чином спланувати графік повторних візитів роботів для переіндексації сторінок. Регулярно оновлювані ресурси відвідуються частіше, статичні сторінки – рідше.


    Robots.txt, Meta Robots


    В силу деяких обставин адміністратор сайту може не бажати індексації всіх або певних сторінок свого веб-ресурсу. Уникнути індексації можна двома шляхами. За допомогою файлу Robots.txt, розміщеного на веб-сервері, (його специфікації можна вивчити за адресою info.webcrawler.com/mak/projects/robots/exclusion.html.) А також за допомогою спеціального мета-тега, який поміщається на конкретну сторінку веб-сайту і наказує роботам не заносити її в індекси системи. Виглядає так:

    Можливість перевірки сторінки на наявність в індексах


    Дуже корисна опція, якою володіють далеко не всі пошукові машини. Дозволяє визначити наявність в індексах системи тієї чи іншої сторінки і подивитися, як вона виглядає в системі.
    Синтаксис запиту для Rambler – $URL: host/url_name
    Синтаксис запиту для Yandex – спробувати додати сторінку на yandex.ru/addurl.html, Якщо сторінка вже є в індексах, система видасть відповідне повідомлення.
    Синтаксис запиту для Апорту! – URL=www.promotion.aha.ru


    Можливість перевірки наявності посилань з інших сторінок


    Для людини, що займається просуванням сервера, важливо знати, які ресурси Мережі містять на нього посилання, в якому контексті це посилання використовується і т.д. Тому можливість виведення сайтів, що містять подібні посилання, додає пошуковій системі додаткову цінність.Синтаксис запиту для Апорту! – link=www.promotion.aha.ru (Поки можна вказувати тільки ім’я сервера).


  2. Фактори, що впливають на визначення релевантності сторінки

    Популярність сторінок


    Для кожної сторінки пошукова система може визначити, яка кількість веб-ресурсів мають на неї посилання. Деякі системи враховують даний параметр “популярності” і вважають подібні сторінки більш релевантними запиту. У цьому справді є логіка, тому що наявність великої кількості посилань, як правило, свідчить про корисність та інформативності сторінки.


    Мета-теги


    Не всі системи підтримують мета-теги: description і keywords, тобто враховують ключові слова, що містяться в цих тегах, при визначенні релевантності сторінки. Детальніше про ці тегах можна прочитати вище.
    Індексація в полі ALT
    Не всі системи враховують ключові слова, що містяться в поле ALT тега IMG, при визначенні релевантності сторінки.
    Для довідки: в полі ALT заноситься альтернативна текстова підпис до картинок на сторінці.


    Індексація тексту в коментарях


    Не всі системи враховують ключові слова, що містяться в коментарях, при визначенні релевантності сторінки.
    Для довідки: Коментарі не відображаються в браузері, і відвідувачі сайту їх зазвичай не бачать. В основному, використовуються для службової розмітки Html-сторінки і містять інформацію, не призначену для широкого кола користувачів.


    Стоп-слова


    Для економії місця і збільшення продуктивності деякі пошукові системи не включають в індекси слова, що зустрічаються на веб-сторінках дуже велика кількість разів. Наприклад, “www”, артиклі “а”, “the” і т.д.


    Морфологічний пошук


    Якщо пошукова система підтримує морфологію, то пошук буде здійснюватися не тільки за вказаною слову, але і по всіх його морфологічних формах. Наприклад, при запиті “банер” така пошукова машина знайде також сторінки, що містять слова “банера”, “банерів”, “банері” і т.д.


    Облік регістра


    Деякі пошукові системи чутливі до запитів з урахуванням регістра, інші – ні. Наприклад, пошукова система AltaVista при запиті “banner” видасть всі сторінки, що містять слово “banner”, де букви можуть бути в будь-якому регістрі, але при запиті “Banner” – тільки сторінки, що містять це слово з великої першою літерою.


    Meta-refresh


    В мережі існують сторінки, які автоматично переносять користувача на інші веб-ресурси. Причин, за якими вони створюються, може бути багато: сайт переїхав на нове місце і знаходиться за іншою адресою; сторінки з перенаправленням створені спеціально для пошукової системи, оскільки основні сторінки сайту генеруються автоматично і не можуть бути проіндексовані і т.д.


    Зазвичай такий автоматичний редирект реалізується за допомогою мета-тега refresh. Його синтаксис:
    <META HTTP-EQUIV=”Refresh” CONTENT=”10; URL=www.urlname.ru”>


    Пошукові системи ведуть себе в цьому випадку по-різному:



    • одні вважають такі сторінки спамом пошукових систем і не індексують їх;
    • інші не індексують дану сторінку, але переходять за посиланням редиректа і виробляють індексацію на сторінці призначення;
    • треті не розуміють даного мета-тега, індексують саму сторінку, але по редіректу не переходять …

    Спам пошукових систем


    Цілком зрозуміле прагнення кожного веб-майстра добитися того, щоб при запиті за певними ключовими словами його сторінка видавалася якомога ближче до початку списку. Іноді таке бажання штовхає деяких використовувати непривабливі прийоми штучного збільшення релевантності своєї сторінки – спамить пошукові системи.


    В основному, спам полягає у використанні невиправдано великої кількості ключових слів на сторінці. Причому їх намагаються використовувати там, де вони мають найбільший “вагу” для пошукової системи, – в заголовку сторінки (теге title), назвах розділів і т.д. Часто для того, щоб подібні додаткові слова не псували відвідувачам враження від сторінки, їх пишуть текстом, що збігається з фоном сторінки, кольором або дрібним шрифтом і т.д.


    Зрозуміло, адміністрація пошукачів не схвалює подібні дії. Системи пошуку покликані знаходити і відображати документи відповідно до того, що містить текст, призначений для відвідувачів, а не по “збагаченій суміші” ключових слів.


    Великі міжнародні пошуковики застосовують ряд заходів по боротьбі зі спамом. Якщо таким системам попадеться сторінка, яка містить в мета-теге keywords одне і те ж слово більше 5 раз або, наприклад, невидимий для відвідувачів текст, вона не буде проіндексована системою.


    Наші пошукові системи, на жаль, поки не підтримують автоматичних засобів боротьби зі спамом, і в таблиці просто представлені ті дії, які розцінюються адміністрацією як спам. Незважаючи на відсутність автоматичного контролю, я рекомендую не використовувати описані вище прийоми, оскільки:



    • спам пошукових систем сильно ускладнює пошук інформації в Інтернеті;
    • подібну сторінку при виявленні можуть викинути з індексів вручну;
    • не за горами час введення автоматичних засобів стеження за спаммерами в російських пошукових системах.


  3. Фактори, що впливають на відображення сторінок в результатах пошуку


    Довжина заголовка (title)


    Максимальна кількість символів із заголовка документа, яке відображає система.


    Якщо немає заголовка


    В мережі зустрічаються сторінки з порожнім або відсутнім тегом title (заголовком документа). Цей пункт показує, що система виводить у такому випадку.


    Вид опису (мета-тег, перший текст на сторінці і т.д.)


    Знайдені документи кожна з систем відображає по-своєму. Це можуть бути перші N-символів тексту зі сторінки, опис з мета-тега description, уривки тексту сторінки, що містять слова пошуку і т.д.


    Довжина опису


    Максимальна кількість символів в описі сторінки.


    Дата поновлення документа


    При відображенні веб-документов в результатах пошуку деякі системи указують час створення або оновлення даної сторінки.


    Дата індексації документа


    При відображенні веб-документов в результатах пошуку деякі системи указують час останньої індексації даної сторінки.


    Розмір документа


    При відображенні веб-документов в результатах пошуку деякі системи указують розмір даної сторінки в кілобайтах.


    Кодування документа


    При відображенні веб-документов в результатах пошуку деякі системи указують, в якому кодуванні створена дана сторінка.


    Кількість результатів на сторінці


    Знайдені веб-документи відображаються в системі певними порціями, зазвичай по 10 -20 документів.


    Варіанти відображення


    Деякі пошукові системи передбачають кілька варіантів відображення знайдених веб-документів.


Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*