Застосування хмари тегів на Delphi – Блевантон v.0.1, Різне, Програмування, статті

blevotaСьогодні сноа зайнявся роботою над хмарою тегів на Delphi. Все ніяк не міг придумати куди б прикрутити отриманий мною код: використовувати в блог-клієнта? Не те … блог-клієнтів греблю гати і практично всі з хмарами. На сайт exe-шник теж якось не посміхається пригвинчувати. І в процесі пошуку натрапив на одну темку на серч. Мова там йшла про таке поняття як “ нудота сторінки “. Причому, якщо Ви почитаєте цю тему, то побачите, що іноді самі веб-майстри плутаються в тому, що є нудота сторінки , А що є частота слова.


Ось я і спробував прилаштувати отриманий мною алгоритм постоенія хмари тегів до практичної задачі SEOшніков – написати програму для розрахунку нудоти довільного тексту. Т.к. будь-яка програма повинна мати осмислене назву, то я вирішив назвати її на честь цілого сузір’я з м / ф “Шрек” (в перекладі Гобліна) – Блевантон. Власне назва практично відповідає основному завданню програми.


Тепер давайте трохи розберемося в теорії. Що таке нудота тексту? Одне з визначень звучить таким чином:



Нудота сторінки (тексту) – Це величина спаму на сторінці. Зараз приблизно дорівнює кореню квадратному з числа самого частого слова на сторінці. Ті якщо на сторінці найчастіше слово (наприклад, www) зустрічається 100 разів, то нудота дорівнює 10. Якщо найчастіше слово зустрічається менше семи разів, то нудота дорівнює константі = корінь з семи.


Як можна помітити – у розрахунку нудоти беруть участь всі слова (!) На відміну від розрахунку щільності ключевики, де з тексту викидаються стоп-слова. Єдина обробка тексту полягає, по-моєму, у виключенні з тексту пробілів і керуючих символів (наприклад, символів!,?, “і пр.), тому що якщо таку чистку не провести, то, мабуть самим спамний словом якраз і буде один з керуючих символів. Якщо я не прав – оптимізатори і сеошники поправте. До речі про SEO – якщо Вас цікавить просування сайту, то можете зайти на сайт за посиланням або відвідати мій другий блог про розкрутку блога з програмування (Посилання в сайдбарі – DelphiSEO)


Тепер, власне про те, що робить “Блевантон”. По-перше, я трохи доповнив алгоритм побудови хмари – тепер воно будуватися за всіма правилами, а точніше – слова в хмарі вистоюється за алфавітом.


Завантажуємо проізволний текст в програму:


Блевантон


Як перевірочного тексту я взяв одну із сторінок свого блога.


Тепер натискаємо на кнопку “Аналізувати” і ” Блевантон “Починає свою роботу.


Перше, що робить програма – видаляє з тексту повторювані пробіли, порожні рядки і все стоп-символи . Стоп-символи, до речі, знаходяться в текстовому файлі, так що, при бажанні, можете цей файл редагувати на свій розсуд.


Далі, текст розбивається на окремі слова і над списком слів проводяться ті ж операції, що і при побудові хмари тегів, тобто – Підраховується входження кожного слова в текст, список слів сортується по зростанню згадувань.


Ну, а далі все елементарно – витягуємо з хмари останній елемент і дивимося скільки разів слово з елемента хмари згадується в тексті і, виходячи з визначення, вираховуємо нудоту.


Третій етап роботи – сортуємо хмара за алфавітом і вибудовуємо його:


Блевантон


Те хмара, що будується в програмі якось не в’яжеться з визначенням “хмара тегів”, тому й назва у нього відповідне “тошнотно хмара”. І несе вона в собі дещо інший сенс – за допомогою нього ви можете без проблем неозброєним оком побачити яке слово чи навіть ряд слів зустрічається в тексті дуже часто і спробувати відредагувати текст. Адже, погодьтеся, практично у кожного з нас зустрічаються як у письмовій, так і в усному мовленні слова-паразити, які так і лізуть назовні – ось в хмарі-то вони і будуть Вам чітко видно. А щоб такі слова прямо-таки випиналися в хмарі, я дописав алгоритм побудови і додав можливість відсіювання малозначних слів, тобто слів які зустрічаються в тексті рідше заданого порогу.


Для того, щоб перебудувати хмара, необхідно задати той поріг повторюваності слова нижче якого слова будуть виключатися з побудови. Наприклад на наступному малюнку я викинув із хмари все слова, які зустрічаються в тексті менше 3 разів:


Блевантон


Відчуваєте різницю? Хмара “здулося” практично в 4 рази, відповідно і перегляд значно полегшується.


Таким чином, регулюючи “поріг чутливості” у хмари Ви можете розглядати свій текст у всій красі як Вам завгодно.


Тепер про те, що “Блевантон“НЕ вміє на відміну від всіляких он-лайн сервісів з перевірки нудоти. Єдине, що поки не вдається здійснити – це пошук і групування всіх словоформ. Наприклад, зараз слова який і які – Різні, хоча по ідеї вони повинні виділятися в окрему групу. Але, я думаю, це дрібниця малозначна, тим більше для першої версії програми. Поки можете скачувати “Блевантон“, Перевіряти його роботу, аналізувати свої тексти і т.д. Буду дуже вдячний за цінний поради щодо поліпшення програми. Може хтось захоче, щоб програма виконувала й інші функції з аналізу тексту – Пропонуйте, постараюся реалізувати.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*