About Me

header ads

Індексація сайту

 Часті питання щодо індексації сторінок сайту


З огляду на велику кількість питань щодо індексації, вирішив створити FAQ – питання та відповіді, сподіваюся, він буде корисним тим, хто збирається поставити своє питання. У цьому ФАК розглядаємо індексацію найбільш популярної системи - google


Що таке індексація?


Індексація - це обхід пошуковими роботами інтернет-сторінок та додавання їх (сторінок) у свою базу для подальшої обробки, систематизації та виведення в результатах пошуку.


Який механізм індексації?


Механізм простий. Пошуковий робот знаходить посилання на ваш сайт або на окрему сторінку в інтернеті. Переходить за цим посиланням і починає завантажувати сторінки собі в базу. Робот буде переходити за посиланнями на вашому сайті і таким чином обійде їх усі. Якщо сторінка або весь сайт недоступний, робот не затримуватиметься і піде далі.


Як додати сайт на індексацію?


Для індексації сайту достатньо розмістити посилання на ваш сайт на вже проіндексованому ресурсі. Але варто додати сайт, безпосередньо в аддурилки (панель додавання нових сайтів) пошукових систем.


Що таке робот пошукової системи?


Робот (англ. crawler) зберігає список URL, які може проіндексувати, і регулярно викачує відповідні їм документи. Якщо при аналізі документа робот виявляє нове посилання, він додає його до свого списку. Таким чином, будь-який документ або сайт, на який є посилання, може бути знайдений роботом, а отже, і пошуком.


Які бувають роботи, що індексують?


Є кілька видів роботів, які виконують різні функції. Наприклад, є робот, який індексує RSS-стрічку для пошуку по блогах. Або робот, який індексує лише картинки. Найважливіший — основний робот, що індексує, функція якого — пошук і індексування інформації для формування бази основного пошуку.


На допомогу основному є швидкий робот - він призначений для оперативного індексування свіжої, актуальної на даний момент інформації. Якщо серед проіндексованих сторінок свого сайту ви бачите дві копії будь-якого документа — швидше за все це означає, що, крім основного робота, документ також був проіндексований і швидким роботом.


Який середній час індексації сайту?


Час індексації сайту може змінюватись від кількох годин, до кількох тижнів і навіть місяців, тут все залежить від вас і вашого ресурсу.


Як прискорити процес індексації?


Для прискорення процесу індексації потрібно додати свої посилання в соціальні закладки, які люблять ПС (пошукові системи).


Чи впливає якість хостингу на швидкість індексації?


Нехай впливає, якщо ваш хостинг працює з перебоями і ваш сайт часто не працює, або має тривалий час відгуку, то роботи ПС не зможу проіндексувати ваш сайт під час його недоступності. А це підвищує час індексації сайту. Будьте уважні та стежте за постійною доступністю сайту, адже невідомо, коли до вас загляне робот.


Чи впливає ім'я домену на якість індексації?


Питання спірне, але краще не перекручуватися і присвоювати своїм сайтам зрозумілі і не дуже довгі імена.


Що таке Ап видачі чи коли чекати на результати індексації?


Ап - апгрейд, це оновлення чогось, у разі – це оновлення результатів видачі. Після обробки завантажених роботом сторінок при індексації вони з'являються в пошуку. Так ось, при кожному АПі відбувається оновлення списку пошукової видачі, списку ранжування сайтів. У гугла, ап відбувається постійно і будь-коли ваші сторінки можуть бути проіндексовані і додані в пошук.


Що таке ЧПК?


Зрозумілий урл - зручні для сприйняття людиною. Ці посилання допомагають сайтам займати вищі місця в пошуковій видачі, за рахунок додаткового ключа в адресі сторінки.


Сторінки були проіндексовані, але я змінив контент та дизайн?


Нічого страшного, згодом, усі сторінки у пошуку оновляться на нові.


Чому пошукові системи не індексують сторінки сайту?


Тут кілька варіантів:

Flash та Java посилання


Заборона у Robots.txt

Занадто велика кількість посилань на сторінці

Бан сайту пошуковими системами

Заборона у мета-тегах

Вхід на сторінки через заповнення форм

Неунікальний контент


Що таке мапа сайту і для чого вона потрібна?


Карта сайту (Sitemap) – це зміст нашого сайту, аналогічний змісту будь-якої книги. У файлі картки представлені всі розділи та матеріали сайту. І служить карта для швидкого та повного індексування сайту, а також для зручності навігації користувачів. Для різних CMS (систем управління сайтом) існують різні карти сайту, наприклад, на WordPress існують спеціальні плагіни для простоти створення.


Як налаштувати robots.txt?


Robots.txt — спеціалізований файл, за його допомогою ми обмежуємо доступ пошукових робот до того чи іншого розділу сайту. Будь-який пошуковий робот спочатку прочитає Robots.txt, а потім почне індексувати сторінки сайту.

Також за допомогою файлу robots.txt можна обмежити індексацію сайту, проте деякі недобросовісні роботи можуть ігнорувати наявність цього файлу.


Як дізнатися, коли був пошуковий робот на моєму сайті?


Можна подивитись логи, якщо робот був на сайті, там це буде зафіксовано.


Що таке ранжування?


Це процес вибудовування знайдених на запит користувача сторінок у порядку найбільшої відповідності шуканому запиту.


Як потрапити в топ пошукової видачі?


Дуже широке питання, це досліджує та вивчає таке поняття як SEO. Відповідь на це питання – це комплекс заходів, спрямованих на пошукову оптимізацію. На це впливає велика кількість факторів.


Що таке бан та за що його можна отримати?


Бан сайту – викид сайту з індексу пошукової системи та неможливість додавання сайту до індексу ПС.


Давайте розберемося, за допомогою яких дій можна потрапити в бан.


За що можна отримати бан від Google


1. Чужий контент;

2.Прихований текст (білий текст на білому тлі досить популярне явище);

3.Часте використання ключовиків;

4.Участь у лінкфармі;

5.Клоакінг;

6.Вихідні посилання у великій кількості;

7.Розповсюдження вірусів з вашого домену;

8.Спам з домену;


Примітка*


Лінкфарми – сайти або групи сайтів, що інтенсивно посилаються один на одного


Що таке фільтри та якими вони бувають?

Фільтри – це певні алгоритми, спрямовані на видалення з пошуку непотрібних сторінок, мотлоху. Фільтрів досить багато, кожен я тут описувати не буду, а наведу лише їхні назви.


Фільтри Google:


"Пісочниця" (sandbox)

Фільтр "Додаткові результати"

Фільтр Bombing

Фільтр Bowling

Фільтр "Вік домену"

Фільтр "Довірний контент"

Фільтр -30

Фільтр "Опущені результати"

Фільтр "Социтування"

Фільтр "Links"

Фільтр "Багато посилань одразу"

Фільтр "Надмірна оптимізація"

Фільтр "Биті посилання"

Загальний фільтр "Ступінь довіри" (Google Trust Rank)

Індексація сайту


Дописати коментар

0 Коментарі