Разное количество страниц в индексе Яндекса и Google
За последнюю неделю мне пришло несколько похожих вопросов в рубрику «seo консультации». Суть везде одна, хоть и описано по-разному, приведу для примера цитату из одного письма:
«беспокоит большая разница в индексации страниц Гуглом и Яндексом, а также стояние на месте индексации Яндекса… И второй вопрос – в Гугле, сильно упало количество страниц не под фильтром в Google…. по результатам http://www.cy-pr.com …»
Итак, начнем прояснять ситуацию на примере сайта http://rainbowbiser.ru
Сайт сделан на WordPress, в Яндексе на сегодня 17.06.2011 проиндексировано – 148 страниц, в Google – 1970 страниц, из них не под фильтром – 117, количество страниц по xml карте – 104.
Разберемся почему такая разница и как должно быть на самом деле. Почему вначале я упомянул, что движок сайта WordPress? Потому что именно он «любитель» создавать огромное количество лишних страниц, таких как:
- теги;
- рубрики (категории);
- страницы с комментариями;
Что касается индексации таких страниц поисковыми системами, то ситуации бывают разные. Яндекс в основном эти страницы считает дублями и выкидывает их автоматом. Но иногда может и целиком весь сайт зафильтровать, если будет слишком много дублей. Google относится более лояльно и иногда все страницы держит в индексе, а иногда начинает их тоже выкидывать или фильтровать, показывая как бы две выдачи: одну полную со всеми тегами, рубриками и комментариями и вторую отфильтрованную, где находятся только основные страницы сайта. В таких случаях и получается огромная разница в количестве проиндексированных страниц, иногда в десятки раз.
Как понять сколько же должно быть проиндексировано на самом деле и какая поисковая система индексирует более правильно?
А очень просто! Всего лишь посмотреть сколько у вас реально страниц на сайте +- 10% На wordpress это очень легко можно посчитать, заглянув в разделы «записи» и «страницы», сложить две цифры вместе и прибавить 10% – это и будет приблизительно-точное число страниц, которые должны индексироваться. А все что сверх этого – это «мусор» для поисковых систем и его лучше закрывать от индексации в файле robots.txt. Также можно посмотреть по карте сайта в html или xml формате, там тоже обычно указаны только основные страницы и можно ориентироваться на это количество. Карта сайта xml обычно располагается здесь http://адрес-сайта/sitemap.xml
Надеюсь все разъяснил и помог разобраться что к чему? Если есть вопросы, пишем в комменты
Отличные новости от хостинг-компании Inferno Solutions:
В связи с запуском новой площадки хостинг-компания Inferno Solutions предлагает 50% скидку на весь срок аренды любого Linux VPS в Эстонии тем клиентам, которые сделают заказ до 1 июля! Используйте код скидки EST50. Отзывы о компании.
P.S. Понравился пост? Скорее жми -
P.P.S. НЕ забудьте про обмен постовыми!
Советую почитать:
SeoTitan отвечает:
Октябрь 12th, 2011 at 11:00
Спасибо вам за приятные отзывы!
[Ответить]