Дубли страниц очень плохо влияют на вашу выдачу в поисковых системах. Многие вебмастера пишут на своих блогах как от них избавиться, а мы в этой статье рассмотрим, что делать если эти самые злосчастные дубли уже проиндексировались поисковиками и портят жизнь вашему сайту.
Как обнаружить дубли на сайте
Дубли на сайте я ищу с помощью панели вебмастера от Google. Заходим в «Параметры URL» и там отобразятся нежелательные переменные которые дублируют ваши страницы.
Как удалить дубли страниц из поиска
Для этого дублям станиц, которые находятся в индексе нам надо присвоить ошибку 404 и при очередном обходе роботом он увидит, что данной странице ошибка, он это отметит и если через некоторое время это не измениться поисковик выкинет эту страницу-дубль из индекса.
Этот код необходимо вставить в function.php следующий код:
Что бы дополнительно присвоить 404 ошибку любой другой странице, то добавьте в предыдущий код в function.php в этот код:
По данному примеру добавляем все ненужные Вам ссылки.
Сессии в адресе страниц
Данный способ можно применить и к другим CMS и у многих создают адреса страниц вида:
clubwp.ru/forums/?PHPSESSID=93adac36813a153a8d0bdaac8a0df33c.
Эта переменная обозначает сессию для пользователя, но её умудряются подхватить и проиндексировать поисковые системы. Таким образом одну и туже страницу может дублироваться до бесконечности:
и т.п.
Вдобавок запрета сессий в файле robots.txt рекомендуется произвести редирект с сессионных ссылок на неподвижные.
Осуществить все это следует данным способом:
1. В файле .htaccess записываем данный код:
2. В корень сайта закидываем или создаем новый файл redirect.php с таким содержимым:
А если у Вас PHPSESSID поисковики уже проиндексировали их, то можно этим страницам присвоить 404 ошибку, что бы исключить их из поиска. Для этого в файл redirect.php надо прописать другой код:
Cо временем эти страницы будут исчезать из поиска.
В данной статье я раскрыл решения особо популярных проблем, затрудняющих тактичную индексацию интернет-сайта.
Как обнаружить дубли на сайте
Дубли на сайте я ищу с помощью панели вебмастера от Google. Заходим в «Параметры URL» и там отобразятся нежелательные переменные которые дублируют ваши страницы.
Как удалить дубли страниц из поиска
Для этого дублям станиц, которые находятся в индексе нам надо присвоить ошибку 404 и при очередном обходе роботом он увидит, что данной странице ошибка, он это отметит и если через некоторое время это не измениться поисковик выкинет эту страницу-дубль из индекса.
Этот код необходимо вставить в function.php следующий код:
PHP:
add_filter('template_redirect','Redirect404');
function Redirect404()
{
$p=strpos($_SERVER['REQUEST_URI'],'/'.'attachment'.'/');
if($p!==FALSE) {
@header("HTTP/1.0 404 Not Found");
die();
}
if ( isset( $_GET['replytocom'] ) ) {
@header("HTTP/1.0 404 Not Found");
die();
}
if ( isset( $_GET['attachment_id'] ) ) {
@header("HTTP/1.0 404 Not Found");
die();
}
}
PHP:
if ( isset( $_GET['здесь текст url'] ) ) {
@header("HTTP/1.0 404 Not Found");
die();
}
Сессии в адресе страниц
Данный способ можно применить и к другим CMS и у многих создают адреса страниц вида:
clubwp.ru/forums/?PHPSESSID=93adac36813a153a8d0bdaac8a0df33c.
Эта переменная обозначает сессию для пользователя, но её умудряются подхватить и проиндексировать поисковые системы. Таким образом одну и туже страницу может дублироваться до бесконечности:
Код:
http://clubwp.ru/forums/
http://clubwp.ru/forums/?PHPSESSID=93adac36813a153a8d0bdaac8a0df33c
http://clubwp.ru/forums/?PHPSESSID=04a747a432a95a0da0b795dc1bdl9 f9e
Вдобавок запрета сессий в файле robots.txt рекомендуется произвести редирект с сессионных ссылок на неподвижные.
Осуществить все это следует данным способом:
1. В файле .htaccess записываем данный код:
Код:
RewriteEngine On
RewriteCond %{QUERY_STRING} PHPSESSID
RewriteRule .* redirect.php [L]
PHP:
<?php $redirect_addr=substr($_SERVER['REQUEST_URI'],0,strpos($_SERVER['REQUEST_URI'],'PHPSESSID')-1); header('Location: http://'.$_SERVER['HTTP_HOST'].$redirect_addr); exit(); ?>
PHP:
<?php header("HTTP/1.0 404 Not Found"); ?>
После это изменения надо отслеживать работу сайта, возможно некорректное работа всего функционала сайта. Мною было замечено, что не работала капча.
Cо временем эти страницы будут исчезать из поиска.
В данной статье я раскрыл решения особо популярных проблем, затрудняющих тактичную индексацию интернет-сайта.