Побеждаем error 404 pages
Всем привет сегодня расскажу, что такое error 404 pages на сайте и как нам сделать, чтобы их было меньше. Рассмотрим, хорошо это или плохо. Как найти у вас на сайте все не существующие страницы error 404 pages. Поверьте моему опыту, если вы за этим не следите, то вы сами, своими руками топите ваш проект, так как интернет и поисковые роботы постоянно изменяются, вводя новые алгоритмы и никогда не знаешь, где и когда может появится в индексе куча мусора, ведущего на ваш сайт.
Что такое error 404 not found
И так сообщение error 404 pages, означает, что при попадании на нужный вам ресурс, страница которую вы искали уже не существует или ее не было. 404 код сообщает браузеру, что не то ты ищешь, нет меня уже. Сделана специально, для донесения браузерам и поисковым ботам, что страницы не существует.
Хорошо или плохо когда выскакивает ошибка 404
Как я и писал выше сама директива в себе ничего плохого не несет, а вот большое их количество в поисковой выдаче очень плохо, так как отсылает пользователя на не существующие ресурсы, тем самым понижая доверие к ресурсу. Еще представим у вас была страница, но вы ее в последствии удалили, а ссылка на нее есть в поисковой выдаче, у этой страницы раньше был некий статический вес, некая такая пискомерка, по которой поисковики смотрят крутость страницы, и если ее нет то и этот вес утекает в никуда и его хорошо бы пока страница полностью не вылетела из индекса, перевести в нужное вам место, для этого придуманы перенаправления или redirect.
Как найти страницы с error 404
Вариантов, на самом деле очень много, приведу самые полезные и бесплатные с моей точки зрения.
Google.com/webmasters
Гугл webmasters, это личный кабинет куда вы добавляете свой сайт. В данном кабинете можно мониторить сайт по различным параметрам, таким как
- Сколько страниц проиндексировалось
- Какие проблемы есть с HTML
- Количество поисковых запросов в месяц
- Ошибок сканирования
Нам как раз и нужен пункт ошибки сканирования, они нам и покажут все страницы найденные ботами гугла, которые отдают код 404.
Можно посмотреть более детально, что именно не найдено, сверху вы увидите ссылку, если вы ее поправили можно нажать кнопку Отметить как исправленный.
Webmaster.yandex.ru
У Яндекса так же можно найти не существующие страницы (error 404 pages), так же переходим по адресу указанному в заголовке. Тут нас будет интересовать пункт Исключенные страницы, со статусом Ресурс не найден (404)
Посмотрите их более детально, удобно сделан график показывающий, какая тенденция у вас не существующих страниц, она должна стремиться к нулю.
Утилита XENU
Есть бесплатная утилитка XENU. Скачать XENU можно тут. Смысл ее вот в чем, вы указываете какой сайт нужно сканировать
Начнется, довольно продолжительное сканирование, все зависит от размера сайта. В итоге вы получите список ссылок. Где вы увидите зеленые и красные, как понятно, все в идеале должно быть зеленым, кроме того, что вы сами заблокировали.
Для фильтрации, только красных ссылок, откройте View > Show broken links only
В итоге вы уже получаете список с краснотой, который следует изучить и фиксить, тем самым вы будите делать ваш сайт лучше в глазах поисковых систем.
Как победить error 404 pages
И так напомню у меня сайт на движке wordpress, а это значит, что эту задачу уже давно решили. Самый правильный вариант это использование файла htaccess, в котором нужно сделать 301 редирект (при 301 редиректе произойдет склейка старого и нового адресов: параметры вроде PageRank и тИЦ), но для новичков это бывает сложновато, это требует знать синтаксис и лезть на ftp сервер хостинга. Нас же спасет простой плагин, не нагружающий сервер, который в два клика победит данную проблему. Плагин Redirection нам поможет. Как устанавливать плагины WordPress я рассказывал вот тут, советую ознакомиться. После установки вы идете в Инструменты > Перенаправления
Предположим у меня есть вот такая страница выдающая 404 ошибку, копирую ее адрес.
Создаю новое правило, в котором в источнике пишу страницу, которой уже не существует, а в адресе назначения главную страницу сайта, на нее я и буду перенаправлять.
Новое перенаправление добавлено.
Проверяем его, должно все работать. Если все ок не забудьте в гугле пометить, что вы это исправили.
Выводы
- Старайтесь минимизировать количество не существующих страниц в индексе сайта, делайте 301 редирект
- Не забывайте отмечать исправлено в кабинете Гугл
- К сожалению Яндекс не дает такую возможность пометки, но в любом случае исправляйте, что он нашел
- Закрывайте от индексации в файле robots.txt, все не нужное, нечего ему делать в индексе
Материал сайта pyatilistnik.org
Спасибо за подробное объяснение, очень интересно
Да 404 page not found, еще та зараза