Проверка сайта на битые ссылки – поиск битых ссылок с помощью Broken Link Checker для WordPress

Текстовый транскрипт видео:

В этом видео мы поговорим о том, как настроить автоматическое сканирование сайта на предмет наличия битых ссылок с помощью плагина для WordPress Broken Link Checker.

Не нужно вам объяснять, что битые ссылки на сайте – это неудобство с точки зрения пользователя, потому что люди переходят по ссылкам и у них открывается «ошибка 404», из-за чего они не могут попасть на ту страницу, на которую вы хотели бы, чтобы они попали. Наличие битых ссылок – это отрицательный фактор для поисковых систем, потому что показывает, что вебмастер не следит за своим сайтом. Для большинства сайтов это не критично, потому что битых ссылок должно быть действительно много, но, все равно, для удобства нашего пользователя нужно стараться, чтобы битых ссылок не было, а информация была актуальной.

Кому полезен плагин Broken Link Checker

Сразу оговорюсь, что плагин Broken Link Checker предназначен для поиска битых ссылок на своем сайте. То есть когда у вас есть свой сайт на своем хостинге, есть доступ к панели администрирования WordPress и вы хотите найти на нем неработающие ссылки. Если вы хотите найти неработающие или битые ссылки на чужом сайте, то для этого есть другие программы и сервисы, которые мы разберем в другом видео. Сейчас разберем Broken Link Checker применительно к поиску ссылок на своем сайте.

Настройка плагина Broken Link Checker

После установки плагина переходим в его настройки. Это пункт «настройки» — «настройки проверки ссылок». Здесь, на вкладке General, я оставляю все настройки по умолчанию, но давайте коротко рассмотрим все основные моменты. «Состояние» показывает количество неправильных ссылок, точнее, сколько ссылок находится в очереди на проверку. Здесь можно задать периодичность проверки. Обычно я оставлю эти настройки без изменения.

e-mail уведомления. Первая галочка обозначает, что плагин будет посылать уведомления администратору сайта о новых обнаруженных битых ссылках. Вторая галочка – уведомлять авторов об обнаруженных битых ссылках в их постах. Если у вас блог, в котором вы даете доступ авторам, которые публикуют свои материалы, то есть не только вы один ведете этот блог, то редактор или админ не всегда знает, на какую страницу хотел ссылаться автор, поэтому такая функция бывает очень полезна. Поставленная галочка позволит уведомлять автора, который писал статью, что в его статье обнаружены битые/неработающие ссылки, соответственно, если есть необходимость, автор может их исправить.

В поле «notification e-mail address» указываем e-mail дополнительные  адреса, куда мы хотим отправлять уведомления. По умолчанию берутся те адреса, которые указаны в профайлах. Если мы хотим какие-то дополнительные адреса, то вписываем их сюда.

Блок «Link tweaks» позволяет добавить форматирование. «Apply custom formatting to broken links» подразумевает, что битые ссылки будут выделены. Обычно они выделяются зачеркнутой линией, визуально отличая ее для пользователей, показывая, что это битая ссылка. Если вы хотите, то можно отредактировать CSS, чтобы ссылки, например, были выделены красным и зачеркнутым. Здесь можно отредактировать и добавить стили. Также можно добавить стили для удаленных ссылок. Можно поставить галочку в пункте «Stop search engines from following broken links», чтобы на битой ссылке ставился атрибут «nofollow». Остальные две галочки, в принципе, нас не интересуют.

Где искать битые ссылки

Следующая вкладка «Look For Links In», которая отображает, какие блоки и секции вашего сайта плагин будет сканировать на поиск битых ссылок. То есть здесь blogroll, комментарии, custom fields пригодится в том случае, если вы используете пользовательские поля для хранения информации о каких-то ссылках или, может быть, вы вставляете туда целые фрагменты HTML, которые содержат активные гиперссылки. Чтобы сканировать пользовательские поля, нужно здесь указать имя пользовательского поля, допустим «custom_field_name». Если это поле содержит HTML-код, то нужно поставить префикс «html:» далее пишем имя пользовательского поля.

Здесь мы указываем типы постов:

  • Записи;
  • Страницы;
  • Портфолио;
  • Комментарии;
  • Товары;
  • Заказы и тд.

Выбирайте те типы записей, которые вы используете на вашем сайте, которые видны конечному пользователю. Потому что если у вас есть разделы, в которых вы храните отладочную информацию или что-то тестируете, тогда нет особого смысла ставить их на сканирование, поскольку в процессе работы могут быть битые ссылки. Какой смысл вам их редактировать, потому что конечный пользователь их все равно не увидит. То есть они нужны для вашего персонального использования. Ставьте галочки в тех типах записей, которые видны конечному пользователю. Например, записи, комментарии, отзывы, страницы, может быть какие-то форумы. Я обычно ставлю на проверку только опубликованные записи, которые видны пользователю. В «черновиках», «на утверждении» или «личное» находятся записи, которые еще не готовы, соответственно, нет смысла их пока проверять и тратить на это ресурсы. Если у вас есть запланированные публикации, допустим, на месяц вперед, то ставьте галочку, чтобы проверять запланированные посты тоже, чтобы в момент публикации в них были только работающие ссылки.

Какие ссылки проверять — выбор типов ссылок

В разделе «Which Links To Check» мы выбираем, какие типы ссылок проверять, то есть HTML, картинки, Plain text URLs (если у вас ссылка не является активной, а начинается в тексте с http:// далее адрес сайта или страницы). Нужно ли проверять такие ссылки? Зачастую веб-мастера дают такую ссылку, когда не хотят ссылаться на нее, просто выдавая ее текстом без активной гиперссылки, но в тоже время вам нужно чтобы эта ссылка работала, чтобы пользователи, скопировав ее в браузер, попал на соответствующую страницу. Если вы так делаете, то ставьте галочку здесь. Соответственно, проверять YouTube, ссылки на видео, если используется старый код, Google видео и так далее. Здесь выбираем типы поддерживаемых ссылок, которые необходимо проверять. Здесь так же можно указать список исключений или доменов. Если вы не хотите ссылки на какой-то домен проверять, знаете, что он не работает или блокирует запросы с вашего сайта. Указываете домен полностью или можете указать частично какие-то ключевые слова. Другими словами, если я не хочу проверять ссылки, где используется слово «яблоко», то я напишу здесь «яблоко» и плагин не будет проверять ссылки содержащие эту фразу.

Далее на вкладке Protocols & APIs можно выбрать протоколы. Я обычно ставлю проверку «basic HTTP» и «YouTube API». Я не использую ссылки Mediafire или RepidShare на своем сайте, поэтому не вижу смысла ставить эти галочки. Если вы используете эти ссылки, допустим, ссылки на скачивание файлов на этих сайтах, тогда нужно поставить галочки.

Дополнительные настройки для оптимальной проверки

На вкладке «Дополнительно» мы можем поставить время ожидания загрузки. Плагин проверяет в данном случае в течение 30 секунд, смотрит, если от страницы не было ответа, то он помечает эту ссылку как битую. Здесь мы ставим галочку, что проверять ссылки постоянно, если открыта консоль WordPress и запускать ежечасно в фоновом режиме. Так же здесь мы настраиваем, кому показывать виджет с неправильными ссылками: редактору и всем пользователям с более высокими полномочиями, только администратору или никому. Далее выбираем, какие действия предпринять с обнаруженными битыми ссылками:

  • редактировать,
  • удалить,
  • пометить небитой,
  • пропустить,
  • перепроверить заново,
  • исправить редерект.

Максимальное время работы плагина можно указать здесь. Также здесь указывается лимит нагрузки сервера. Пункт «Server load limit» позволяет указать лимит нагрузки сервера, при которой проверка битых ссылок будет отключаться. Если нагрузка сервера больше лимита, который вы указали здесь, то проверка ссылок не будет проводиться, чтобы не добавлять дополнительную нагрузку. Это имеет смысл в том случае, если у вас слабый сервер, и вы хотите, чтобы проверка ссылок запускалась, например, ночью, когда нагрузка на сервер не большая, чтобы она не отъедала дополнительные ресурсы. К примеру, текущая нагрузка сервера 0,51, а лимит 4, соответственно сейчас нагрузка на сервер не большая и проверка ссылок идет в нормальном режиме.

Можно поставить галочку и включить логирование. Логирование – запись всех произведенных действий в TXT файл. Я предпочитаю не создавать дополнительные файлы на сервере, потому что они, как правило, отъедают место, и потом забываешь их удалить. Если у вас большое количество ссылок, то файлы логов могут  получаться очень большими. Зачем вам лишняя головная боль? Я обычно здесь не ставлю галочку.

Здесь можно перезапустить плагин. То есть заставить заново его проверить все ссылки, все страницы, которые есть на сайте. Если вы видите, что что-то идет не так или плагин завис, что-то не правильно, то можно перепроверить все страницы и плагин запустит свою работу сначала.

Результаты поиска битых ссылок

После того как вы установили, настроили и сохранили все изменения, по прошествии какого-то времени плагин начнет проверять и выдавать вам ссылки. Если мы перейдем на страницу с битыми ссылками, она выглядит так. В данный момент обнаружено 26 битых или не работающих ссылок, в таблице видно, что или кто является источником. Вот мы видим, что пользователь Roman оставил комментарий и его сайт не работает.

Я открываю этот сайт, чтобы дополнительно проверить, что ссылка действительно битая, потому что иногда бывает, к примеру, сервер на какое-то время упал и, соответственно,  Broken Link Checker обратился к нему в этот момент и получил отрицательный ответ, пометил ссылку битой, а потом работа сервера восстановилась, но эта ссылка у вас помечена как битая. Чтобы не удалять нужные ссылки, можно открыть вручную проверить или выбрать эти ссылки, и выбрать галочку «Recheck» чтобы перепроверить. Но, я знаю, что эта ссылка битая, я вручную посмотрел этот сайт, соответственно я могу нажать «удалить». Теперь ссылка из этого комментария удалиться и из списка битых ссылок эта ссылка уходит.

Здесь можно посмотреть, где в каких постах, записях, страницах у вас будут битые ссылки, соответственно здесь выдается статус, 404 не найдена, или, если это Redirect, то здесь будет, другой статус — 301, 302 Redirect, или 403, если запрещен доступ, опять же server not found. То есть мы можем проверить, все и исправить при необходимости. Если, например, мы здесь видим русскоязычные символы и скорее всего поэтому ссылка не работает. В этой записи/посте была ссылка на картину, тип ссылки «изображение» и если мы хотим исправить я могу нажать «изменить», перейти на этот пост и исправить картинку, вставить нужную без ошибки, чтобы ссылка была правильной.

Потом я могу вернуться, нажать  «Recheck» или «Dismiss» (пропустить) или могу оставить без изменений, и плагин через 72 часа, когда начнет проверять заново, увидит, что ее больше нет, и соответственно, уберет ее отсюда. Это очень удобно, происходит это в автоматическом режиме и вы всегда можете зайти посмотреть какие ссылки на вашем сайте не работают, почистить их и держать в актуальном состоянии, чтобы сайт всегда содержал актуальную информацию, был удобен для пользователя.

Если у вас возникли вопросы по поводу настройку плагина Broken Link Checker, то вы можете оставить комментарий, я постараюсь вам помочь. Если же у вас возникли вопросы, связанные в принципе с оформлением, продвижением или настройкой вашего сайта, то можете связаться со мной через страницу контактов на сайте, и мы сможем договориться о решении вашей проблемы. Мы уже не первый год работаем как с маленькими сайтами, так и с большими порталами.

Спасибо, что посмотрели это видео. Мне было приятно для вас его сделать. Буду благодарен, если вы поделитесь им в социальных сетях. Ставьте палец вверх, подписывайтесь на новые видео. Если у вас возникли вопросы или вам нужна помощь, перейдите по ссылке в официальном видео и  оставьте ваши комментарии, используя форму ниже.

2 мысли о “Проверка сайта на битые ссылки – поиск битых ссылок с помощью Broken Link Checker для WordPress

  1. Александр сказал:

    Хороший плагин. Я тоже его использую для поиска битых ссылок. Но прочитав статью, понял, что использовал это плагин поверхностно. Спасибо за обзор.

Добавить комментарий