Карта сайта и ошибки в sitemap.xml
Нет времени читать статью? Но хочешь прокачаться по SEO и рекламе?
Тогда забирай бесплатные материалы, которые помогут поднять сайт на новый уровень
5 уроков
концентрированной пользы
3 часа
качественной информации
Забирай, где удобно

Отсутствие карты сайта (sitemap.xml) или её неправильная настройка могут быть причиной проблем с индексацией любого сайта. И хоть сайт без XML карты может работать и даже индексироваться поисковиками, наличие правильно настроенного файла sitemap.xml повышает эффективность индексации. На этой странице вы узнаете, что такое карта сайта, зачем её нужно создавать и как это правильно сделать.

Что такое карта сайта

Само название “Карта сайта” полностью отражает смысл этого термина – это структурированная постоянно обновляемая информация о значимых для поисковых систем страницах вашего сайта в формате XML.

Что такое карта сайта проще всего понять на примере:

Пример карты сайта https://gvozd.info/sitemap_index.xml

Стандартный адрес карты – https://domain.com/sitemap.xml, именно в таком формате поисковые системы ожидают найти карту на вашем сайте. Такой формат является стандартом, но на практике ваш адрес может отличаться. Например, вы можете расположить файл подобным образом – https://gvozd.info/sitemap_index.xml. В этом случае важно настроить постоянный редирект (301) с базового адреса sitemap.xml на актуальный адрес, например:

Пример редиректа на карту сайта

Другие названия используются для удобства, например, если у вас несколько языковых версий сайта, вы можете создать отдельные файлы:

  • /sitemap-ru.xml
  • /sitemap-en.xml
  • /sitemap-de.xml
  • И другие названия

Подобное разделение является обязательным для сайтов, где больше 50 000 страниц или при весе файла с URL адресами более 50 Мб. Это максимальные параметры для обычного XML-Sitemap. Если у вас больше страниц или сам файл весит больше лимита, то требуется создать несколько файлов, подходящих под лимиты, а для навигации по ним создать “Индексный” файл XML-Sitemap (как в примере выше – /sitemap_index.xml), в котором будут ссылки на отдельные файлы.

Карту сайта часто называют по-разному, вот лишь некоторые популярные названия:

  • Карта сайта
  • Сайтмап
  • Sitemap.xml
  • XML-Карта
  • XML-Sitemap

Все эти термины об одном и том же, отличается лишь название. Но не стоит путать XML карту с HTML картой. Первая – создана для поисковых систем. Пользователи вашего сайта с ней не взаимодействуют. Вторая – карта сайта в формате HTML может упростить навигацию по сайту в том числе и для пользователей, так как имеет визуально наглядный формат. На этой странице мы говорим только про XML вариант, то есть карту сайта для поисковых систем.

Карта сайта – это обязательно или желательно?

Будет ли работать ваш проект без карты сайта? Да, и многие сайты годами работают именно так, но ожидать быструю и точную индексацию не стоит. Без корректно настроенной карты вы можете столкнуться с различными проблемами с поисковыми системами:

  • Не индексирует некоторые страницы
  • Индексирует медленно
  • Не пере-индексирует страницы после обновления
  • Индексирует то, что не надо или долго не убирает из выдачи страницы, которых не существует
  • И другими проблемами

Именно поэтому файл sitemap.xml – это базовая вещь для корректной работы. Большинство опытных вебмастеров и SEO специалистов проводят проверку sitemap.xml в первую очередь при анализе проекта, так как эта техническая деталь оказывает действительно большое влияние. Поэтому карта сайта – это хоть и желательное требование, но на практике оно является обязательным.

Как найти карту сайта?

Популярные CMS иногда по умолчанию создают sitemap.xml, поэтому, даже если вы сейчас впервые столкнулись с этим термином, у вас на проекте sitemap.xml может уже существовать. Вы можете проверить свой сайт или любой другой несколькими способами:

  1. Добавьте /sitemap.xml в браузере к URL вашего сайта, например https://domain.com/sitemap.xml. Должна открыться карта сайта или произойти редирект на карту сайта по другому адресу на вашем проекте.
  2. В поисковой строке Google задайте запрос по формату site:site.com filetype:xml, где “site.com” замените на свой домен. Если Google не видит XML файлов по-вашему URL адресу – это не повод переживать, иногда файл просто не отражается в выдаче. В этом случае перепроверяйте его наличие другими способами.
  3. Проверьте robots.txt, в некоторых случаях адрес прописывается именно в этом файле. Например, некоторые плагины для CMS прописывают расположение за вас.

Если ни один из способов не выдал вам расположение карты вашего сайта, то с высокой вероятностью, на вашем сайте её нет и вам предстоит её создать впервые.

Из чего состоит XML-Sitemap

Далее мы разберем, как просто создать карту сайта, но для лучшего понимания технической стороны рассмотрим минимальные требования, что обязательно должно быть в XML-Sitemap:

  • Версия XML и кодировка. Как правило, используется версия 1.0 и UTF-8 соответственно. Например:

    <?xml version=”1.0″ encoding=”UTF-8″?><?xml-stylesheet type=”text/xsl” href=”//gvozd.info/wp-content/plugins/wordpress-seo/css/main-sitemap.xsl”?>
  • Тег протокола. Для корректной работы обязательно указывается по какому стандарту создан файл с помощью параметра <urlset>. Вам не нужно самостоятельно изобретать код, можете использовать стандартный, например:

    <urlset xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance” xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″ xsi:schemaLocation=”http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd http://www.google.com/schemas/sitemap-image/1.1 http://www.google.com/schemas/sitemap-image/1.1/sitemap-image.xsd” xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

Помимо технических параметров, для корректной работы необходимо указать <url> и <loc> для каждой страницы, например:

Пример sitemap.xml с тегами <url> и <loc> для каждой страницы

В примере выше используются также некоторые дополнительные параметры, их наличие является опциональным, если вы хотите сообщить поисковой системе больше данных:

  • Когда страница обновлялась – указывается с помощью тега <lastmod>. При фактическом обновлении страницы важно обновлять этот параметр по стандартному формату записи даты: YYYY-MM-DDThh:mm:ss+TZD, например, 2023-03-28T13:07:42+00:00 для 28 марта 2023 года.
  • Частота обновления страницы – указывается с помощью тега <changefreq>. Вы можете подсказать поисковому роботу как часто необходимо проверять страницу повторно. Периодичность указывается на английском с помощью одного из терминов: always (для динамически обновляемых страниц), hourly (ежечасно), daily (каждый день), weekly (каждую неделю), monthly (каждый месяц), yearly (раз в год) или never (если страница никогда не обновляется). Строгое соблюдение указанной периодичности не требуется, указывается примерная регулярность обновления. 
  • Приоритетность страницы относительно других страниц вашего сайта с помощью тега <priority>. Указывается в диапазоне 0,0 до 1,0. Как правило, приоритетность соответствует вложенности страниц, то есть 1,0 указывается у главной страницы и далее в зависимости от вложенности уменьшается. Назначать всем страницам самый высокий приоритет нет смысла, так как параметр работает относительно ваших собственных страниц. Назначение высокого приоритета для всех страниц – распространенная ошибка. Подобное оформление сделает страницы равноценными между собой, что фактически сведет на нет смысл выставления приоритетности. 

Как создать карту сайта

Существует три основных способа, как создать карту сайта:

  • Вручную
  • Генератором карты-сайта
  • Плагином для CMS

Разберем каждый способ подробней.

Ручное создание карты

Ручной способ подходит только для небольших проектов, которые редко обновляются. Важно учитывать, что вам потребуется не только создать файл один раз, а далее обновлять его также вручную при появлении новых страниц или их модификации. Поэтому ручной способ является наименее удобным из всех.

В ручном создании глобально нет сложностей, кроме затрачиваемого времени. Используя обязательные параметры, вы можете создать sitemap.xml буквально в блокноте или любом редакторе кода, и впоследствии также обновлять файл.

После создания не забудьте разместить файл на сервере, чтобы он был доступен по адресу https://domain.com/sitemap.xml. Или по другому адресу на ваш выбор, но в этом случае добавьте 301 редирект на стандартный URL адрес /sitemap.xml.

Генераторы карт

Существуют десятки платных и бесплатных генераторов карты сайта. Принцип у всех схожий – генераторы “просканируют” ваш сайт, соберут все страницы и создадут за вас sitemap.xml. Примеры генераторов:

Работу абсолютно любого генератора важно перепроверять – если он действительно добавил все страницы и наоборот – если не добавил в карту несуществующие или не нужные.

Аналогично ручному созданию, не забудьте разместить полученный файл на вашем сервере.

Плагины

Если ваш сайт работает на WordPress или другой популярной CMS, вы можете решить генерацию sitemap.xml с помощью готовых плагинов. Например, для WordPress вы можете использовать один из следующих плагинов:

  1. YOAST – многофункциональный плагин, где карта сайта лишь одна из многочисленных функций.
  2. All in One SEO – аналогично плагину YOAST, помимо sitemap.xml решает и другие SEO задачи.
  3. XML Sitemap Generator for Google
  4. Sitemap by BestWebSoft
  5. WP Sitemap Page

Вы можете выбрать любое решение, соответствующее вашим требованиям. Например, в бесплатном плагине All in One SEO вы можете настроить карту сайта буквально в пару кликов:

Пример настройки плагина All in One SEO для WordPress

Важно: Не используйте одновременно два решения, это лишь запутает поисковые системы. Вы можете использовать мультифункциональные SEO плагины, такие как YOAST или All in One SEO вместе с узкоспециализированными решениями для XML карты сайта, но в этом случае в первом плагине отключите генерацию sitemap.xml.

Для других CMS вы можете найти готовые решения в каталогах плагинов. Решения есть для Joomla, Drupal и других систем управления, а в некоторые функционал даже встроен «из коробки».

Ошибки при создании XML-Sitemap

Отсутствие sitemap.xml – грубая ошибка, но наличие этого файла само по себе не значит, что вы сделали всё правильно. Важно, чтобы карта была сделана корректно.

1. Нет ссылки на sitemap.xml в robots.txt

В отличие от robots.txt, карта сайта не обязательно находится по адресу https://domain.com/sitemap.xml. Даже если вы используете стандартный адрес, важно направить поисковую систему на файл – для этого добавить в robots.txt ссылку на карту сайта.

Дополнительно вы можете указать ссылку на sitemap.xml в консоли Google Webmasters, но наличие ссылки в robots.txt крайне желательно.

2. Файл sitemap.xml слишком большой

Несмотря на то, что максимальный объем ограничен 50 000 URL адресами и 50 Мб, желательно не перегружать sitemap.xml.

Золотого стандарта не существует, но для себя вы можете ориентироваться примерно на 5000 страниц. Если на вашем сайте их больше, то уже имеет смысл разделить sitemap.xml на несколько. Делить можно по разным признакам, например, по языку, по категориям и другим.

Важно: если создаете несколько sitemap.xml, обязательно сделайте индексный файл, в котором укажите ссылки на отдельные карты.

3. Неверно расставлены приоритеты страниц

Вы можете указать приоритет разным страницам от 0,00 до 1,00 – это правильно, но будет ошибкой указывать всем страницам один приоритет.

Не указывать приоритет тоже ошибка, которая особенно чувствуется на сайтах с 1000+ страниц. Поисковый робот не может за один обход переиндексировать тысячи страниц вашего сайта. Поэтому важно подсказать роботу, какие страницы в приоритете.

Какой странице отдать больше приоритет относительно других страниц вашего сайта – это на ваш выбор, поэтому не забывайте корректно настраивать приоритетность.

4. Мусор в sitemap.xml

Хоть sitemap.xml и призван отражать страницы вашего сайта, но не нужные в поиске страницы туда включать смысла нет.

Например, если у вас большое количество страниц внутри категорий (пагинация), то все кроме первой страницы категории можно исключить из карты. Аналогично поступить нужно с результатами поиска на вашем сайте и любыми страницами, не нужными в поисковой выдаче.

5. Обновление карты сайта

Создать карту сайта – это шаг номер один, но далее вам предстоит постоянно обновлять файл. Поэтому удобно использовать автоматизированные решения. О том, что страница обновилась можно и нужно сообщать через тег <lastmod>. Без этого тега поисковый робот всё равно рано или поздно перепроверит страницу, но это может произойти позже, чем вам бы хотелось.

И хоть тег <lastmod> является необязательным, его отсутствие может негативно повлиять на эффективность переобхода вашего сайта. Особенно сильно <lastmod> влияет на проекты, которые действительно часто обновляются. Например, на интернет-магазины, где регулярно меняются цены и любые другие сайты с любой постоянно обновляемой информацией.

Помимо <lastmod>, важно, чтобы в карте сайта была отражена актуальная ситуация. Например, если вы удалили страницу, важно, чтобы её не оставалось в sitemap.xml. Автоматизированные решения, как плагины для WordPress, решают этот вопрос автоматически, но если вы работаете вручную, то позаботьтесь, чтобы в карте не было несуществующих страниц.

Стоит ли создавать карту сайта?

Карта сайта – это неотъемлемая часть всех проектов, ориентированных на трафик из поисковых систем. И хоть ваш проект может работать и без файла XML-Sitemap, его наличие позволит добиться корректной индексации со стороны поисковых систем.

Поэтому, если вам важен трафик из Яндекса, Google и других поисковиков, обязательно позаботьтесь не только о наличии файла sitemap.xml у вашего сайта, но и о его корректности.

Гвоздь - Нестандартные решения
встретимся в топе
+7 999 171 26 37
INFO@GVOZD.INFO

Работаю, как ИП и поэтому платить можно по договору или на карту

Скачать пример договора