Просмотр примеров появившихся и удаленных страниц из поиска

Возвращает URL страниц, появившихся в поиске или исключенных из него — до 50 000.

  1. Формат запроса
  2. Формат ответа
  3. Коды ответа

Формат запроса

GET https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/search-urls/events/samples/?[&offset=0&limit=100]

Path-параметры

Имя Обязательный Тип Значение по умолчанию Описание
user-id Да int64 ID пользователя. Необходим для вызова любых ресурсов API Яндекс.Вебмастера. Чтобы получить его, используйте метод GET /user/.
host-id Да host id ID сайта. Чтобы получить его, используйте метод GET /user/{user-id}/hosts/.

Query-параметры

Имя Обязательный Тип Значение по умолчанию Описание
offset Нет int32 Смещение списка. Минимальное значение — 0.
limit Нет int32 Размер страницы (1-100).

Формат ответа

Примеры

{
  "count": 1,
  "samples": [
    {
      "url": "http://example.com/some/path?a=b",
      "title": "some string",
      "event_date": "2016-01-01T00:00:00,000+0300",
      "last_access": "2016-01-01T00:00:00,000+0300",
      "event": "APPEARED_IN_SEARCH",
      "excluded_url_status": "NOTHING_FOUND",
      "bad_http_status": 500,
      "target_url": "http://example.com/some/path?a=b"
    }
  ]
}
Имя Обязательный Тип Описание
count Да int32 Общее количество доступных примеров.
sample | samples Да Примеры страниц.
url Да url Адрес страницы.
title Да string Заголовок страницы.
event_date Да datetime Дата появления или исключения страницы.
last_access Да datetime Дата последнего обхода страницы до ее появления или исключения.
event Да ApiSearchEventEnum Появление или исключение страницы.
excluded_url_status Нет ApiExcludedUrlStatus Причина исключения страницы.
bad_http_status Нет int32 HTTP-код ответа страницы для статуса HTTP_ERROR.
target_url Нет url Другой адрес страницы, по которому она известна роботу. Это может быть цель редиректа, канонический адрес или дублирующая страница.

Состояние страницы сайта в результатах поиска (ApiSearchEventEnum)

Индикатор Описание
APPEARED_IN_SEARCH Страница появилась в результатах поиска.
REMOVED_FROM_SEARCH Страница исключена из результатов поиска.

Причины исключения страницы сайта из результатов поиска (ApiExcludedUrlStatus)

Индикатор Описание
NOTHING_FOUND Роботу неизвестно о странице или она длительное время была недоступна. Отправьте страницу на переобход.
HOST_ERROR При обращении к сайту роботу не удалось установить соединение с сервером. Проверьте ответ сервера, убедитесь в отсутствии блокировки робота Яндекса на стороне провайдера. Сайт начнет индексироваться автоматически, если станет доступным для робота. О User agent роботов см. в разделе Помощи.
REDIRECT_NOTSEARCHABLE Страница осуществляет перенаправление, при котором индексируется его цель (RedirectTarget). Проверьте индексирование страницы, на которую выполняется редирект.
HTTP_ERROR При обращении к странице возникла ошибка «HTTP-ошибка». Проверьте ответ сервера. Если проблема актуальна, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход.
NOT_CANONICAL Страница проиндексирована по каноническому адресу, который был указан в атрибуте rel="canonical" в ее исходном коде. Исправьте или удалите атрибут, если он указан некорректно. Робот отследит изменения автоматически.
NOT_MAIN_MIRROR Страница относится к неглавному зеркалу сайта, поэтому была исключена из поиска.
PARSER_ERROR При обращении к странице роботу не удалось получить ее содержимое. Проверьте ответ сервера или наличие запрещающих HTML-элементов. Если проблема актуальна, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход.
ROBOTS_HOST_ERROR Индексирование сайта запрещено в файле robots.txt. Робот автоматически начнет посещать страницу, когда сайт станет доступен для индексирования.
ROBOTS_URL_ERROR Индексирование страницы запрещено в robots.txt. Робот автоматически начнет посещать страницу, когда она станет доступной для индексирования.
DUPLICATE Страница дублирует уже представленную в поиске страницу сайта. Подробнее см. в разделе Помощи.
LOW_QUALITY Страница отсутствует в поиске в результате работы алгоритма. Если алгоритм сочтет страницу достаточно релевантной запросам пользователей, она появится в поиске автоматически.
CLEAN_PARAMS Страница была исключена из поиска в результате обработки роботом директивы Clean-param. Чтобы страница индексировалась, измените robots.txt.
NO_INDEX Страница исключена из-за мета-тега robots со значением noindex.
OTHER

У робота нет актуальных данных для страницы.

Проверьте ответ сервера или наличие запрещающих HTML-элементов.

Если страница недоступна для робота, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход.

Коды ответа

Чтобы посмотреть структуру ответа подробнее, нажмите на причину.

Код Причина Описание
200 OK
403

INVALID_USER_ID

ID пользователя, выдавшего токен, отличается от указанного в запросе. В примерах ниже {user_id} указан правильный uid владельца OAuth-токена.

{
  "error_code": "INVALID_USER_ID",
  "available_user_id": 1,
  "error_message": "Invalid user id. {user_id} should be used."
}
404 HOST_NOT_VERIFIED
Не подтверждены права на управление сайтом.
{
  "error_code": "HOST_NOT_VERIFIED",
  "host_id": "http:ya.ru:80",
  "error_message": "some string"
}