Файл robots.txt

Robots.txt — это текстовый файл, который нужно поместить в корневую директорию вашего сайта. Данный файл указывает роботу поисковой системы какие файлы и директории сайта можно индексировать, а какие нет.

Директива User-agent - обязательная и должна присутствовать в каждом файле. Указывает на робота, на который распространяются перечисленные далее другие директивы.

Директивы Allow/Disallow – разрешают или запрещают индексацию отдельных директорий или файлов сайта. Директории или файлы указываются далее за директивой в параметре. Параметр в директиве может быть только один. Звёздочка в параметре обозначает любой текст.

User-agent: *       # для всех роботов
Disallow: /*dat		# запретить индексировать все директории,
      # которые заканчиваются на dat
Disallow: /programs	# запретить индексировать директорию programs
Allow: /programs/js/	# в директории programs разрешить
      # индексировать поддиректорию js
Allow: /programs/example.html	# в директории programs разрешить
      # индексировать файл example.html
Со знака # начинается комментарий. В строке может располагаться только одна директива и без пробелов в начале строки. Директивы должны следовать подряд без пустых строк между ними.

В файле robots.txt может быть несколько директив User-agent:

User-agent: *
Disallow: /*dat		# для всех роботов

User-agent: YandexBot
Disallow: /*dat		# для роботов Яндекс

User-agent: GoogleBot
Disallow: /*dat		# для роботов Гугл
Пустая строка заканчивает действие директивы User-agent. Используя разные директивы User-agent можно установить запрет/разрешение индексации выбранных директорий для конкретного робота.

Директива sitemap указывает путь к файлу (файлам) sitemap.xml на вашем сайте. Файлов может быть несколько и называться не обязательно sitemap:

sitemap: https://mysite.com/ structure/ sitemap1.xml
sitemap: https://mysite.com/ structure/ sitemap2.xml

Директива Host служит для указания главного зеркала вашего сайта. Главное зеркало нужно указать, если ваш сайт доступен по нескольким доменам:

mysite.com
mysite.ru
Или для того, чтобы в результатах поиска имя вашего сайта было указано с www или без:
mysite.ru
www. mysite.ru
Директива Host должна быть только одна. Директиву Host распознаёт только робот Яндекса.

Пример файла robots.txt

User-agent: *
Disallow: /buffer/
Disallow: /inc/buffer/
Disallow: /promote.html

Host: primerka.ru
Sitemap: https://primerka.ru/sitemap.xml

 Вернуться... Следующий раздел...

Проверьте ваш IQ