![]() |
robots.txt
Что такое robots.txt
robots.txt - Файл для ограничения доступа к содержимому роботам на HTTP сервере. Его необходимо размещать в корневой директории сайта. Инструкции, содержащиеся в файле, могут запрещать к индексации некоторые разделы или страницы на сайте, рекомендовать поисковому боту соблюдать определенный временной интервал между скачиванием документов с сервера и др. Имя файла не должно содержать заглавных букв! Записи в файле разделяются одной или несколькими пустыми строками. Комментарии в файле robots.txt начинаются знаком “#” и заканчиваются окончанием строки. Создание файла Чтобы создать файл robots.txt, нужен простой текстовый файл. Если вы не собираетесь создавать запреты к индексации, можно сделать пустой файл. Описание В файл robots.txt обычно пишут примерно следующее: Код:
User-agent: *! Каждая директория указана на отдельной строке - нельзя написать: Код:
Disallow: /cgi-bin/ /tmp/Регулярные выражения и символы подстановки так же нельзя использовать. "Звездочка" (*) в инструкции User-agent означает "любой робот". Инструкции вида: Код HTML:
Disallow: *.gifКод:
User-agent: Ya*---- Запретить весь сайт для индексации всеми роботами Код:
User-agent: *Код:
User-agent: *Закрыть от индексации только несколько каталогов Код:
User-agent: *Код:
User-agent: BadBotКод:
User-agent: Yandex |
Частые ошибки
Перепутанные инструкции Неправильно: Код:
User-agent: /Код:
User-agent: YandexНельзя: Код:
Disallow: /css/ /cgi-bin/ /images/Некоторые просто отбросят пробелы и интерпретируют как: Код:
Disallow: /css/cgi-bin/images/Правильно писать так: Код:
Disallow: /css/Файл должен называться robots.txt, а не Robots.txt или ROBOTS.TXT и уж никак не robot.txt Пустая строка в User-agent Неправильно: Код:
User-agent: Код:
User-agent: *URL необходимо писать без префикса http:// и без закрывающего слеша / Неправильно: Код:
User-agent: YandexКод:
User-agent: YandexСимволы подстановки в Disallow Нельзя: Код:
User-agent: *http://www.google.ru/support/webmast...367&topic=8846 |
| Время: 16:43 |