| Robot.txt |
| 03.03.10 17:39 |
|
Рано или поздно оптимизаторы сталкиваются с проблемой дублей страниц сайтов или желанием отключить индексацию определенных папок, разделов или динамических ссылок с какой-нибудь переменной. Так вот все поисковые роботы при посещении сайта, в первую очередь, ищут файл robots.txt. Это текстовый файл, находящийся в корневой директории сайта, в нем записываются специальные инструкции для поисковых роботов. Рассмотрим наиболее востребованные примеры robot.txt, а также как правильно отключать индексацию ненужных страниц в joomla. 1. Запрет индексации папки cgi всеми поисковиками: User-agent: Yandex 10. Запрет индексации файлов myfile1.htm и myfile2.htm для Google: User-agent: Google 11. Запрет индексации файлов spisok.php и vsakaya-fignya.php для всех поисковиков: User-agent: * 12. Запрет индексации динамических ссылок с переменной sl: Решение проблем с индексацией страниц на Joomla! CMS. После попадания в индекс Яндекса некоторые обнаруживают неприятную особенность, которая заключается в индексировании всех страниц по ссылкам "Отправить на e-mail", часть печатных версий страниц (даже не смотр на то, что в админке глобальной конфигурации отключена индексация этих страниц), страницы из админки, куски из rss и т.д. Исключаем страницы из индексации: 1. Для запрета индексации страниц "Отправить на e-mail": Disallow: /index2.php?option=com_content&task=emailform 2. Для дополнительного запрета индексации печатных версий страниц, если включен встроенный SEF, то повредить эта строка не должна: Disallow: /index2.php?option=com_content&task=view 2а. Или можно указать так: Disallow: /index2.php?option=com_content 3а. Или так: Disallow: /index2.php 4. Для запрета индексации страниц, связанных с авторизацией на сайте: Disallow: /component/option,com_registration/ Disallow: /content/
|

Blog.News
- Сайты в ряде доменных зон могут быть удалены без предупреждения?
- Компания RU-CENTER вводит новые правила обслуживания доменов третьего уровня
- .KYOTO может стать первым доменом для определенной географической области
- Joomla 2.5.1 Stable
- FaLang достойный ответ Joomfish
- Открытое письмо Joomla-сообществу от команды Joomla.ru
- Xmap 2.2 (карта сайта) для Joomla 1.7
- Кот, который жил миллион раз
- Joomla 2.5 beta ждем выхода!
- Уменьшение размера компенсации расходов агента для вебмастеров физических лиц в sape.ru
- Чем шоколад лучше секса
- 2011-11-19
- 2011-11-18
- Вдвоем или своим путем... Ёсано Акико
- Как убрать картинку в Glossary 2.7?
- Как убрать копирайт в Glossary 2.76?
- Joomla! 1.7.2
- Платежный модуль для Virtuemart
- Модуль Phoca Gallery Tree 3.0.0 для Joomla 1.6
- Joomla 1.5
- Компонент Advanced Module Manager 1.18.1
- Япония обошла Китай в гонке суперкомпьютеров
- Joomla 1.6.3
- Поговорим о ресурсе Techdays.ru
- В Интернете создана «карта радиации» для измерения уровня радиоактивного излучения в мире
- Арт-проект от Google
- WiFi плакат
- 2011-01-31
- Путешествие
- 2011-01-30
- 2011-01-25
- 2011-01-15
- Joomla! 1.6. Релиз!
- VLC плагин для Opera и Firefox
- RC! Ура! 1.6 RC1
Комментарии
Подскажите пожалуйста, как можно закрыть от индексации определенный модуль, например "Последних новостей", который находится на всех страницах и часто Яндекс хватает заголовки от туда и индексирует их, а не нужную страницу.
Какой синтаксис для закрытия модуля в файле robots.txt в Joomla 1.5?
С уважение Александр
бороздя инет почти полдня нашел вот - можно даже скачать готовый: http://rabotaisam.ru/robotstxt/what-robotstxt.html
# запрещаем индексацию трекбеков, rss-ленты
Disallow: /trackback
Disallow: /xmlrpc.php
Disallow: /author*
RSS лента комментариев этой записи.