Como evitar que o Google rastreie determinadas páginas do site
Postado por Marcio Okabe | Arquivado em Google, Profissional Web
Esta é uma pergunta comum e existem algumas maneiras de resolver este problema:
1 – Arquivo robots.txt
Criar um arquivo chamado robots.txt e colocá-lo na raiz do site.
Neste arquivo devem ser colocadas as regras desejadas para que o Google não rastreie:
User-agent: o robô que vai receber a regra seguinte
Disallow: as páginas que você deseja bloquear
Exemplos:
a) Bloqueia o diretório cadastro da indexação:
User-agent: Googlebot
Disallow: /cadastro
b) Bloqueia a indexação de arquivos PDF
User-agent: Googlebot
Disallow: /*.pdf$
c) Bloqueia o arquivo funcionarios.html no diretório /cadastro
User-agent: Googlebot
Disallow: /cadastro/funcionarios.html
Veja mais em:
http://www.robotstxt.org/robotstxt.html
http://www.google.com/support/webmasters/bin/answer.py?answer=35303
2 – Usando META TAGs para bloquear conteúdo
Outra maneira de bloquear conteúdo é incluir a seguinte linha entre as tags
do site:Veja mais em:
http://www.robotstxt.org/meta.html
Posts relacionados
Saiba mais sobre Marketing Digital
- Siga a Konfide no twitter
- Assine o RSS do blog
- Curta a Konfide no Facebook
- Siga a Konfide no Linkedin
Marcio Okabe
Engenheiro Eletrônico formado pela Unicamp e Pós-graduado em Administração pela FGV. Sócio/fundador da Konfide Marketing Digital. Entusiasta do conceito Open Source, principalmente o Joomla!/WordPress. Já treinou mais de 1500 pessoas no curso de Marketing no Google. "Feliz aquele que transfere o que sabe e aprende o que ensina." Cora Coralina






maio 16th, 2008 at 17:15
No item 2 ficou faltando a linha de exemplo. Faltou a informação (se correta) de que o Google não rastreia páginas que não tem link para ela.