technical

Sitemap XML

O MetricSpot tenta buscar /sitemap.xml. O sitemap é como dizes aos motores de busca e aos crawlers de IA quais os URLs do teu site que existem e que importam.

O que esta verificação faz

Faz um GET a https://teudominio.com/sitemap.xml e verifica se devolve um sitemap válido ou um índice de sitemap. Procuramos também uma linha Sitemap: no teu robots.txt (verificação separada).

Porque é importante

Um sitemap é o sinal explícito de quais URLs fazem parte do teu site. Sem ele, os crawlers dependem inteiramente das ligações internas para encontrar as tuas páginas, e qualquer URL que não esteja ligado a partir da homepage (páginas órfãs, categorias profundamente aninhadas, conteúdo recém-publicado) pode demorar semanas a ser descoberto, ou ficar de fora completamente.

Para crawlers de IA como o GPTBot, ClaudeBot e PerplexityBot, o sitemap é ainda mais importante — rasteiam de forma mais restrita do que o Googlebot e apoiam-se no sitemap como inventário canónico.

Como corrigir

Gera um sitemap na raiz do teu domínio. A maior parte das frameworks faz isto automaticamente:

Astro: npm install @astrojs/sitemap, depois em astro.config.mjs:

import sitemap from '@astrojs/sitemap';
export default defineConfig({
  site: 'https://teudominio.com',
  integrations: [sitemap()],
});

Next.js (App Router): cria app/sitemap.ts a devolver um array de { url, lastModified, changeFrequency, priority }.

WordPress: Yoast, Rank Math e SEOPress publicam todos um índice de sitemap automaticamente em /sitemap_index.xml — podes ter de adicionar um redirect de /sitemap.xml.

À mão: um sitemap.xml estático funciona para sites pequenos:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://teudominio.com/</loc>
    <lastmod>2026-05-01</lastmod>
  </url>
</urlset>

Depois de publicar, submete-o uma vez em Google Search Console → Sitemaps. O Google vai voltar a buscá-lo automaticamente daí em diante.

Perguntas frequentes

O sitemap tem de estar exatamente em /sitemap.xml?

Não — a linha Sitemap: no robots.txt é o mecanismo oficial de descoberta. Mas /sitemap.xml é a convenção; muitas ferramentas (incluindo o MetricSpot) procuram lá como fallback.

E os índices de sitemap?

Para sites com mais de 50.000 URLs ou 50 MB comprimidos, divides em vários sitemaps e ligas-os a partir de um índice de sitemap. O Google aceita ambos os formatos indistintamente.

Devo incluir todos os URLs?

Apenas URLs canónicos e indexáveis. Exclui páginas noindex, páginas de admin, páginas de resultados de pesquisa e variantes com parâmetros de tracking. O sitemap é uma shortlist do que queres ver indexado, não um dump de todos os URLs que respondem com 200.

Fontes

Última atualização 2026-05-11