technical
Sitemap XML
O MetricSpot tenta buscar /sitemap.xml. O sitemap é como dizes aos motores de busca e aos crawlers de IA quais os URLs do teu site que existem e que importam.
O que esta verificação faz
Faz um GET a https://teudominio.com/sitemap.xml e verifica se devolve um sitemap válido ou um índice de sitemap. Procuramos também uma linha Sitemap: no teu robots.txt (verificação separada).
Porque é importante
Um sitemap é o sinal explícito de quais URLs fazem parte do teu site. Sem ele, os crawlers dependem inteiramente das ligações internas para encontrar as tuas páginas, e qualquer URL que não esteja ligado a partir da homepage (páginas órfãs, categorias profundamente aninhadas, conteúdo recém-publicado) pode demorar semanas a ser descoberto, ou ficar de fora completamente.
Para crawlers de IA como o GPTBot, ClaudeBot e PerplexityBot, o sitemap é ainda mais importante — rasteiam de forma mais restrita do que o Googlebot e apoiam-se no sitemap como inventário canónico.
Como corrigir
Gera um sitemap na raiz do teu domínio. A maior parte das frameworks faz isto automaticamente:
Astro: npm install @astrojs/sitemap, depois em astro.config.mjs:
import sitemap from '@astrojs/sitemap';
export default defineConfig({
site: 'https://teudominio.com',
integrations: [sitemap()],
});
Next.js (App Router): cria app/sitemap.ts a devolver um array de { url, lastModified, changeFrequency, priority }.
WordPress: Yoast, Rank Math e SEOPress publicam todos um índice de sitemap automaticamente em /sitemap_index.xml — podes ter de adicionar um redirect de /sitemap.xml.
À mão: um sitemap.xml estático funciona para sites pequenos:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://teudominio.com/</loc>
<lastmod>2026-05-01</lastmod>
</url>
</urlset>
Depois de publicar, submete-o uma vez em Google Search Console → Sitemaps. O Google vai voltar a buscá-lo automaticamente daí em diante.
Perguntas frequentes
O sitemap tem de estar exatamente em /sitemap.xml?
Não — a linha Sitemap: no robots.txt é o mecanismo oficial de descoberta. Mas /sitemap.xml é a convenção; muitas ferramentas (incluindo o MetricSpot) procuram lá como fallback.
E os índices de sitemap?
Para sites com mais de 50.000 URLs ou 50 MB comprimidos, divides em vários sitemaps e ligas-os a partir de um índice de sitemap. O Google aceita ambos os formatos indistintamente.
Devo incluir todos os URLs?
Apenas URLs canónicos e indexáveis. Exclui páginas noindex, páginas de admin, páginas de resultados de pesquisa e variantes com parâmetros de tracking. O sitemap é uma shortlist do que queres ver indexado, não um dump de todos os URLs que respondem com 200.
Fontes
Última atualização 2026-05-11