technical

Sitemap XML

MetricSpot intenta descargar /sitemap.xml. El sitemap es cómo le dices a los buscadores y rastreadores de IA qué URLs de tu sitio existen e importan.

Qué comprueba esta auditoría

Hace una petición GET a https://tudominio.com/sitemap.xml y comprueba que devuelve un sitemap válido o un índice de sitemaps. También buscamos una línea Sitemap: en tu robots.txt (comprobación aparte).

Por qué importa

Un sitemap es la señal explícita de qué URLs forman parte de tu sitio. Sin él, los rastreadores dependen por completo de los enlaces internos para encontrar tus páginas, y cualquier URL que no esté enlazada desde la home (páginas huérfanas, categorías muy anidadas, contenido recién publicado) puede tardar semanas en descubrirse o no descubrirse nunca.

Para los rastreadores de IA como GPTBot, ClaudeBot y PerplexityBot, el sitemap es aún más importante: rastrean menos en amplitud que Googlebot y se apoyan en el sitemap como inventario canónico.

Cómo solucionarlo

Genera un sitemap en la raíz de tu dominio. La mayoría de los frameworks lo hacen automáticamente:

Astro: npm install @astrojs/sitemap y, en astro.config.mjs:

import sitemap from '@astrojs/sitemap';
export default defineConfig({
  site: 'https://tudominio.com',
  integrations: [sitemap()],
});

Next.js (App Router): crea app/sitemap.ts devolviendo un array de { url, lastModified, changeFrequency, priority }.

WordPress: Yoast, Rank Math y SEOPress publican automáticamente un índice de sitemaps en /sitemap_index.xml; puede que tengas que añadir una redirección desde /sitemap.xml.

A mano: un sitemap.xml estático sirve para sitios pequeños:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://tudominio.com/</loc>
    <lastmod>2026-05-01</lastmod>
  </url>
</urlset>

Una vez publicado, envíalo una sola vez en Google Search Console → Sitemaps. Google lo volverá a rastrear automáticamente a partir de entonces.

Preguntas frecuentes

¿El sitemap tiene que estar en /sitemap.xml exactamente?

No: la línea Sitemap: de robots.txt es el mecanismo oficial de descubrimiento. Pero /sitemap.xml es la convención; muchas herramientas (incluida MetricSpot) lo prueban como fallback.

¿Y los índices de sitemaps?

Para sitios con más de 50.000 URLs o 50 MB comprimidos, divides en varios sitemaps y los enlazas desde un índice. Google acepta ambos formatos indistintamente.

¿Debo incluir todas las URLs?

Solo las canónicas e indexables. Excluye las páginas noindex, las páginas de admin, las páginas de resultados de búsqueda y las variantes con parámetros de tracking. El sitemap es una lista corta de lo que quieres indexado, no un vertido de todas las URLs que devuelven 200.

Fuentes

Última actualización 2026-05-11