ai

llms.txt pour les agents IA

MetricSpot recherche /llms.txt à la racine de votre domaine. C'est une convention émergente pour publier un résumé soigné que les agents LLM peuvent lire au lieu de scraper.

Ce que vérifie ce contrôle

Effectue un GET sur https://votredomaine.com/llms.txt et confirme qu’il renvoie un 200 avec un fichier analysable. Le format est du markdown avec une structure précise (H1 = titre du site, blockquote de résumé, sections de liens).

Pourquoi c’est important

llms.txt est le pendant à l’ère IA de robots.txt et sitemap.xml. Là où ces derniers disent aux crawlers ce à quoi ils sont autorisés à accéder, llms.txt dit aux agents LLM ce qui vaut d’être lu — un index soigné de vos pages les plus importantes.

La convention est récente (proposée par Answer.AI fin 2024) et pas encore universellement honorée. Mais elle ne coûte rien à publier, et plusieurs systèmes agentiques (Cursor, Continue, GPT personnalisés) s’appuient déjà dessus comme point d’entrée de haute confiance. Les sites qui publient un bon llms.txt sont cités dans les réponses LLM à des taux plus élevés que les autres.

Comment le corriger

Créez /public/llms.txt (ou là où votre serveur héberge les fichiers statiques racine) avec cette structure :

# MetricSpot

> Audits SEO et lisibilité IA gratuits, avec rapports PDF en marque blanche pour les agences. 91 contrôles couvrant technique, on-page, performance, IA, accessibilité et confidentialité.

## Docs

- [HTTPS sur votre site](https://metricspot.com/fr/docs/https-sur-votre-site/) : Pourquoi HTTPS compte et comment l'activer.
- [Largest Contentful Paint](https://metricspot.com/fr/docs/largest-contentful-paint/) : Le premier Core Web Vital, seuil et corrections.

## Tarifs

- [Plans et tarifs](https://metricspot.com/fr/pricing/) : Gratuit, Premium, Pro.

## API

- [API publique d'audit](https://app.metricspot.com/api/public/pricing) : Accès programmatique.

Règles :

  • H1 = nom de votre site / produit.
  • Blockquote juste après = pitch d’une phrase.
  • Sections H2 pour regrouper les liens connexes.
  • Chaque lien est [Titre](URL) : résumé d'une phrase. — c’est le résumé que le LLM lit pour décider s’il va chercher la page.

Soumettez votre fichier à l’annuaire llmstxt.org une fois publié.

Questions fréquentes

Des LLM lisent-ils vraiment ce fichier aujourd’hui ?

Une liste qui grandit. Claude d’Anthropic (via le MCP docs), l’agent de codebase de Cursor et plusieurs GPT personnalisés ont une prise en charge intégrée de llms.txt. ChatGPT search et Perplexity ne l’honorent pas officiellement mais le fichier fait partie de leur corpus crawlé.

En quoi c’est différent de sitemap.xml ?

Le sitemap est du XML lisible par machine — chaque URL, à poids égal. llms.txt est du markdown soigné avec des résumés — seulement vos meilleures URL, hiérarchisées. Le sitemap vise l’exhaustivité ; llms.txt vise le jugement éditorial.

Et /llms-full.txt ?

Une convention complémentaire : même structure mais avec le contenu complet des pages intégré, pour qu’un agent fasse un seul fetch et obtienne toutes vos docs d’un coup. Utile pour les sites de documentation ; excessif pour les sites marketing.

Sources

Dernière mise à jour 2026-05-11