readability

Contenuto scarso

Segnala le pagine in cui l'articolo estratto sta sotto le ~150 parole — quello che il sistema helpful-content di Google penalizza e che gli agenti AI saltano del tutto.

Cosa verifica questo controllo

Misura la sostanza della pagina, non il conteggio parole grezzo.

MetricSpot estrae l’articolo principale con un’euristica stile Readability.js:

  1. Preferisce <main> o <article> se presenti.
  2. Scarta nav, header, footer, aside, banner cookie e chrome noto (target di skip-link, breadcrumb).
  3. Assegna un punteggio ai blocchi rimanenti per densità di testo (caratteri per nodo) e peso del tag — lo stesso approccio di Readability.
  4. Conta le parole dentro il blocco sopravvissuto.

Se il conteggio è sotto le ~150 parole, la pagina è segnalata come scarsa. È volutamente diverso da conteggio parole pagina, che conta tutto il visibile (boilerplate incluso). Un sito può passare il conteggio parole con 2.000 parole di nav + footer + sidebar e fallire questo controllo con 80 parole di articolo reale.

Perché è importante

Due sistemi penalizzano duramente il contenuto scarso:

Il sistema helpful-content di Google. Dall’update del 2022 (e stretto progressivamente nel 2024–2025), le pagine giudicate “di poco valore, valore aggiunto basso o comunque poco utili” vengono retrocesse a livello di sito — non solo l’URL incriminato. I colpevoli classici sono indici di categoria autogenerati, pagine location prodotte da un template e schede prodotto senza descrizione oltre titolo + prezzo.

Gli answer engine AI. ChatGPT, Perplexity, Claude, Google AI Overviews e Gemini applicano un filtro di sostanza prima di citare. Una pagina con 60 parole di corpo è parsabile ma non citabile — non contiene una risposta difendibile. Il tuo URL non entra mai nel pool delle citazioni.

Il contenuto scarso è anche un problema di conversione. Chi atterra su una pagina da 70 parole rimbalza; chi atterra su una pagina da 600 parole con profondità, FAQ e next step chiaro converte.

Come sistemarlo

Non stai aggiungendo riempitivo. Stai aggiungendo sostanza — contenuto che un lettore screenshoterebbe. Scegli i pattern adatti al tipo di pagina.

Pagine categoria / indice

Il colpevole di default. La cura:

  • 2–3 paragrafi brevi di commento originale sopra l’elenco — cos’è la categoria, per chi è, cosa cercare.
  • Un breve blocco FAQ (3 domande) che affronta le domande pre-acquisto comuni.
  • Link interni alle 3–5 sottocategorie o pillar page più rilevanti. Vedi strategia di link interni.

Pagine prodotto / SKU

Se la tua descrizione è solo specs:

  • Aggiungi un paragrafo “perché lo teniamo” o “ideale per” (50–100 parole, scritte da un umano).
  • Inserisci 3–5 recensioni clienti con attribuzione all’autore e voto. Marcale con schema Review — fungono sia da prova sociale sia da contenuto.
  • Includi un blocco “compatibile con” o “spesso comprato con” — utile ai lettori, utile ai motori di ricerca che mappano relazioni tra entità.

Pagine location / area di servizio

La trappola dello spam da template. La cura è più dura perché è lavoro:

  • Ogni pagina ha bisogno di almeno un paragrafo di contenuto localmente specifico. Non “serviamo <Città>” — dettagli reali: un punto di riferimento, una norma locale, una sfumatura di servizio.
  • Un case study o testimonial locale se ce l’hai.
  • Un H1 unico per pagina (non “Idraulico a {Città}”).

Se non riesci a scrivere qualcosa di unico per una città, quella città non merita una pagina. Consolida in un hub regionale.

Stub di blog e landing

  • Apri con il pattern contenuto answer-first — la domanda nell’H1, la risposta nei 50 parole successive.
  • Prosegui con “perché conta” e “come farlo” — il pattern di profondità del contenuto.
  • Chiudi con un blocco FAQ (2–3 domande) che cattura le query long-tail.

Come MetricSpot estrae il contenuto

Se il controllo scatta ma sei sicuro che la pagina abbia sostanza, l’estrattore potrebbe averla persa. Cause comuni:

  • Corpo dell’articolo in un <div> senza wrapper semantico, accanto a una sidebar molto ampia — Readability a volte sceglie la sidebar. Avvolgi l’articolo in <main> o <article>.
  • Contenuto reso lato client dopo l’idratazione — MetricSpot legge la risposta del server. Pre-renderizza o fai SSR del corpo.
  • Uso massiccio di <iframe> o <canvas> — quelli non sono prosa. Se la pagina è uno strumento va bene; la regola non si applica alle pagine interattive una volta marcate con role="application" e una breve descrizione.

Abbina questa regola a conteggio parole pagina e lunghezza dei paragrafi — insieme ti dicono se la pagina ha abbastanza testo e se è ben strutturato.

Domande frequenti

Qual è la soglia di parole effettiva?

Circa 150 parole di contenuto principale estratto. Il numero esatto dipende dal tipo di pagina — una scheda prodotto con dati strutturati ricchi (prezzo, voti, disponibilità, schema) gode di più tolleranza di una pagina /about senza schema e con 80 parole.

Aggiungere un blocco FAQ risolve ogni pagina scarsa?

Aiuta ma non è una pallottola d’argento. Una FAQ aggiunge sostanza e cattura query long-tail, ma se il resto della pagina è davvero vuoto (uno stub di categoria, un placeholder), la FAQ da sola non lo regge. Aggiungi una FAQ più almeno un paragrafo originale above the fold.

La mia home è volutamente corta. Devo preoccuparmi?

Le home prendono un parziale pass — il controllo si aspetta che siano di navigazione e molte euristiche di estrazione restituiscono conteggi bassi anche per home sane. La penalità da contenuto scarso colpisce in pratica le pagine interne: indici di categoria, pagine location e SKU generati da template. Se la home è l’unica pagina scarsa segnalata, di solito puoi ignorarla.

Fonti

Ultimo aggiornamento 2026-05-11