Mindsforsale

13 Ottobre 2007

Google: Webmaster Tools e News Pt. 2

Archiviato in: Cose serie — Tag:, , , , — Il Tecnico Diabolico @ 8:58 am

Se vi siete persi la prima parte, andate a leggerla prima di questo post :)

Da qualche giorno nei webmaster tools di Google è comparsa una nuova sezione, che mi ha esaltato non poco. Si trova dentro a “Diagnostica” -> “Scansione news” -> “Errori specifici di Google News”.

Si presenta una tabella con due colonne: nella prima compare la lista degli url del vostro sito scansionati dal crowler che non sono stati inseriti nelle news, nella seconda il motivo della mancata inclusione! D’ora in poi basta improvvisare quando vi viene chiesto “perché quella bellissima news che ho scritto non è stata scelta per google-news?”

Ad un primo sguardo, gli errori presenti nell’account della casa madre sembrano sensati:

  • Articolo troppo corto rispetto al testo della pagina. Il corpo dell’articolo che abbiamo estratto dalla pagina HTML costituisce una frazione relativamente breve del testo integrale. Abbiamo generato questo errore per evitare di includere una porzione di testo che potrebbe non essere corretta. Valuta l’idea di eliminare dalla pagina ciò che non fa parte dell’articolo.
  • Non è stata trovata alcuna frase. Il corpo dell’articolo che abbiamo estratto dalla pagina HTML sembra non contenere sequenze di parole continue con punteggiatura. Abbiamo generato questo errore per evitare di includere una sezione di testo che potrebbe non essere corretta.
  • Tipo contenuto non supportato. La pagina ha un content-type HTTP che non è supportato da Google News. Gli articoli devono avere un content-type di “text/html” o “text/plain”.

Ho stampato i primi due punti e sono corso dagli editor.

Per il primo, ho spiegato che i nostri template sono scritti in xhtml con css esterni, quindi l’html della pagina è già ridotto all’osso. Non sapendo assolutamente di cosa stessi parlando, mi hanno risposto che comunque non sarebbe stato possibile scrivere “pezzi” più lunghi per quei temi, impossibile che Google controlli una cosa del genere, la causa del mancato inserimento era sicuramente tecnica, relativa alla pagina.

Per il secondo mi hanno risposto che principalmente erano sondaggi e quindi non servivano punti. Beh sai… il nostro sondaggio ha un campo descrizione che può essere usato per… descriverlo! Possono essere inserite delle frasi in Italiano! “Vabbè, ma non importa che i sondaggi siano inclusi”.

<evil-mode>

Dopo essere arrivato alla conclusione che nell’area contenuti della casa madre c’è un po’ troppa anarchia, mi sono dedicato al nostro terzo errore.

</evil-mode>

Ho verificato che tutte le pagine avessero il meta tag

<meta http-equiv=“content-type” content=“text/html; charset=ISO-8859-1″ />

E tutte ce l’avevano, sia quelle incluse che non.
Poi ho verificato che (per qualche strana ragione) per alcune pagine non venisse impostato dal server un header http diverso, e questo non accade. A qualcuno è capitato lo stesso problema? Non ne sono ancora venuto a capo.

Comunque, tutti (o quasi) gli errori che precludono l’aggiunta di un contenuto a Google news sono pubblicati qui.

Attenzione… se leggete attentamente si scopre che sono previste delle sitemap apposite solo per le Google news… ma questo è un altro argomento, buono per un post della prossima settimana ;-)

1 Commento »

  1. [...] Diabolico @ 1:07 am Non so se avete notato che ho scritto diversi articoletti riguardanti l’inclusione nelle Google News. Questo non è dovuto (solo) al fatto che l’argomento è particolarmente ricercato e che quei [...]

    Pingback di Mindsforsale — 26 Gennaio 2008 @ 1:07 am

RSS feed dei commenti a questo articolo. TrackBack URI

Lascia un commento

Blog su WordPress.com.