Mindsforsale

24 Ottobre 2007

Sitemap per Google News

Archiviato in: Cose serie — Tag:, , — Il Tecnico Diabolico @ 3:32 pm

Siete tra le fonti di Google News? Da poche settimane potete “aiutare” il potentissimo motore di ricerca ad identificare quali contenuti del vostro sito vorreste che apparissero tra le news, grazie ad una appostia sitemap.

Mentre lo scopo della sitemap tradizionale è quello di facilitare l’indicizzazione di un sito segnalando ogni url disponibile, quello della sitemap per le news invece è segnalare i contenuti più recenti (massimo mille) che dovrebbero essere inclusi in Google News. E necessario quindi che questo tipo di sitemap venga aggiornata molto frequentemente.

Il formato è lo stesso delle sitemap tradizionali, a cui però va aggiunto un namespace specifico per le news:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
    xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">

Ed ecco come descrivere una news in xml:

<url>
    <loc>http://mynewssite.com/article123.html</loc>
    <news:news>
        <news:publication_date>2006-08-14T03:30:00Z</news:publication_date>
        <news:keywords>Business, Mergers, Acquisitions</news:keywords>
        <news:stock_tickers>MSFT, NYSE:HD</news:stock_tickers>
    </news:news>
</url>
  • Il tag <loc> (presente anche nelle sitemap tradizionali) corrisponde all’url della news
  • Il tag <news:publication_date> (obbligatorio*) deve contenere la data di pubblicazione del contenuto
  • Il tag <news:keywords> (facoltativo) deve contenere le keyword (o i tag) associati al contenuto, separati da virgola; Google suggerisce di includere anche una keyword che indichi anche a quale tra le google-categorie esistenti può essere associato il contenuto
  • Il tag <news:stock_tickers> (facoltativo) deve contenere, nel caso di news finanziarie, la lista degli stock tickers interessati dall’articolo separati da virgola

Infine, ecco un esempio di google-news-sitemap completa:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
    xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">

    <url>
        <loc>http://mynewssite.com/article123.html</loc>
        <news:news>
            <news:publication_date>2007-10-24T12:01:00+02:00</news:publication_date>
            <news:keywords>google, sitemaps, sem</news:keywords>
        </news:news>
    </url>

    <url>
        <loc>http://mynewssite.com/article456.html</loc>
        <news:news>
            <news:publication_date>2007-10-24T12:01:10+02:00</news:publication_date>
            <news:keywords>yahoo!, sitemap, msn</news:keywords>
        </news:news>
    </url>
</urlset>

Se i tag contengono caratteri accentati, occhio al charset ;)

La realizzazione di questa sitemap è stata molto semplice: è bastato cambiare l’output prodotto dal modulo degli rss. In fondo si tratta della lista di tutti i contenuti recenti, o quasi =).

Funzionerà? Compariranno più contenuti della casa madre all’interno di Google news? La risposta tra qualche settimana, dopo aver analizzato un po’ di statistiche.

* In realtà il campo dovrebbe essere facoltativo se data ed ora di pubblicazione sono inclusi nella pagina dell’articolo e chiaramente riconoscibili.

1 Commento »

  1. [...] Attenzione… se leggete attentamente si scopre che sono previste delle sitemap apposite solo per le Google news… ma questo è un altro argomento, buono per un post della prossima settimana [...]

    Pingback di Google: Webmaster Tools e News Pt. 2 « Mindsforsale — 24 Ottobre 2007 @ 3:58 pm

RSS feed dei commenti a questo articolo. TrackBack URI

Lascia un commento

Blog su WordPress.com.