In questo capitolo prenderemo in esame i meta tag (o "metatag" come vengono spesso chiamati). I meta tag sono particolari tag HTML attraverso i quali è possibile specificare informazioni (anzi, meta-informazioni) di vario genere e tipologia su una pagina web.
In questa sezione tratteremo solo alcuni dei tag meta, per una trattazione più approfondita e per coloro che non hanno dimestichezza con l'HTML consigliamo di dare un'occhiata alla documentazione ufficiale W3C sui tag meta.
I Meta-tag sono dei tag Html volti a fornire informazioni aggiuntive (meta informazioni) su un documento ipertestuale. A questa funzione gestionale informativa, si affianca l’importante ruolo che questi tag assumono per l’indicizzazione dei motori di ricerca. Un ruolo che con il passare del tempo sembra assumere sempre meno valore. In questo articolo vi fornirò solo alcune informazioni generali riguardo la struttra dei meta-tag per poi, alla fine, dare alcune informazioni più specifiche sul meta-tag keyword, quelle utili all’indicizzazione sui motori.
L’elemento Meta va inserito nel documento HTML tra i tag
e non ha un tag di chiusura. È costituito da una coppia nome/valore, e ha tre attributi principali:
HTTP-EQUIV
Le informazioni contenute in HTTP-EQUIV informano il browser che si tratta di valori di intestazione della connessione HTTP (HTTP Header)
NAME
L’attributo NAME raccoglie informazioni ininfluenti per i browser o i robot, ma utili agli utenti per conoscere, solo per esempio, l’autore del documento.
CONTENT
L’attributo CONTENT determina il valore da attibuire alla proprietà che lo precede.
Viene utilizzato con diverse variabili:
Author
identifica l’autore della pagina.
<META NAME=author CONTENT="Giuliano Grazia">
Description
dà una breve descrizione del documento, e contestualmente fornisce ai robot un riassunto dello stesso. È consigliabile limitare a 10-15 parole (al massimo 100 caratteri) la lunghezza della descrizione, che altrimenti rischia di essere ignorata dai motori di ricerca. Tale testo deve ospitare un piccolo sunto degli argomenti trattati nella pagina, di cosa si parla, a chi si rivolge; Dovrebbe anche enfatizzare gli argomenti che più di altri possono attirare l'attenzione del lettore, in quanto il contenuto di questo tag meta viene spesso riportato dai motori di ricerca nelle ricerche effettuate dagli utenti. I contenuti di tale tag devono dunque servire per dare all'utente dei motori di ricerca un'idea di ciò che troverà nella pagina, prima ancora che essa venga visitata. La descrizione deve essere semplice, efficace e di tipo discorsivo, non banalmente sfruttata per includere parole chiavi. "Spettacolarizzare" i contenuti è controproducente, perché tutto il testo del meta tag dovrebbe essere attentamente sfruttato per comunicare al lettore informazioni utili e non per lanciare un'eventuale slogan.
<META NAME =description CONTENT="Scrivere correttamente la descrizione della pagina nel meta-tag">
Copyright
ribadisce che il documento, come qualsiasi altra opera dell’ingegno, è coperto dal diritto d’autore. La presenza di questo tag ha l’utilità di rendere non scusabile l’ignoranza dell’ipotetico contravventore.
<META NAME =copyright CONTENT="httplab.it" >
Generator
specifica l’editor utilizzato per creare il contenuto del documento.
<META NAME =generator CONTENT="Macromedia Dreamweaver 1.0">
Robots
stabilisce se e come i motori di ricerca debbano interrogare il documento.
<META NAME =robots CONTENT="all | none | index | noindex | follow | nofollow">
Language
determina la lingua utilizzata all’interno della pagina.
<META NAME =DC language CONTENT="ita" SCHEME="RFC1766">
Contiene informazioni utilizzate nella comunicazione tra server e browser. L’importanza di questo attributo ha assunto grande rilievo in riferimento ai metodi di indicizzazione dei motori di ricerca. Prima di esporre i modi e gli accorgimenti per apparire, o tentare di farlo, ai primi posti delle graduatorie dei robot, è bene precisare le altre variabili associabili a HTTP-EQUIV:
Reply-to
indica l’indirizzo di posta elettronica dell’autore del documento. La sua visualizzazione avviene solo dal lato server, ma solitamente non è utilizzato.
<META HTTP-EQUIV=reply-to CONTENT="webmaster@httplab.it">
Expires
indica al browser la data, in formato GMT, di scandenza del documento. Un documento scaduto non dovrebbe essere memorizzato nella cache del browser, e una nuova copia dovrebbe essere richiesta. In realtà molti programmi di gestione della cache ignorano questa variabile.
<META HTTP-EQUIV=expires CONTENT="Sun, 31 october 1999 12.33.17 GMT ">
Pragma
è una variabile associabile esclusivamente a Netscape Navigator, che impedisce al browser di memorizzare il documento nella memoria cache
<META HTTP-EQUIV=pragma CONTENT="no-cache">
Refresh
permette di sfruttare il cosiddetto "client-pull", cioè il ricaricamento automatico del documento dopo un certo numero di secondi. Per fare questo è sufficiente impostare il seguente tag:
<META HTTP-EQUIV=refresh content=”5″>
In questo esempio lo stesso documento viene automaticamente ricaricato ogni 5 secondi.
Per caricare una pagina differente da quella che si sta visualizzando è necessario impostare un URL completo all’interno di CONTENT:
<META HTTP-EQUIV=refresh CONTENT="5;URL=http://www.grazia.pro">
L’URL deve essere completo e non un semplice nome di percorso.
Questa tecnica risulta utile per visualizzare diversi documenti senza soluzione di continuità evitando qualsiasi intervento dell’utente.
Una delle funzioni più interessanti svolte dai meta-tag è quella relativa all’indicizzazione dei documenti nei motori di ricerca. Questi infatti,ricavano dal meta-tag keyword le chiavi con le quali indicizzare un sito web. Se volete che un vostro sito sia trovato da una ricerca per “ristorante greco” è bene inserire questa frase all’interno del meta-tag keyword.
Particolare attenzione va posta nella stesura del codice HTML relativo a questo meta-tag. Questa operazione se compiuta con i dovuti accorgimenti genera buoni risultati.
È innanzitutto consigliabile stendere una lista di "keyword", parole chiave, che identifichino nel modo più dettagliato possibile il contenuto del documento.
cercate di evitare termini generici (es. casa, riparazione, computer, risorante, etc.);
È abbastanza importante riportare il termine inglese e quello italiano (es: telefono phone assistenza services) se interessati ad una indicizzazione internazionale;
Inserire il singolare e il plurale (es: telefono telefoni phone phones), anche se alcuni motori di ricerca potranno riconoscere automaticamente questa differenza;
Creare alcune frasi composte con i singoli termini usati nelle keyword (es: riparazione computer a casa del cliente)
Mantenete abbastanza contenuto il numero di parole chiave. Usate solo le parole chiave che avete pianificato per l’intero sito aggiungendone alcune altre specifiche della pagina.
Sulla questione se dividere o no con le virgole i termini non ci sono indicazioni precise. I motori comunque sembrano non considerare le virgole come separatori di termine. Personalmente non utilizzo le virgole per separare le keywords.
È sconsigliabile utilizzare più di due o tre volte lo stesso termine. Ripetere decine di volte lo stesso termine genera l’effetto opposto a quello desiderato, visto che i più importanti motori di ricerca ignorano automaticamente tali documenti e penalizzano il sito che ne abusa.
Inserire differenti keyword nelle diverse pagine di un sito Web è un altro modo per attirare l’attenzione dei motori di ricerca.
I motori di ricerca decidono la posizione di una pagina basandosi sul testo contenuto nella pagina stessa, sulla popolarità del sito web e su diversi altri parametri.
Purtroppo si è diffusa la convinzione che i meta-tag servano a "far registrare" un sito sui motori di ricerca o che la loro presenza su una pagina possa magicamente richiamare gli spider dei motori o, addirittura, che servano a far arrivare i visitatori sul sito.
Spinti dal desiderio di trovare una soluzione comoda e veloce, è nato il luogo comune che per ottenere buoni risultati sui motori di ricerca sia sufficiente fare un sito web "come capita" che risulta tecnicamente scadente e poi inserire sulle sue pagine i meta tag, magari creati con un generatore di meta tag ("meta tag generator") trovato sul web, chi procede come appena descritto ottiene, ovviamente, risultati disastrosi.
Un sito web che non sia realmente ottimizzato non trarrà alcun beneficio di posizionamento dai meta tag.
Essenzialmente, i meta tag dedicati ai motori di ricerca sono tre:
DESCRIPTION
Questo meta tag permette di inserire una descrizione dei contenuti della pagina web in cui esso appare.
KEYWORDS
Questo meta tag consente di specificare una lista di parole chiave che riguardano gli argomenti trattati nella pagina web.
ROBOTS
A differenza dei due meta tag di cui sopra, il cui scopo è includere informazioni supplementari sui contenuti della pagina, questo altro meta tag contiene dei "consigli di comportamento" per gli spider che preleveranno e analizzeranno la pagina. Spiegheremo meglio in seguito cosa intendiamo con "consigli di comportamento".
I primi spider sviluppati dai motori di ricerca si limitavano a leggere l'intestazione delle pagine HTML da indicizzare e una piccola quantità di testo della pagina, nell'ordine di qualche centinaio di caratteri. Gli algoritmi degli spider erano ancora poco raffinati e inoltre questi programmi potevano contare su una potenza di calcolo e una capienza dei supporti di massa inferiore a quella che possediamo oggi. Per tale ragione, non potevano permettersi di leggere, analizzare ed includere nei propri archivi l'intera pagina HTML ma dovevano accontentarsi di un suo breve estratto.
Ad aiutare gli spider a classificare opportunamente le pagine, intervenivano dunque i webmaster, che includevano importanti informazioni sui contenuti della pagine nei tag meta, ovvero nell'intestazione, tra i tag HEAD. In questo modo gli spider potevano accedere ad una sorta di "sunto" dei contenuti della pagina limitandosi a leggere l'intestazione e poco altro testo nel corpo del file HTML.
Tuttavia, col passare del tempo i programmatori degli spider si accorsero che questo "aiuto" ricevuto dai webmaster poteva nascondere una tecnica per sviare gli algoritmi di classificazione dei motori di ricerca; era infatti sufficiente inserire nei meta tag descrizioni e keyword non attinenti ai contenuti reali delle pagine per poter apparire in ricerche non correlate ai termini cercati dagli utenti.
Per questa ragione i motori di ricerca volsero i propri sforzi a realizzare nuovi algoritmi, che prendevano in esame principalmente i contenuti testuali della pagina, relegando i contenuti dei meta tag ad una posizione di importanza secondaria. Oggi non è più possibile barare con i meta tag come si faceva una volta, anzi, molti motori di ricerca penalizzano i siti che presentano contenuti dei meta tag non attinenti agli argomenti trattati in seguito nel corpo pagina web.
Il meta tag KEYWORDS ha lo scopo di indicare ai motori di ricerca una lista di parole chiave inerenti i contenuti della pagina web in cui il tag appare. La scelta di tali parole rappresenta una fase molto importante della stesura di una pagina web, non tanto perché alcuni motori si basano ancora sui contenuti di questo tag meta per cercare di individuare il tema principale della pagina, quanto perché le keyword individuate dovrebbero poi essere utilizzate nel testo contenuto nella pagina.
Per creare una buona lista di termini chiave, è consigliato innanzitutto stilare su un foglio un breve elenco di tipologie di persone a cui i contenuti della pagina possono interessare. Bisogna cercare di individuare quante più classi possibili di individui potenzialmente interessati alle informazioni fornite nella pagina web, ragionando sulle molteplici motivazioni che possono spingere gente diversa, con diverse esigenze, ad interessarsi di medesimi contenuti, o di contenuti simili.
Una volta compiuto ciò, il passo successivo consiste nel mettersi nei panni di queste persone e provare a ipotizzare quali termini è più probabile che costoro cerchino nei motori di ricerca. I parametri da prendere in considerazione sono diversi perché non solo persone con esigenze leggermente diverse possono utilizzare parole molto differenti ma anche individui con la medesima necessità possono pensare parole diverse a seconda dei diversi gradi di cultura. Persone più colte possono utilizzare termini più ricercati o tecnici o comunque appropriati all'argomento di ricerca, mentre gente con un vocabolario personale più scarno è maggiormente portata ad utilizzare termini generici, adattati all'argomento per l'occasione.
Invece di "automobili" o "autovetture" alcune persone potrebbero usare il termine generico "macchine" e invece di "agenzia di viaggi" o "tour operator" potrebbero preferire un meno specifico "vacanze".
Un importante fattore da prendere in considerazione e che i suddetti esempi ci illustrano è che una buona metà degli utenti non sa cosa cercare nè sa come cercarlo. A volte la gente si limita a indicare un oggetto di ricerca molto generico, senza specificare parole che indichino al motore di ricerca cosa si intende fare con quell'oggetto. Un utente che cerca semplicemente "macchine" non fornisce abbastanza indicazioni su ciò che realmente vuole ottenere. Cerca forse un sito con le quotazioni di mercato delle automobili? Un sito sportivo che tratta di corse di autovetture? Una ditta che vende automobili di seconda mano? O, peggio, dei macchinari agricoli per arare un podere?
Sono domande che non possono trovare risposta, ma colui che ha il compito di cercare parole chiavi da inserire nel tag meta KEYWORDS deve tenere conto di tutte le possibilità e stilare una lista che contenga non solo i termini più indicati per l'argomento discusso nella pagina web ma anche parole più generiche, alla portata di chi non possiede un buon bagaglio linguistico.
Se il sito web ospita informazioni su un'attività lavorativa o su un'azienda che opera in un ristretto ambito locale, è consigliato cercare keyword che specifichino la zona di operazione della ditta. Il nome di una città, di una provincia o il nome di una località geografica sono utilissimi per acquistare visibilità agli occhi degli utenti che restringono il campo di ricerca ad una specifica località.
Il passo seguente nella scelta delle parole chiave consiste nell'individuare non solo singoli termini ma anche brevi serie di due o tre parole al massimo che, assieme, identificano meglio un argomento. Illustriamo di seguito un esempio chiarificatore.
Quella che segue è una regola importantissima, i contenuti dei meta tag DESCRIPTION e KEYWORDS devono essere compatibili con i contenuti testuali della pagina web.
Una volta individuata una descrizione ed serie di parole chiave che rappresentano bene i contenuti della pagina, è necessario effettuare un lavoro indispensabile, affinché i termini scelti risultino realmente efficaci nel posizionare il sito: controllare che siano presenti nel testo della pagina.
Questa regola vale in particolar modo per le keyword: tutte le keyword presenti nel relativo meta tag devono apparire anche nel testo contenuto nel corpo della pagina. Ad essere sinceri, è presumibile che alcuni motori di ricerca non siano così ristrettivi e che in realtà permettano una certa elasticità nel tollerare la quantità di keyword non presenti nel testo. Per un pieno grado di sicurezza, però, è altamente consigliato che le keyword utilizzate nel testo siano tutte.
Ciò non sempre è facile da ottenere, e sarà possibile incontrare alcune difficoltà nel cercare di far apparire tutte le keyword nel testo, senza con questo ridurre la qualità dei contenuti e la leggibilità della pagina. Al solito, sarà l'esperienza acquisita nel tempo ad aiutare il webmaster ad ottenere buoni risultati.
Differentemente dai precedenti due, il meta tag ROBOTS non ha lo scopo di fornire informazioni inerenti i contenuti della pagina web. Al contrario, si tratta di un modo per comunicare con lo spider del motore di ricerca e invitarlo a seguire alcune direttive circa l'uso della pagina web prelevata.
Attualmente, le direttive impartibili allo spider sono due ed hanno i seguenti scopi:
Per chiedere allo spider di indicizzare (ovvero archiviare) i contenuti della pagina si usa la direttiva INDEX. Se, invece, non si desidera che i contenuti della pagina vengano archiviati si usa la direttiva NOINDEX.
Per chiedere allo spider di seguire tutti i link contenuti nella pagina si usa la direttiva FOLLOW. Al contrario, per impedire che lo spider segua i link contenuti nella pagina si usa la direttiva NOFOLLOW.
I due tipi di direttive possono essere combinati a piacere e inclusi nel contenuto del tag ROBOTS separandoli con una virgola.
Il seguente esempio invita lo spider a catalogare la pagina e a seguirne tutti i link trovati al suo interno:
Esistono meta tag espressamente dedicati al motore di ricerca Google.
Quando Google visita una pagina web, archivia nei propri database il file HTML ricevuto. Successivamente, quando gli utenti effettuano una ricerca, Google offre, oltre ai link alle pagine web elencate, anche un link alle copie che tiene in archivio; tale link mostra la dicitura "Copia cache" o "Cached".
Questo permette agli utenti di prendere visione dei contenuti della pagina web risalenti a quando Google ha visitato la medesima, cosa che può tornare comoda qualora la reale pagina web non fosse raggiungibile per problemi tecnici.
Tuttavia, alcuni webmaster non gradiscono che Google consenta agli utenti di osservare la pagina HTML così come è stata letta dal motore di ricerca. Per questa ragione, Google ha ideato un apposito meta tag attraverso il quale i webmaster possono chiedere al motore di ricerca di non conservare una copia della pagina web. Ecco la sua sintassi:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
L'uso di questo meta tag impedisce a Google di tenere una copia della pagina e rimuove dai risultati delle ricerche la visualizzazione del link con la dicitura "Copia cache".
Il secondo meta tag dedicato a Google consente di rimuovere dai risultati delle ricerche lo "snippet", ovvero l'estratto della pagina che Google crea "al volo" e che mostra sotto il link alla stessa.
Questo meta tag è nato perché non sempre gli estratti creati da Google sono realmente rappresentativi dei contenuti della pagina. In tali casi, il webmaster può preferire di non far mostrare alcun estratto, ricorrendo al seguente meta tag:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
Va notato che tale richiesta di rimozione degli estratti comporta implicitamente anche la rimozione della copia della pagina che Google mantiene nei suoi archivi, producendo il medesimo effetto del meta tag "NOARCHIVE" pocanzi illustrato.