Référencement pour site web : améliorer son site internet
Descriptif :
Construire un site web c'est bien mais de le faire connaître aux millions d'internautes c'est le plus important.
Il faut qu'il soit bien placé dans les 3 première page des moteurs de recherche pour que votre site web est le plus de chance d'être visité par l'internaude. Il n'est pas évident si l'on considère les 80 millions de sites existant sur le web et les
651 milliards de pages vues par mois. Vous allez donc devoir entrer dans le domaine impitoyable de l'inscription dans les moteurs de recherche et des annuaires.
L'inscription dans les moteurs de recherche
Tout d'abord, ne soyez pas pressé. Ne proposez jamais un site " En construction" .Vous seriez rejeté par les moteurs ou mal classé, pas de visite.
Comme vous avez pu le constater vous-même, trouver un site sur le sujet qui vous intéresse passe par les grands moteurs tels que Alta Vista - Google - MSN Search - Yahoo et bien
d'autres. Il faut donc que votre site soit présent dans leur base de données. Pour ce
faire, le webmaster devra se rendre sur la page d'accueil de ces moteurs et cliquer sur le
lien généralement dénommé " S'inscrire " ou " Ajouter un site ". Il faudra alors choisir entre l'inscription gratuite ou payante. Vous devrez attendre de 2 à 8 semaines pour voir figurer votre site dans les pages du moteur si vous avez choisi l'inscription gratuite et quelques jours pour l'inscription payante. Celle-ci ne garantie pas un bon classement, seulement la rapidité d'exécution de la demande qui peut aussi être rejetée.
Piège à éviter :
Ne croyez jamais qu'une société spécialisée dans le référencement puisse vous garantir d'être dans les premiers résultats des moteurs. Tout le monde aimeraient bien figurer dans les premiers résultats et il n'y a que 30 résultats pour les 3 premières pages, celles qui sont les plus vues, alors ... Sauf si votre activité est très spécialisée et que, par exemple, vous vendriez des (objets rare) , il vous faudra tout de même vous battre pour être bien placé dans les résultats que donne cette requête chez Google.
Les grands moteurs ont leur version française, espagnole, allemande, etc. L'inscription dans la version française ne vaudra pas automatiquement pour toutes les langues. A titre d'exemple, se référencer chez Altavista.com ne vous fait pas figurer dans Altavista.fr. Il vous faudra donc vous
renseigner sur cette particularité au moment de l'inscription.
Chaque moteur a sa propre méthode d'inscription qu'il faudra suivre
scrupuleusement. En général, il vous sera demandé l'URL du site, quelques
renseignements vous concernant et une adresse e-mail valide. Le moteur visitera ensuite
votre site pour en évaluer le contenu. Cette évaluation se fera bien souvent sur les
balises meta que vous aurez au préalable renseignées. Et c'est là toute l'importance
d'une bonne construction de ces balises. Mal conçues, vous êtes rejeté à la 900ième
page des résultats de la recherche que fera un surfeur sur un mot-clef qui pourtant,
d'après vous, caractérise bien votre site. Il faut bien retenir une chose : en moyenne le
surfeur ne va pas au-delà de la cinquième page des résultats et la
tendance actuelle montre que 70% des internautes ne vont pas plus loin que la
1ère page.
Certains moteurs ne tiennent pas compte de la balise "mots-clefs"
mais travaillent sur d'autres critères que nous allons voir plus loin.
La visite de votre site par les moteurs se fait par l'intermédiaire
d'une application spéciale dénommée Spider (araignée) qui
examinera la validité de vos meta, le poids de votre page, son temps de chargement, la
validité des liens. Cet examen sera complété, éventuellement, par un collaborateur de
la société qui ajoutera la note humaine à ce test.
Mais avant de commencer, préparez un brouillon (block note) avec les titres,
descriptions de vos pages et mot-clefs ce, pour chaque page de votre site. Car chaque page de votre site web ont leurs propre mot clef. En effet, pour obtenir le meilleur référencement possible, il faudra que chaque page est des balises
meta différentes. Ainsi cela offre de plus grandes chances à ces pages d'être retenues
car, si vous mettez les mêmes balises partout et que vous ratiez votre référencement,
presque aucune page de votre site sera retenue. Par contre, si les pages/meta sont
différentes, cela augmentera la chance à ces pages d'être prises en compte par les
moteurs et même dans des catégories différentes.
Vous allez créer ensuite, si ce n'est dejà fait, le fichier robots.txt.
Quelques règles essentielles sont à
observer pour une bonne conception de ces balises meta que l'on trouve entre les deux
balises <head> et </head> :
- Le titre doit toujours se placer en tête, juste après la balise < head >, suivi de la description puis de la liste des mots-clefs.
- La longueur de chaque balise en nombre de mots et de caractères obéit à des règles très strictes (voir plus loin).
- La page d'accueil (index.htm), ou toute autre dénomination, doit
être la plus soignée car c'est elle, en général, qui sera retenue par les moteurs.
Elle doit s'afficher en moins de 10 secondes. Les autres pages de votre
site ne seront prises en compte que si elles sont aussi bien conçues que la première ;
c'est, évidemment, tout à fait impossible. Le poids en Ko de votre page compte pour son
temps d'affichage, on préconise en général 40 Ko maximum, mais il faut aussi tenir
compte de votre hébergeur qui sera plus ou moins rapide en réponse et de l'heure
de consultation de votre page. A ce titre faites plusieurs essais à des heures
différentes.
- Il ne doit y avoir aucun lien mort interne (la disponibilité de ceux externes ne dépend souvent pas de vous).
- Ne pas soumettre des sites "En travaux".
- Ne pas soumettre son site plus d'une fois à un moteur. Vous n'y figureriez pas car cela serait considéré comme du spam.
- Si votre site n'est pas retenu, attendre 2 à 3 mois avant de refaire une demande.
- Les frames, Flash, liens JavaScript, programmes de type cgi, les adresses de page contenant un point d'interrogation dans leur intitulé, bloquent certains moteurs et la page n'est alors pas indexée.
- Afin que le robot retrouve son chemin dans un lien JavaScript,
établir un lien sur un point.
Exemple : <p><a href="retour.htm"></a></p>
- La page est rejetée si elle est trop graphique, comporte moins de 50
mots ou moins de 300 caractères.
Pour le confort du visiteur :
- Une page d'accueil trop longue à charger
le fait fuir.
- L'ouverture d'innombrables pop-up aussi.
- L'obligation de voter pour le site ou de
visiter le sponsor également.
- Une centaine de liens internes en première
page fait fouillis et ne permet pas au visiteur de voir d'un coup d'oeil ce qu'il est venu
chercher. Mieux vaut la présence de quelques grands chapitres et un lien "Plan
du site", vraiment obligatoire.
- N'utilisez pas de trop petits caractères.
Tout le monde n'a pas un regard d'aigle.
- Ne pas trop mettre de bannières
publicitaires en première page. Le visiteur est venu pour vous, par pour aller ailleurs.
De plus, cela ralentira le chargement de votre page d'accueil. Disséminez ces bannières
sur toutes vos pages ou regroupez-les sur une seule.
- A moins que votre site ne vous rémunère au
clic ou par la publicité, sachez que se sont les grands moteurs de recherche qui
génèrent 85% de votre trafic. Ne pliez pas à l'obligation des petits sites partenaires
qui exigent presque tous de faire figurer leur bannière en première page et qui ne vous
apporteront peut être jamais aucun visiteur.
- Une superbe présentation graphique et
animée en première page peut ralentir son chargement. Si le reste du site n'est pas à
la hauteur de la page d'accueil, le visiteur en sera déçu. Si elle l'est, mais que les
autres pages sont aussi longues à s'afficher, il fuira votre site à cause du temps
de chargement.
Examinons maintenant ces fameuses balises. La méthode ci-dessous
préconisée est la synthèse de ce qui doit se faire pour un bon référencement.
Certaines balises sont considérées par d'autres webmasters comme négligeables. L'avis
du webmaster de ce site est que rien ne doit être négligé pour être bien placé et que
l'ajout de quelques balises ne va pas surcharger le poids de la page et augmenter son
temps de chargement. Le premier objectif du webmaster c'est que l'on puisse retrouver une
ou, pourquoi pas, plusieurs de ses pages bien placées dans les résultats parmi, par
exemple, les 5 milliards de pages référencées chez Google !
Mise en oeuvre :
Une liste de meta parfaite est donnée ci-dessous. Ces meta ne concernent que le référencement car il existe d'autres balises plus spécifiques qui sont évoquées ci-dessous pour mémoire :
<meta name="refresh"
content="60"> actualise la page au bout de 60
secondes. Attention, peut bloquer certains moteurs si la valeur est trop petite (ex :
refresh" content="0") car le spider n'a pas le temps de suivre le lien. Une valeur d'au moins "2" est souhaitable.
<meta http-equiv="refresh" content="6; url=http://www.autre_site.com"> redirige au bout de 6 secondes vers un autre site.
<meta http-equiv="pragma" content="no-cache"> interdit la mise en cache de la page.
<meta http-equiv="expires" content="Fri, 12
June 2002 15:00:00 GMT"> date d'expiration de la page dans le cache.
Voici pour ce qui concerne le référencement :
Entre les deux balises <head>
et </head>
< title>100 caractères maximum
(y compris espaces). Pas de passage à la ligne sur votre éditeur HTML.</title>
<meta name="description"
content="200/150 caractères maximum (y compris espaces). Pas
de passage à la ligne sur votre éditeur HTML.">
<meta name="keywords"content="1000 caractères maximum (y compris espaces). Les 400 premiers
seulement sont pris en compte le plus souvent par les moteurs de recherche. 100 mots
maximum. Pas de passage à la ligne sur votre éditeur HTML.">
<meta name="abstract"
content="Autre, ou même résumé de votre site. Pris en compte
seulement par quelques rares moteurs. 200 caractères maximum.">
<meta name="author"
content="Le nom de l'auteur du site">
<meta name="copyright"
content="Nom et date du copyright du site">
<meta http-equiv="Content-type"
content="text/html;charset=iso-8859-1">
<meta name="language"
content="fr">
<meta http-equiv="Content-Language"
content="fr">
<meta name="robots"
content="index, follow">
<meta name="revisit-after"
content="30 days">
<meta name="reply-to"
content="webmaster@votre_site.com">
<meta name="identifier-url"
content="http://www.votre_site.com/">
<meta name="subject"
content="Site sur les outils pour webmasters">
<meta name="expires"
content="never">
<meta name="publisher"
content="Nom de l'éditeur du site">
<meta name="location"
content="France, FRANCE">
<meta name="rating"
content="general">
<meta name="category"
content="une_catégorie">
<meta name="Date-Creation-ddmmyyyy"
content="20112000">
<meta name="DATE-REVISION-ddmmyyyy"
content="01022002">
<meta name="generator"
content="nom_du_logiciel">
<meta http-equiv="VW96.OBJECT
TYPE" content="Document">
Règle générale :
- L'URL de votre site est aussi à prendre en
considération et les mots qui la composent sont pris en compte. L'idéal étant qu'un ou
plusieurs des mots de l'URL soient dans le titre de la page, dans la description, dans les
mots clefs et bien évidemment dans les 200 premiers caractères visibles de la page.
- Pas d'URL comportant un point d'interrogation ou faisant plus de 70
caractères. Elle ne serait pas prise en compte par certains moteurs.
- Atteignez ou frôlez le nombre de caractères/mots optimum. Ne faites pas des titres
courts comme "Ma page" ou de description comme "Ma jolie page".
- Rédigez titre, description et 200 premiers caractères visibles de la page de façon
cohérente et compréhensible.
- Si vous tenez absolument à ce qu'une page soit indexée par les moteurs, frôlez le
nombre maximum de caractères dans le texte visible. Ainsi, il y aura moins de mots,
chacun d'eux possèdera une forte pondération et plus de poids par rapport à son double
dans les balises meta.
- La majorité des moteurs est insensible aux majuscules et les internautes ont pris
l'habitude d'effectuer leurs recherches en minuscules. Donc, il ne semble pas essentiel
d'écrire vos mots-clefs en double casse : "France", "france".Exception de quelques rares moteurs (Alta Vista) qui rechercheront les mots en minuscules
et majuscules si vous avez entré votre recherche en minuscule mais donnera le mot exact
si vous avez tapé votre mot en majuscule.
- Pour le choix des mots-clefs, par rapport au thème de votre site, mettez-vous à la
place de l'internaute et demandez-vous quel(s) mot(s)-clef(s) vous allez entrer pour
trouver ce que vous cherchez.
- N'utilisez pas des mots-clefs qui n'ont rien à voir avec votre site : rejet définitif
avec impossibilité de procéder à une nouvelle soumission (Vous vous souvenez
certainement de ce site d'un parti politique français qui avait mis en mot-clef
"Pamela Anderson").
- Les spiders ne peuvent pas remplir de formulaires et sont bloqués sur des
pages où un mot de passe est demandé ou sur des bases de données.
- Si la plupart des spiders sont arrêtés par les cadres (frames), rien ne vous empêche
de faire une version sans cadre.
- Les mots-clefs formant un titre dans la page visible devront, de préférence, se placer
entre les balises <H1> </H1>
- Les liens explicites et associatifs sont mieux notés que des liens sans aucun sens
linguistique.
- Pour alléger vos pages et accélérer le chargement, allégez vos images et
préférez des vignettes que l'on peut agrandir par un clic dessus plutôt que des images
grandeur nature.
Reprenons chaque balise :
< title>Le titre de mon site.</title>
Toujours en tête et avant les autres balises meta. Doit comporter 100 caractères
maximum (y compris les espaces). 70/80 caractères est une bonne moyenne et 5 à 7 mots
minimum. Votre éditeur HTML ne doit pas lui faire subir un passage à la ligne. Pas de
mots pompeux (Le meilleur des sites, le plus beau). Pas de mots accrocheurs comme
"sexe", "MP3".
Il est important que le titre soit en tête de la page, juste après <head> car les moteurs peuvent être bloqués si, par exemple,
ils y rencontrent un code JavaScript qu'ils ne sauront pas interprêter.
<meta name="description"
content="La description du contenu de votre site">
Toujours après le titre. Doit comporter 200/150 caractères maximum (y compris les
espaces). Votre éditeur HTML ne doit pas lui faire subir un passage à la ligne.
<meta name="keywords"content="Ici, tous, les, mots-clefs, séparés, par, des, virgules">
1000 caractères maximum (y compris les espaces). Seuls les 400 premiers seulement
sont pris en compte le plus souvent par les moteurs de recherche. 100 mots maximum. Pas de
passage à la ligne par votre éditeur HTML. On peut songer aussi aux mots déclinant le
féminin, le masculin, le pluriel (chien, chienne, chiennes) mais il faudra alors qu'ils
soient séparés chacun par 10 autres mots-clefs car les spiders considèrent que
la répétition à outrance d'un mot-clef est une tentative de spam et rejettent votre
page.
Vous pouvez coder tous les mots du titre, description et mots-clefs
en HTML. Mais là, il faut, comme les mots ci-après, un minimum d’étude
et d’apprentissage (d'étude et d'apprentissage). Cette méthode permettra aux
moteurs anglo-saxons de reconnaître les accents typiques à certaines langues comme le
français ou l'espagnol. Mais les caractères produits pour représenter les à (à) ù (ù) ï (ï) ô (ô) ç (ç) è (è) é (é) un espace ( )
compteront dans le total du nombre de caractères à ne pas dépasser.
<meta name="abstract"
content="Autre, ou même résumé de votre site.">
Pris en compte seulement par quelques rares moteurs. Mais, encore une fois, il ne faut
rien négliger pour apparaître dans les 3 premières pages des résultats des moteurs.
200 caractères maximum.
<meta name="author"
content="Daniel MALEVILLE>">Le nom de
l'auteur du site.
<meta name="copyright"
content="Toulouse-Renaissance - 2002"> Nom et
date du copyright du site.
<meta http-equiv="Content-type"
content="text/html;charset=iso-8859-1">
<meta name="language"
content="fr">
<meta http-equiv="Content-Language"
content="fr">
Indique au spider le type de caractères employés iso
(ici, en latin) et la langue employée (ici, le français).
<meta name="robots"
content="index, follow">
Indique au spider ce qu'il doit faire. Dans le cas présent il lui est demandé
d'indexer la page où se trouve cette balise meta (index) et
de suivre (follow) les liens de cette page conduisant
généralement vers les autres pages de votre site. Si vous ne voulez pas que le spider
indexe votre page il faudra écrire noindex. Si vous voulez
que le spider ne suive pas les liens présents dans la page qu'il indexe, il faudra
écrire nofollow. Ainsi, si vous souhaitez que le spider
n'indexe pas une de vos pages mais, par contre, suive les liens présents, il faudra
écrire <meta name="robots"
content="noindex, follow">. On peut remplacer index et follow par all si vous voulez que tout soit indexé et que tous les liens
soient suivis et par none si vous souhaitez le contraire.
<meta name="revisit-after"
content="30 days">
Indique au spider dans combien de temps il doit revenir visiter la page. Trente
jours est le maximum. Vous pouvez mettre moins (7 days) mais
ceci n'est valable que si votre site a une actualité particulière qui change très
souvent.
<meta name="reply-to"
content="webmaster@votre_site.com">
L'adresse e-mail où l'on peut vous joindre.
<meta name="identifier-url"
content="http://www.votre_site.com/">
L'adresse URL complète de votre site.
Si vous êtes chez un hébergeur gratuit mettre évidemment son nom : "http://www.multimania.com/votre_site/">
<meta name="subject"
content="Site sur les outils pour webmasters">
Le sujet, en quelques mots, de votre site.
<meta name="expires"
content="never">
Indique au spider si votre site aura une vie courte (exposition, conférence
etc.<meta name="expires"
content="Wed, 29 Sept 2002 09:00:00 GMT">) ou
s'il est permanent (never).
<meta name="publisher"
content="Nom de l'éditeur du site">
Votre nom si vous en êtes l'éditeur.
<meta name="location"
content="France, FRANCE">
L'endroit où se situe le site.
<meta name="rating" CONTENT="general">
Indique si votre site est pour tout public ou pour adulte. Peut être vu par :
<meta name="category"
content="une_catégorie">
Voir si un moteur de recherche demande que vous inscriviez une catégorie pré-définie
par lui. D'où, toujours l'intérêt de faire un référencement manuel pour bien
connaître chaque spécificité d'inscription.
<meta name="Date-Creation-ddmmyyyy"
CONTENT="20112000">
Indique au spider la date de la création de votre page : dd jour (ex : 07), mm
mois (ex : 02), yyyy (year) année (2002).
<meta name="DATE-REVISION-ddmmyyyy"
content="01022002">
Indique au spider la date de la révision de votre page. Même construction que
ci-dessus.
<meta name="generator"
content="Microsoft FrontPage 3.0">
Logiciel utilisé pour l'élaboration de votre site. Peut être Notepad.N'est pas essentielle pour un bon référencement.
<meta http-equiv="VW96.OBJECT TYPE" content="Document">
Indique le type de la page à choisir dans une catégorie. Nature de la page :
Et voilà. Si vous avez suivi scrupuleusement ces indications, vous
avez les meilleures meta possibles. Mais, hélas, ce n'est pas fini. En effet, il faut que
le ou les mots-clefs caractérisant votre site se retrouvent respectivement dans le titre,
la description, les mots-clefs et les 200 premiers caractères visibles de votre page. En
outre, il est préférable que, dans le code HTML de toute la page y compris les meta,
chaque mot-clef ne se répète pas plus de 7 fois, sinon il ne sera pas retenu ou la
page sera mal classée ou pas indexée.
Les mots inscrits dans la balise "alt"
des images seront pris en compte par les moteurs et participent à la pertinence des
mots-clefs. Ces balises sont donc très importantes. Attention, par ce biais, de ne pas
dépasser le nombre total de mots-clefs. Exemple, pointez et laissez votre curseur sur
l'image suivante :
Classez les mots du titre, description, mots-clefs, texte visible
dans l'ordre d'importance que vous leur donnerez. Ne placez pas un mot-clef du titre en
premier si on le retrouve en 10ème place dans la description et à la 20ème place dans
le texte visible.
Exemple :
< title>Le référencement.
Outils webmaster. Trucs et astuces html javascript pour site web</title>
< meta name="description"content="Le
référencement. Outils pour webmaster. Trucs et astuces en code html et javascript pour
site web : améliorer son site internet">
<meta name="keywords" content=" référencement, outils, webmaster, trucs et astuces, html, javascript,code, site, internet, web, traduire, images, favoris, download, winzip, realplayer,
bookmark, tool, sécurité, virus, antivirus, hacker, firewall, netscape, internet
explorer, gif, jpeg, jpg">
(Texte visible dans le corps de la page)Ce site traite du référencement sur le web. Les outils pour webmaster y
sont présentés.Trucs et astuces, aussi bien en code html
ou javascript, vous permettront d'améliorer votre site internet.
Ainsi, se retrouvent dans le titre, la
description, les mots-clefs et dans les 200 premiers caractères les mots :
référencement, outils, webmaster, trucs et astuces, code, html, javascript, web.
Les autres mots-clefs seront considérés moins importants par les moteurs. Bien sûr, il y a le problème des moteurs qui tiennent
compte des majuscules et des minuscules mais ils sont une minorité.
Remarque :
vous aurez pu constater que le référencement est d'une rigidité absolue et ne permet pas vraiment aux
concepteurs de s'exprimer pleinement. Or, il se trouve que vous avez un site où
toutes les pages ont des frames, utilisent le Flash, le JavaScript en tête de page, des
images très belles mais assez lourdes, que le temps de chargement des pages est au-dessus
de la moyenne, bref, tout ce qui ne plaît pas aux spiders. Mais votre site est
beau et les internautes en sont satisfaits. Alors, cette place dans les 3 premières pages
des résultats-moteurs, ne la méritez-vous pas ? Si, mais hélas, il faut en passer par
les fourches caudines des spiders. J'ai pu ainsi voir l'importateur d'une grande
firme automobile orientale, possédant un superbe site mais qui employait toutes les
mauvaises méthodes décrites ci-dessus. Il se retrouvait naturellement très loin
derrière les sites de ses concessionnaires ou de ses revendeurs qui, pour la plupart
avaient un contenu assez creux (simple liste de prix, petites photos, adresse et
téléphone, le tout en 3 pages).
La situation est-elle désespérée ? Non, car la technique vient
toujours au secours des webmasters. Cette technique se nomme le cloacking.
Il s'agit de concevoir des pages destinées uniquement aux spiders mais que
l'internaute ne verra jamais. Un double site, en quelque sorte. Une application sur le
serveur va vérifier l'adresse IP des visiteurs. Si celle-ci correspond à l'adresse
connue du spider d'un moteur de recherche, c'est la page propre et belle qui lui est
présentée. Si c'est une adresse IP non référencée comme appartenant à un spider, se
sont les pages réelles qui sont présentées à l'internaute. Mais à la défense
correspond toujours une contre-attaque et, de plus en plus, les moteurs changent
intempestivement l'adresse IP de leur spider pour ne pas être reconnus. Si ce
petit jeu vous intéresse, vous trouverez sur le web tout ce qu'il faut pour mettre cette
technique en application.
Les résultats ci-après peuvent varier en plus ou en moins suivant
l'ajout de nouveaux sites ou la suppression de certains sur les moteurs (recherches
effectuées en 2004).
Conclusion :
L'essentiel étant d'être présent dans les 3 premières pages des résultats. On
voit aussi que le référencement n'est pas une chose statique et qu'il évolue avec le
temps. Pour cette raison, il doit être suivi tout le long de la vie du site et
chaque place perdue doit être compensée par une recherche d'amélioration du
référencement.