Le Référencement

Référencement pour site web : améliorer son site internet

Descriptif :
Construire un site web c'est bien mais de le faire connaître aux millions d'internautes c'est le plus important.
Il faut qu'il soit bien placé dans les 3 première page des moteurs de recherche pour que votre site web est le plus de chance d'être visité par l'internaude. Il n'est pas évident si l'on considère les 80 millions de sites existant sur le web et les 651 milliards de pages vues par mois. Vous allez donc devoir entrer dans le domaine impitoyable de l'inscription dans les moteurs de recherche et des annuaires.

L'inscription dans les moteurs de recherche
Tout d'abord, ne soyez pas pressé. Ne proposez jamais un site " En construction" .Vous seriez rejeté par les moteurs ou mal classé, pas de visite.
Comme vous avez pu le constater vous-même, trouver un site sur le sujet qui vous intéresse passe par les grands moteurs tels que
Alta Vista - Google - MSN Search - Yahoo et bien d'autres. Il faut donc que votre site soit présent dans leur base de données. Pour ce faire, le webmaster devra se rendre sur la page d'accueil de ces moteurs et cliquer sur le lien généralement dénommé " S'inscrire " ou " Ajouter un site ". Il faudra alors choisir entre l'inscription gratuite ou payante. Vous devrez attendre de 2 à 8 semaines pour voir figurer votre site dans les pages du moteur si vous avez choisi l'inscription gratuite et quelques jours pour l'inscription payante. Celle-ci ne garantie pas un bon classement, seulement la rapidité d'exécution de la demande qui peut aussi être rejetée.

Piège à éviter :
Ne croyez jamais qu'une société spécialisée dans le référencement puisse vous garantir d'être dans les premiers résultats des moteurs. Tout le monde aimeraient bien figurer dans les premiers résultats et il n'y a que 30 résultats pour les 3 premières pages, celles qui sont les plus vues, alors ... Sauf si votre activité est très spécialisée et que, par exemple, vous vendriez des (objets rare) , il vous faudra tout de même vous battre pour être bien placé dans les résultats que donne cette requête chez Google.

Les grands moteurs ont leur version française, espagnole, allemande, etc. L'inscription dans la version française ne vaudra pas automatiquement pour toutes les langues. A titre d'exemple, se référencer chez Altavista.com ne vous fait pas figurer dans Altavista.fr. Il vous faudra donc vous renseigner sur cette particularité au moment de l'inscription.

Chaque moteur a sa propre méthode d'inscription qu'il faudra suivre scrupuleusement. En général, il vous sera demandé l'URL du site, quelques renseignements vous concernant et une adresse e-mail valide. Le moteur visitera ensuite votre site pour en évaluer le contenu. Cette évaluation se fera bien souvent sur les balises meta que vous aurez au préalable renseignées. Et c'est là toute l'importance d'une bonne construction de ces balises. Mal conçues, vous êtes rejeté à la 900ième page des résultats de la recherche que fera un surfeur sur un mot-clef qui pourtant, d'après vous, caractérise bien votre site. Il faut bien retenir une chose : en moyenne le surfeur ne va pas au-delà de la cinquième page des résultats et la tendance actuelle montre que 70% des internautes ne vont pas plus loin que la 1ère page.

Certains moteurs ne tiennent pas compte de la balise "mots-clefs" mais travaillent sur d'autres critères que nous allons voir plus loin.

La visite de votre site par les moteurs se fait par l'intermédiaire d'une application spéciale dénommée Spider (araignée) qui examinera la validité de vos meta, le poids de votre page, son temps de chargement, la validité des liens. Cet examen sera complété, éventuellement, par un collaborateur de la société qui ajoutera la note humaine à ce test.

Mais avant de commencer, préparez un brouillon (block note) avec les titres, descriptions de vos pages et mot-clefs ce, pour chaque page de votre site. Car chaque page de votre site web ont leurs propre mot clef. En effet, pour obtenir le meilleur référencement possible, il faudra que chaque page est des balises meta différentes. Ainsi cela offre de plus grandes chances à ces pages d'être retenues car, si vous mettez les mêmes balises partout et que vous ratiez votre référencement, presque aucune page de votre site sera retenue. Par contre, si les pages/meta sont différentes, cela augmentera la chance à ces pages d'être prises en compte par les moteurs et même dans des catégories différentes.

Vous allez créer ensuite, si ce n'est dejà fait, le fichier robots.txt.

Quelques règles essentielles sont à observer pour une bonne conception de ces balises meta que l'on trouve entre les deux balises <head> et </head> :
- Le titre doit toujours se placer en tête, juste après la balise < head >, suivi de la description puis de la liste des mots-clefs.
- La longueur de chaque balise en nombre de mots et de caractères obéit à des règles très strictes (voir plus loin).
- La page d'accueil (index.htm), ou toute autre dénomination, doit être la plus soignée car c'est elle, en général, qui sera retenue par les moteurs. Elle doit s'afficher en moins de 10 secondes. Les autres pages de votre site ne seront prises en compte que si elles sont aussi bien conçues que la première ; c'est, évidemment, tout à fait impossible. Le poids en Ko de votre page compte pour son temps d'affichage, on préconise en général 40 Ko maximum, mais il faut aussi tenir compte  de votre hébergeur qui sera plus ou moins rapide en réponse et de l'heure de consultation de votre page. A ce titre faites plusieurs essais à des heures différentes.
- Il ne doit y avoir aucun lien mort interne (la disponibilité de ceux externes ne dépend souvent pas de vous).
- Ne pas soumettre des sites "En travaux".
- Ne pas soumettre son site plus d'une fois à un moteur. Vous n'y figureriez pas car cela serait considéré comme du spam.
- Si votre site n'est pas retenu, attendre 2 à 3 mois avant de refaire une demande.
- Les frames, Flash,  liens JavaScript, programmes de type cgi, les adresses de page contenant un point d'interrogation dans leur intitulé, bloquent certains moteurs et la page n'est alors pas indexée.
- Afin que le robot retrouve son chemin dans un lien JavaScript, établir un lien sur un point.

                                       Exemple : <p><a href="retour.htm"></a></p>
- La page est rejetée si elle est trop graphique, comporte moins de 50 mots ou moins de 300 caractères.

Pour le confort du visiteur :
        - Une page d'accueil trop longue à charger le fait fuir.
        - L'ouverture d'innombrables pop-up aussi.
        - L'obligation de voter pour le site ou de visiter le sponsor également.
        - Une centaine de liens internes en première page fait fouillis et ne permet pas au visiteur de voir d'un coup d'oeil ce qu'il est venu chercher. Mieux vaut la présence de quelques grands chapitres et un lien "Plan du site", vraiment obligatoire.
        - N'utilisez pas de trop petits caractères. Tout le monde n'a pas un regard d'aigle.
        - Ne pas trop mettre de bannières publicitaires en première page. Le visiteur est venu pour vous, par pour aller ailleurs. De plus, cela ralentira le chargement de votre page d'accueil. Disséminez ces bannières sur toutes vos pages ou regroupez-les sur une seule.
        - A moins que votre site ne vous rémunère au clic ou par la publicité, sachez que se sont les grands moteurs de recherche qui génèrent 85% de votre trafic. Ne pliez pas à l'obligation des petits sites partenaires qui exigent presque tous de faire figurer leur bannière en première page et qui ne vous apporteront peut être jamais aucun visiteur.
        - Une superbe présentation graphique et animée en première page peut ralentir son chargement. Si le reste du site n'est pas à la hauteur de la page d'accueil, le visiteur en sera déçu. Si elle l'est, mais que les autres pages sont aussi longues à  s'afficher, il fuira votre site à cause du temps de chargement.

Examinons maintenant ces fameuses balises. La méthode ci-dessous préconisée est la synthèse de ce qui doit se faire pour un bon référencement. Certaines balises sont considérées par d'autres webmasters comme négligeables. L'avis du webmaster de ce site est que rien ne doit être négligé pour être bien placé et que l'ajout de quelques balises ne va pas surcharger le poids de la page et augmenter son temps de chargement. Le premier objectif du webmaster c'est que l'on puisse retrouver une ou, pourquoi pas, plusieurs de ses pages bien placées dans les résultats parmi, par exemple, les 5 milliards de pages référencées chez Google !

Mise en oeuvre :
Une liste de meta parfaite est donnée ci-dessous. Ces meta ne concernent que le référencement car il existe d'autres balises plus spécifiques qui sont évoquées ci-dessous pour mémoire :

<meta name="refresh" content="60"> actualise la page au bout de 60 secondes. Attention, peut bloquer certains moteurs si la valeur est trop petite (ex : refresh" content="0") car le spider n'a pas le temps de suivre le lien. Une valeur d'au moins "2" est souhaitable.
<meta http-equiv="refresh" content="6; url=http://www.autre_site.com"> redirige au bout de 6 secondes vers un autre site.
<meta http-equiv="pragma" content="no-cache"> interdit la mise en cache de la page.
<meta http-equiv="expires" content="Fri, 12 June 2002 15:00:00 GMT"> date d'expiration de la page dans le cache.

Voici pour ce qui concerne le référencement :

Entre les deux balises <head> et </head>


< title>100 caractères maximum (y compris espaces). Pas de passage à la ligne sur votre éditeur HTML.</title>
<meta name="description" content="200/150 caractères maximum (y compris espaces). Pas de passage à la ligne sur votre éditeur HTML.">
<meta name="keywords"content="1000 caractères maximum (y compris espaces). Les 400 premiers seulement sont pris en compte le plus souvent par les moteurs de recherche. 100 mots maximum. Pas de passage à la ligne sur votre éditeur HTML.">
<meta name="abstract" content="Autre, ou même résumé de votre site. Pris en compte seulement par quelques rares moteurs. 200 caractères maximum.">
<meta name="author" content="Le nom de l'auteur du site">
<meta name="copyright" content="Nom et date du copyright du site">
<meta http-equiv="Content-type" content="text/html;charset=iso-8859-1">
<meta name="language" content="fr">
<meta http-equiv="Content-Language" content="fr">
<meta name="robots" content="index, follow">
<meta name="revisit-after" content="30 days">
<meta name="reply-to" content="webmaster@votre_site.com">
<meta name="identifier-url" content="http://www.votre_site.com/">
<meta name="subject" content="Site sur les outils pour webmasters">
<meta name="expires" content="never">
<meta name="publisher" content="Nom de l'éditeur du site">
<meta name="location" content="France, FRANCE">
<meta name="rating" content="general">
<meta name="category" content="une_catégorie">
<meta name="Date-Creation-ddmmyyyy" content="20112000">
<meta name="DATE-REVISION-ddmmyyyy" content="01022002">
<meta name="generator" content="nom_du_logiciel">
<meta http-equiv="VW96.OBJECT TYPE" content="Document">

Règle générale :
- L'URL de votre site est aussi à prendre en considération et les mots qui la composent sont pris en compte. L'idéal étant qu'un ou plusieurs des mots de l'URL soient dans le titre de la page, dans la description, dans les mots clefs et bien évidemment dans les 200 premiers caractères visibles de la page.
- Pas d'
URL comportant un point d'interrogation ou faisant plus de 70 caractères. Elle ne serait pas prise en compte par certains moteurs.
- Atteignez ou frôlez le nombre de caractères/mots optimum. Ne faites pas des titres courts comme
"Ma page" ou de description comme "Ma jolie page".
- Rédigez titre, description et 200 premiers caractères visibles de la page de façon cohérente et compréhensible.
- Si vous tenez absolument à ce qu'une page soit indexée par les moteurs, frôlez le nombre maximum de caractères dans le texte visible. Ainsi, il y aura moins de mots, chacun d'eux possèdera une forte pondération et plus de poids par rapport à son double dans les balises meta.
- La majorité des moteurs est insensible aux majuscules et les internautes ont pris l'habitude d'effectuer leurs recherches en minuscules. Donc, il ne semble pas essentiel d'écrire vos mots-clefs en double casse :
"France", "france".Exception de quelques rares moteurs (Alta Vista) qui rechercheront les mots en minuscules et majuscules si vous avez entré votre recherche en minuscule mais donnera le mot exact si vous avez tapé votre mot en majuscule.
- Pour le choix des mots-clefs, par rapport au thème de votre site, mettez-vous à la place de l'internaute et demandez-vous quel(s) mot(s)-clef(s) vous allez entrer pour trouver ce que vous cherchez.
- N'utilisez pas des mots-clefs qui n'ont rien à voir avec votre site : rejet définitif avec impossibilité de procéder à une nouvelle soumission (Vous vous souvenez certainement de ce site d'un parti politique français qui avait mis en mot-clef "Pamela Anderson").
- Les spiders ne peuvent pas remplir de formulaires et sont bloqués sur des pages où un mot de passe est demandé ou sur des bases de données.
- Si la plupart des spiders sont arrêtés par les cadres (frames), rien ne vous empêche de faire une version sans cadre.
- Les mots-clefs formant un titre dans la page visible devront, de préférence, se placer entre les balises
<H1> </H1>
- Les liens explicites et associatifs sont mieux notés que des liens sans aucun sens linguistique.

- Pour alléger vos pages et accélérer le chargement, allégez vos images et préférez des vignettes que l'on peut agrandir par un clic dessus plutôt que des images grandeur nature.

Reprenons chaque balise :

< title>Le titre de mon site.</title>
Toujours en tête et avant les autres balises meta. Doit comporter 100 caractères maximum (y compris les espaces). 70/80 caractères est une bonne moyenne et 5 à 7 mots minimum. Votre éditeur HTML ne doit pas lui faire subir un passage à la ligne. Pas de mots pompeux (Le meilleur des sites, le plus beau). Pas de mots accrocheurs comme "sexe", "MP3".
Il est important que le titre soit en tête de la page, juste après
<head> car les moteurs peuvent être bloqués si, par exemple, ils y rencontrent un code JavaScript qu'ils ne sauront pas interprêter.

<meta name="description" content="La description du contenu de votre site">
Toujours après le titre. Doit comporter 200/150 caractères maximum (y compris les espaces). Votre éditeur HTML ne doit pas lui faire subir un passage à la ligne.

<meta name="keywords"content="Ici, tous, les, mots-clefs, séparés, par, des, virgules">
1000 caractères maximum (y compris les espaces). Seuls les 400 premiers seulement sont pris en compte le plus souvent par les moteurs de recherche. 100 mots maximum. Pas de passage à la ligne par votre éditeur HTML. On peut songer aussi aux mots déclinant le féminin, le masculin, le pluriel (chien, chienne, chiennes) mais il faudra alors qu'ils soient séparés chacun par 10 autres mots-clefs car les spiders considèrent que la répétition à outrance d'un mot-clef est une tentative de spam et rejettent votre page.

Vous pouvez coder tous les mots du titre, description et mots-clefs en HTML. Mais là, il faut, comme les mots ci-après, un minimum d&#146;étude et d&#146;apprentissage (d'étude et d'apprentissage). Cette méthode permettra aux moteurs anglo-saxons de reconnaître les accents typiques à certaines langues comme le français ou l'espagnol. Mais les caractères produits pour représenter les à (&#224;)  ù (&#249;)   ï (&#239;)  ô (&#244;)  ç (&#231;)  è (&#232;)  é (&#233;)  un espace (&nbsp;) compteront dans le total du nombre de caractères à ne pas dépasser.

<meta name="abstract" content="Autre, ou même résumé de votre site.">
Pris en compte seulement par quelques rares moteurs. Mais, encore une fois, il ne faut rien négliger pour apparaître dans les 3 premières pages des résultats des moteurs. 200 caractères maximum.

<meta name="author" content="Daniel MALEVILLE>">Le nom de l'auteur du site.
<meta name="copyright" content="Toulouse-Renaissance - 2002"> Nom et date du copyright du site.

<meta http-equiv="Content-type" content="text/html;charset=iso-8859-1">
<meta name="language" content="fr">
<meta http-equiv="Content-Language" content="fr">

Indique au spider le type de caractères employés iso (ici, en latin) et la langue employée (ici, le français).

<meta name="robots" content="index, follow">
Indique au spider ce qu'il doit faire. Dans le cas présent il lui est demandé d'indexer la page où se trouve cette balise meta (index) et de suivre (follow) les liens de cette page conduisant généralement vers les autres pages de votre site. Si vous ne voulez pas que le spider indexe votre page il faudra écrire noindex. Si vous voulez que le spider ne suive pas les liens présents dans la page qu'il indexe, il faudra écrire nofollow. Ainsi, si vous souhaitez que le spider n'indexe pas une de vos pages mais, par contre, suive les liens présents, il faudra écrire <meta name="robots" content="noindex, follow">. On peut remplacer index et follow par all si vous voulez que tout soit indexé et que tous les liens soient suivis et par none si vous souhaitez le contraire.

<meta name="revisit-after" content="30 days">
Indique au spider dans combien de temps il doit revenir visiter la page. Trente jours est le maximum. Vous pouvez mettre moins (7 days) mais ceci n'est valable que si votre site a une actualité particulière qui change très souvent.

<meta name="reply-to" content="webmaster@votre_site.com">
L'adresse e-mail où l'on peut vous joindre.

<meta name="identifier-url" content="http://www.votre_site.com/">
L'adresse URL complète de votre site.
Si vous êtes chez un hébergeur gratuit mettre évidemment son nom :
"http://www.multimania.com/votre_site/">

<meta name="subject" content="Site sur les outils pour webmasters">
Le sujet, en quelques mots, de votre site.

<meta name="expires" content="never">
Indique au spider si votre site aura une vie courte (exposition, conférence etc.<meta name="expires" content="Wed, 29 Sept 2002 09:00:00 GMT">) ou s'il est permanent (never).

<meta name="publisher" content="Nom de l'éditeur du site"> Votre nom si vous en êtes l'éditeur.

<meta name="location" content="France, FRANCE">
L'endroit où se situe le site.

<meta name="rating" CONTENT="general">
Indique si votre site est pour tout public ou pour adulte. Peut être vu par :

<meta name="category" content="une_catégorie">
Voir si un moteur de recherche demande que vous inscriviez une catégorie pré-définie par lui. D'où, toujours l'intérêt de faire un référencement manuel pour bien connaître chaque spécificité d'inscription.

<meta name="Date-Creation-ddmmyyyy" CONTENT="20112000">
Indique au spider la date de la création de votre page : dd jour (ex : 07), mm mois (ex : 02), yyyy (year) année (2002).

<meta name="DATE-REVISION-ddmmyyyy" content="01022002">
Indique au spider la date de la révision de votre page. Même construction que ci-dessus.

<meta name="generator" content="Microsoft FrontPage 3.0">
Logiciel utilisé pour l'élaboration de votre site. Peut être Notepad.N'est pas essentielle pour un bon référencement.

<meta http-equiv="VW96.OBJECT TYPE" content="Document">
Indique le type de la page à choisir dans une catégorie. Nature de la page :

Et voilà. Si vous avez suivi scrupuleusement ces indications, vous avez les meilleures meta possibles. Mais, hélas, ce n'est pas fini. En effet, il faut que le ou les mots-clefs caractérisant votre site se retrouvent respectivement dans le titre, la description, les mots-clefs et les 200 premiers caractères visibles de votre page. En outre, il est préférable que, dans le code HTML de toute la page y compris les meta, chaque mot-clef ne se répète pas plus de 7 fois, sinon il ne sera pas retenu ou la page sera mal classée ou pas indexée.

Les mots inscrits dans la balise "alt" des images seront pris en compte par les moteurs et participent à la pertinence des mots-clefs. Ces balises sont donc très importantes. Attention, par ce biais, de ne pas dépasser le nombre total de mots-clefs. Exemple, pointez et laissez votre curseur sur l'image suivante : Votre curseur est bien sur l'image

Classez les mots du titre, description, mots-clefs, texte visible dans l'ordre d'importance que vous leur donnerez. Ne placez pas un mot-clef du titre en premier si on le retrouve en 10ème place dans la description et à la 20ème place dans le texte visible.

Exemple :
< title>Le référencement. Outils webmaster. Trucs et astuces html javascript pour site web</title>
< meta name="description"content="Le référencement. Outils pour webmaster. Trucs et astuces en code html et javascript pour site web : améliorer son site internet">
<meta name="keywords" content="
référencement, outils, webmaster, trucs et astuces, html, javascript,code, site, internet, web, traduire, images, favoris, download, winzip, realplayer, bookmark, tool, sécurité, virus, antivirus, hacker, firewall, netscape, internet explorer, gif, jpeg, jpg">

(Texte visible dans le corps de la page)Ce site traite du référencement sur le web. Les outils pour webmaster y sont présentés.Trucs et astuces, aussi bien en code html ou javascript, vous permettront d'améliorer votre site internet.

Ainsi, se retrouvent dans le titre, la description, les mots-clefs et dans les 200 premiers caractères les mots : référencement, outils, webmaster, trucs et astuces, code, html, javascript, web.
Les autres mots-clefs seront considérés moins importants par les moteurs. Bien sûr, il y a le problème des moteurs qui tiennent compte des majuscules et des minuscules mais ils sont une minorité.

Remarque :
vous aurez pu constater que le référencement est d'une rigidité absolue et ne permet pas vraiment aux concepteurs  de s'exprimer pleinement. Or, il se trouve que vous avez un site où toutes les pages ont des frames, utilisent le Flash, le JavaScript en tête de page, des images très belles mais assez lourdes, que le temps de chargement des pages est au-dessus de la moyenne, bref, tout ce qui ne plaît pas aux spiders. Mais votre site est beau et les internautes en sont satisfaits. Alors, cette place dans les 3 premières pages des résultats-moteurs, ne la méritez-vous pas ? Si, mais hélas, il faut en passer par les fourches caudines des spiders. J'ai pu ainsi voir l'importateur d'une grande firme automobile orientale, possédant un superbe site mais qui employait toutes les mauvaises méthodes décrites ci-dessus. Il se retrouvait naturellement très loin derrière les sites de ses concessionnaires ou de ses revendeurs qui, pour la plupart avaient un contenu assez creux (simple liste de prix, petites photos, adresse et téléphone, le tout en 3 pages).

La situation est-elle désespérée ? Non, car la technique vient toujours au secours des webmasters. Cette technique se nomme le cloacking. Il s'agit de concevoir des pages destinées uniquement aux spiders mais que l'internaute ne verra jamais. Un double site, en quelque sorte. Une application sur le serveur va vérifier l'adresse IP des visiteurs. Si celle-ci correspond à l'adresse connue du spider d'un moteur de recherche, c'est la page propre et belle qui lui est présentée. Si c'est une adresse IP non référencée comme appartenant à un spider, se sont les pages réelles qui sont présentées à l'internaute. Mais à la défense correspond toujours une contre-attaque et, de plus en plus, les moteurs changent intempestivement l'adresse IP de leur spider pour ne pas être reconnus. Si ce petit jeu vous intéresse, vous trouverez sur le web tout ce qu'il faut pour mettre cette technique en application.

Les résultats ci-après peuvent varier en plus ou en moins suivant l'ajout de nouveaux sites ou la suppression de certains sur les moteurs (recherches effectuées en 2004).

Conclusion :
L'essentiel étant d'être présent dans les 3 premières pages des résultats. On voit aussi que le référencement n'est pas une chose statique et qu'il évolue avec le temps. Pour cette raison, il doit être suivi tout le long de la vie du site et chaque place perdue doit être compensée par une recherche d'amélioration du référencement.

Accueil | Affiliation  | Ajouter un site | Contacter