Indexation google... Encore...
Par Twister le vendredi, novembre 9 2007, 08:56 - Informatique - Lien permanent

Vous allez dire que je fais une fixation sur Google ? Et bien oui, peut être, cela dit c'est une société tellement intéressante qu'il y a de quoi.
Bon, comme indiqué dans le titre, nous allons parler (un tout petit peu, c'est promis) d'indexation Google. Et non, pas d'article sur l'OS pour mobiles que sort Google, ni pour son nouveau GoogleMaps pour PDA. Bon, ok les mauvaises langues diront que j'ai quand même réussi à en parler et même à coller un lien... Et alors ? C'est juste pour calmer votre soif de savoir et que l'on puisse se concentrer sur les quelques lignes qui vont suivre quand j'aurais fini de tergiverser...
Ca y est d'ailleurs, j'ai fini...
Je voulais donc juste parler de deux ou trois options assez récentes de Google. Afin de pouvoir indéxé de manière optimale un site, Google vous permet de créer des fichiers SiteMaps. Ces fichiers sont des fichiers XML qui contiennent en fait la liste de toutes les URL de votre site. Ainsi au lieu de parcourir tout votre site à la recherche de nouvelles pages ou de pages mlises à jour il suffit au GoogleBot de lire le fichier SiteMap et de le comparer avec sa base de données afin d'aller droit au but. Cela a deux avantages : votre contenu est plus vite indéxé, et vous faites des économies de bande passante. Bref, je ne vais pas détailler ici le fonctionnement des SiteMaps, sachez juste que d'autre moteurs que Google savent les lire aussi (MSN, Yahoo) puisque le format des SiteMaps a été standardisé. Voici le site officiel du format : http://www.sitemaps.org.
Les connaisseurs vont me dire : "Hé! mais tu déconnes ce n'est pas du tout nouveau comme truc!". Certes, ce qui est nouveau c'est de pouvoir déclarer ses SitesMaps dans son robots.txt de la manière suivante :
sitemap: http://www.example.com/sitemap.xml
Avant il fallait soumettre à la main le fichier SiteMap ou l'avoir à la racine de sont site avec le nom sitemap.xml.
La deuxième chose dont je voulais parler, c'est la possibilité de marquer une page comme ayant une date d'expiration afin que Google la purge automatiquement de son index. C'est carrément pratique pour tout ce qui est publicité, ca évitera les gens de tomber sur des pages parlant de promos finies depuis 6 mois. Cette fonctionalité se repose sur une balise META que voici :
<META NAME="GOOGLEBOT" CONTENT="unavailable_after: 31-Dec-2007 23:59:59 EST">
Je précise qu'il existe d'autres META GOOGLEBOT, je vous invite à les chercher 
Voilà, c'est tout, rien de bien compliqué 
Commentaires
Complètement hors-sujet mais une interrogation travaille mon esprit ! Comment se fait-il qu'on est pas eu droit à un article sur les grèves et les fonctionnaires depuis près d'une semaine sur ce blog
!?
Parceque ca n'en vaut même pas la peine