0

Drupal et indexation dans Google Images

Drupal, « the » CMS (et CMF)

Le CMS Drupal présente bien des avantages, par sa modularité, par le grand nombre de plugins/modules dont il dispose mais surtout par la immense communauté qui l’entoure et le fait vivre depuis sa date de création en 2000 par Dries Buytaert (université d’Anvers), développeur initial du projet. Bien paramétré en ayant mis les mains dans le code des templates (comme page.tpl.php, celle qui peut faire un site a elle toute seule), il peut faire des merveilles bien qu’assez lourd parfois…). Open Source avec la combinaison PHP/MySql, il permet la construction de requêtes assez complexes avec une mise en place plutôt simple via le module Views qui est un incontournable sur tout bon site Drupal qui se respecte.


Drupal et SEO

Avec des modules comme Path Auto, Page Title et un template bien structuré sans oublier un bon maillage interne avec des modules comme Revelant Content ou Featured Content pour afficher les articles similaires à d’autres ou en relation par des termes (on parle de taxonomie chez Drupal) dans les pages d’articles (Nodes), Drupal se révèle adapté SEO, pour permettre un bon positionnement de vos pages dans les pages de résultats/SERP.


Problème d’indexation avec Google Images

Mais voilà, il y a un gros souci par défaut dans ce CMS. Je me suis rendu compte en recherchant dans Google Images avec la commande  « site:www.monsite.com  tour eiffel » qu’aucune des images de la tour eiffel présentes dans ma galerie photo sous Drupal n’apparaissait dans les résultats.

Pourtant les tags alt sont bien présents et mes balises et headings sont en place, mais pas d’images… Pas de limitation particulière dans le .htaccess du serveur Apache, mais tout simplement une ligne de trop dans le fichier robots.txt qui indique aux crawlers des moteurs de recherche ce qu’ils sont autorisés à indexer: Disallow /sites/. Or par défaut les photos des galeries sont uploadées dans un sous répertoire de ce répertoire /site/ (qui contient les templates et modules entre autres).Je vous conseille d’ajouter cette ligne a votre fichier robots.txt :Allow /sites/all/chemin de votre rep galerie. Cela reglera votre problème.
Ex:
Disallow: /sites/
Allow: /sites/default/files/images/gallery

N’oubliez pas de recopier cette ligne lors de vos prochaines mises à jour de Drupal car le fichier robots.txt sera écrasé, le plus sûr est d’utiliser le module RobotsTxt qui enregistre le contenu de ce fichier dans la base MySql et qui l’affiche via l’URL rewriting quand vous l’appelez ! Il faudra attendre plusieurs semaines après avoir modifié le fichier robots.txt à la racine de votre site afin que vos images soient indexées correctement par le crawler Googlebot-image. Ce qui est assez étonnant c’est qu’assez peu de posts sur le Web parlent de ce problème du robots.txt, et pourtant on compterait à ce jour pas loin de 500.000 sites sous Drupal. Quel gâchis pour ceux qui utilise des photos et images et souhaitent les voir indexées sur Google Images.

Vous savez maintenant pourquoi vos galeries de photos sous Drupal n’étaient pas indexées

y’avait pas de quoi paniquer!

Edité le 13/01/2011: La version 6.20 de Drupal contient le fichier robots.txt modifié.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *