Depuis Septembre 2009, j’avais un nouveau FAI qui apparaissait: « fr-ac-nielsen-france » les statistiques d’un site du boulot sur Google Analytics. Après des recherches dans mes logs apache, j’ai tracé l’IP correspondant aux visites de ce soi-disant FAI
(j’ai pu le faire car les pages visités par fr-ac-nielsen-france étaient très souvent les mêmes)
et je me suis rendu compte que ces visites ressemblaient vraiement à celles de robots (que des pages visités à quelques
secondes d’intervalles, souvent les mêmes, sans images, ni swf etc…).
Cela représentait quand même 5,92% des visites et presque 6% des pages vues certaines mois.
L’enquête commence
Assez intrigué par ces visites, j’ai laissé un message dans le groupe Analytics sur http://groups.google.com, sans vraiment avoir de réponses, mais plutôt des témoignages d’autres personnes qui étaient aussi concernées par ce problème…
Afin d’en savoir plus et de ne pas me fier à des données fausses, j’ai contacté AC Nielsen France, qui m’ont redirigé sur leur division NetRatings. Quelques semaines plus tard, j’ai une réponse:
Après enquête, je vous confirme que les statistiques que Google Analytics vous remonte sur le « FAI » « fr-ac-nielsen-france » concerne bien AdRelevance, notre solution de pige publicitaire sur internet, qui effectivement utilise un crawler balayant les sites web afin d’identifier les campagnes publicitaires. La catégorisation en FAI n’est donc pas la bonne.
Concernant les conséquences sur vos résultats d’audience, je vous confirme que côté Panel Mediametrie//NetRatings, l’impact est nul puisque nos panélistes sont naturellement tous des personnes physiques.
Je laisse éventuellement Google vous confirmer ce point: il y a un impact sur l’ensemble de vos indicateurs site centric (visiteur, pages vues, visites, temps passé,…).
Je vous conseille donc d’isoler ces statistiques et de les mettre de côté.
Eventuellement, si vous le pouvez, n’hésitez pas à appeler Google pour leur faire part de ce problème, qui concerne très certainement d’autres sites.
Conclusion: Des crawlers qui lisent le javascript. Pour connaitre l’impact de ce crawler sur vos statistiques, je vous conseille vivement de créer un « Segment Avancé ».
Filtrer les crawlers Nielsen dans Analytics
En haut à droite, lien « Toutes les visites » puis « créer un segment avanceé ».
– Ajouter une dimension: > Systèmes > Fournisseur d’accès: glisser le bloc « Fournisseur d’accès » sur la partie droite ‘Dimension ou indicateur » (en pointillés)
– Comme Condition (menu déroulant) choisir « Ne contient pas »
– Comme valeur, mettre: nielsen (les déclinaisons étant :fr-ac-nielsen-france, ac nielsen, a.c. nielsen company)
Nom du segment: Total visites réel sans crawler Nielsen. Cela vous permettra de vérifier de quelle manière manière vos chiffres ont été plus ou moins faussés à cause de ce crawler qui n’est pas filtré par défaut par Google mais comptabilisé dans les fournisseurs d’accès!
Pour les filtrer définitivement, mettez un filtre directement sur votre profil de site Analytics
Un an après les avoir contacté à ce sujet pour les informer de ce point afin qu’ils confirment et corrigent le cas échéant, toujours pas eu de nouvelles (plusieurs rappels). Pas évident de rentrer en contact avec Analytics…
Je commente cet article un peu en retard désolé, mais merci ca m’a beaucoup aidé !
J’avais énormément de trafic la nuit provenant de ce fournisseur d’accès et ca m’a énormément pollué mes stats.
Maintenant, j’en sais un peu plus !