User centric ou site centric

La quantification et la qualification de l'audience d'un site Internet nécessitent la mise en place d'un système de mesure qui soit également destiné à optimiser et améliorer votre site Internet. Ce dossier fait l'inventaire des techniques de mesures disponibles sur le marché des outils d'analyse.

Deux approches distinctes et complémentaires

On distingue deux méthodologies principales sur le marché des outils d'analyse web. La première approche dite "user-centric" privilégie l'analyse qualitative du comportement de l'internaute et se présente comme une extension des techniques de mesures développées pour les média dits de masse (télévision, presse, radio, ...) La deuxième approche dite "site-centric" se concentre quand à elle sur l'analyse quantitative du trafic généré pour un site Internet donné.

L'approche "user centric"

Comme son nom l’indique, cette approche se focalise sur l’utilisateur avec pour objectif l’identification des comportements. Souvent utilisée dans le cadre d’études comparatives, cette approche permet aussi de cerner les tendances majeures (achats en lignes, temps de connexion, sites les plus visités,…) de l’utilisation d’Internet. Dans la pratique, la mise en œuvre de cette méthode nécessite la constitution de panels d’individus représentatifs de la population étudiée. Une fois le panel constitué, les habitudes de navigations des internautes sont recueillies par l’intermédiaire d’un logiciel situé sur l’ordinateur de chaque individu. Si cette approche se révèle efficace pour les sites majeurs qui délivrent plusieurs millions de pages vues, elle affiche aussi ses limites puisque les données récoltées proviennent exclusivement de connexions à domicile. Par conséquent, le comportement des internautes à partir de leur lieu de travail reste incertain puisqu’il n’est pas pris en compte par cette méthodologie.

L’approche "site centric"

A la différence de l’approche « user centric », la démarche « site centric » se concentre sur le site Internet avec pour objectif la quantification du trafic généré sur les différentes pages du site. Pour recueillir la base statistique nécessaire à cette analyse quantitative, deux technologies sont utilisées. La première technologie consiste en l’exploitation des données consignées dans les journaux (fichiers logs) du site étudié tandis que la deuxième repose sur l’insertion de marqueurs uniques sur chacune des pages du site.

L’analyse des logs

Chaque interaction entre un ordinateur client et un site Internet est enregistrée par le serveur du site Internet au sein de journaux appelés fichiers logs. Ces interactions correspondent à des requêtes de pages, d’images ou de scripts qui peuvent être compilés puis analysés par des logiciels spécialisés. Au final, les différents responsables du site disposent d’informations quantitatives sur le volume de visites générées, la visibilité et l’accessibilité du site. Si cette technologie est relativement rapide à implanter et ne nécessite pas de modification du site, la précision et la fiabilité des informations distillées sont souvent remises en cause. En effet, les requêtes les plus fréquentes peuvent être interceptées par les proxies ou les caches des navigateurs et ne sont donc pas enregistrées par le serveur. Le résultat peut se concrétiser par une sous-évaluation du trafic généré.

L’insertion de « tags »

Pour contourner le problème de sous-évaluation résultant de l’analyse des fichiers logs, une deuxième technologie a vu le jour plus récemment. Elle consiste à insérer sur chacune des pages à analyser un marqueur invisible appelé « tag » qui peut être une image, un script ou un cookie. Lorsque la page est appelée, celle-ci déclenche l’affichage du "tag", lequel renvoie une requête vers un serveur de comptage. La page appelée est alors comptabilisée dans les statistiques du site, même si cette page provient d’un serveur Proxy ou du cache du navigateur. Cette technologie, plus lourde a mettre en place que l’analyse de fichiers logs, est actuellement la seule qui soit éligible à la certification de l’audience d’un site internet.

Les limites de l’approche « site centric »

Une limite majeure de l’approche centrée sur le site réside dans le comptage des visiteurs. En effet, en l’absence de code identifiant explicitement l’internaute sur le site, il est difficile d’estimer le nombre de visiteurs uniques. D’autre part, si la source des données provient des logs, certains « parasites » tels que les sondes ou robots des moteurs de recherche peuvent gonfler artificiellement le trafic généré.