Il faut tout d'abord commencer par demander au serveur web de retenir plus d'informations au sujet des visiteurs du site.

Pour ce faire, avec apache, la première possibilité est d'activer le format combine pour le journal des visites du site à propos duquel nous désirons des statistiques.

En effet, par défaut, apache ne mémorise ni le navigateur utilisé par le visiteur, ni l'origine du visiteur.

La configuration relative au site ressemble alors à cela :

<virtualhost 66.99.66.99:80="">
ServerName blog.mageekbox.net
DocumentRoot /path/to/blog.mageekbox.net
CustomLog /var/log/www/blog.mageekbox.net-access.log combine
</virtualhost>

Il faut ensuite modifier la configuration d'awstats relative au site pour qu'il prenne en compte ce format :

LogFormat=1

Il est à noter qu'il est également possible de définir son propre format au niveau d'apache, totalement indépendant des formats par défaut, qu'il est également possible d'indiquer à awstats via la même directive LogFormat.

Une fois apache redémarré, nous avons donc maintenant un peu plus d'informations à propos de nos visiteurs, puisqu'awstats est maintenant capable de déterminer le type de navigateur utilisé par nos visiteurs, ainsi que leur adresse d'origine.

Cependant, il est possible de faire encore mieux, en géolocalisant nos visiteurs à partir de leur adresse IP.

Pour cela, il faut activer le plug-in geoip en ajoutant la ligne suivante dans le fichier de configuration d'awstats :

LoadPlugin="geoip GEOIP_STANDARD /usr/local/share/GeoIP/GeoIP.dat"

Cependant, ce n'est pas suffisant, car il faut également installé geoip sur le serveur.

Sous FreeBSD, cela se fait de la manière classique :

cd /usr/ports/net/p5-Geo-IP
sudo make install clean

A partir de ce moment, le pays d'origine de la connexion de nos visiteur pourra être déterminé.

Nous allons maintenant voir qu'il est possible d'affiner nos statistiques en affinant la configuration d'awstats.

Par défaut, ce dernier ne prend pas en compte les url contenant des ? sont ignorées.

Dans le cadre d'un site dynamique tel que ce blog, c'est un handicap puisque les statistiques générée dans ce cas ne contiennent pas d'informations à propos des pages visitées.

Pour résoudre ce problème, il suffit de passer à 1 la valeur du paramètre URLWithQuery dans le fichier de configuration d'awstats.

Enfin, il est possible de dépolluer nos statistiques.

Il arrive que nous ne souhaition pas prendre en compte certaines url d'un site, comme, dans le cas de ce blog, celles relatives à l'interface d'administration.

L'utilisation du paramêtre SkipFiles permet donc de les exclure.

Ainsi, l'ajout de SkipFiles="REGEX[^\/admin]" permet de ne pas prendre en compte dans les statistiques toutes les url commencant par /admin.

Enfin, awstats calcule un certain nombre de statistiques qui ne sont pas affichées par défaut au niveau de son interface web.

En conséquence, je ne saurais trop vous conseiller d'aller lire consciencieusement son fichier de configuration par défaut afin d'activer ou de désactiver dans vos propres fichiers de configuration l'affichage des statistiques qui vous intéresse, d'autant que le fichier par défaut est abondament commenté.