Webalizer
Le Webalizer est une application du GPL qui produit des pages Web de l'analyse , des notations d'accès et d'utilisation, c., un logiciel d'analyse de notation de Web . Il est l'un des outils d'administration les plus utilisés généralement de web server. Il a été lancé par le Bradford L. Les statistiques ont généralement rapporté par Webalizer incluent : coups ; visites ; referrers ; les pays des visiteurs ; et la quantité de données téléchargées. Ces statistiques peuvent être regardées graphiquement et présentées par différents délais de temps, comme par le jour, l'heure, ou le mois.
Vue d'ensemble
L'analyse de trafic de site Web est produite en groupant et en agrégeant de diverses données élémentaires capturées par le web server sous forme de fichiers de consignation tandis que le visiteur de site Web passe en revue le site Web. Certaines des limites les plus utilisées généralement d'analyse de trafic de site Web sont énumérées ci-dessous :
A (URL ) identifie uniquement la ressource demandée par le browser.
de l'utilisateur
Each soumise par le navigateur est comptée en tant qu'un frappé. Noter que des demandes de HTTP peuvent être soumises pour le contenu inexistant, dans ce cas elles seront encore comptées. Par exemple, si un des cinq dossiers d'image se référait par la page d'exemple mentionnée ci-dessus est absent, le web server comptera toujours six demandes de HTTP, mais dans ce cas-ci, cinq seront aussi réussis marqué (un dossier de HTML et quatre images) et un qu'une demande failed (l'image absente)
A est une demande de HTTP réussie d'une ressource qui constitue le contenu du site Web primaire. Des pages sont habituellement identifiées par une prolongation de dossier (par exemple .) ou par une prolongation absente, dans ce cas le sujet de la demande de HTTP est considéré un annuaire et la page de défaut pour cet annuaire est served.
Each est comptée comme file.
A est la personne réelle passant en revue le site Web. Un contenu typique de services de site Web aux visiteurs anonymes et ne peut pas associer des visiteurs à la personne réelle passant en revue le site Web. L'identification de visiteur peut être basée sur leur adresse ou un biscuit d'IP de HTTP de . L'ancienne approche est simple pour mettre en application, mais résulter en tous les visiteurs passant en revue le même site Web de derrière un mur à l'épreuve du feu compté en tant que visiteur simple. La dernière approche exige la configuration spéciale du web server (c. pour noter des biscuits de HTTP) et est plus chère de mettre en application. Noter que ni l'un ni l'autre des approches n'identifie la personne réelle passant en revue le site Web et ni l'un ni l'autre ne fournit l'exactitude 100% en déterminant que le même visiteur a visité le site Web again.
A est une série de demandes de HTTP soumises par un visiteur avec du temps maximum entre les demandes ne dépassant pas une certaine quantité configurée par le webmaster, qui est typiquement placé à 30 minutes. Par exemple, si un visiteur demandait la page A, puis en la page B de 10 minutes et puis en la page C de 40 minutes, puis ce visiteur a produit de deux visites, une quand les pages A et B ont été demandées et des autres quand la page C a été demandée.
généralement un centre serveur est la machine du visiteur courant le navigateur. Des centres serveurs sont souvent identifiés par des IP address ou des Domain Name. Ces outils d'analyse du trafic de Web qui emploient des IP address pour identifier des visiteurs emploient les centres serveurs de mots, les Domain Name et les IP address interchangeably.
User est un synonyme pour un web browser.
Afin d'illustrer la différence entre les coups, les pages et les dossiers, nous laissent considèrent un utilisateur demandant un dossier de HTML se référant à cinq images, une dont est absent. Dans ce cas-ci le web server notera six coups (c. un réussi pour le dossier de HTML lui-même et quatre pour des images avec succès recherchées et un pour l'image absente), cinq dossiers (c. cinq demandes réussies de HTML) et une page (c.
Types de fichier de consignation
Le Webalizer analyse des fichiers de consignation de web server, extrayant des articles tels que les IP address du client, les chemins d'URL, les durées de la transformation, les agents d'utilisateur, les referrers, etc. et les groupant afin de produire des rapports de HTML.
Le trafic de HTTP de notation de web server using différents formats de fichier. La plupart des formats de fichier populaires sont le CLF , le format fait sur commande de notation d'Apache et format de fichier de notation prolongé par W3C. CLF est le format moins instructif de notation et devrait être employé seulement quand il n'y a aucune autre option. Un exemple d'une ligne de notation de CLF est montré ci-dessous.20 - - " -0500 ; OBTENIR HTTP 1.1" ; 200 1774
Le format fait sur commande de notation d'Apache peut être adapté aux besoins du client pour noter la plupart des paramètres de HTTP, y compris la durée de la transformation de demande et la taille de la demande elle-même. Le format d'une notation faite sur commande est commandé par la ligne de format. Une configuration typique de format de notation d'Apache est montrée ci-dessous.
" de
LogFormat ; %a %l \ " ; %u \ " ; %t %m \ " ; %U \ " ; \ " ; %q \ " ; %p %>s %b %D \ " ; % {Referer} d'I \ " ; \ " ; % {Utilisateur-Agent} d'I \ " ; " ; my_custom_log Notations de CustomLog/access_log my_custom_log Le web server de services d'information de l'Internet (IIS) de Microsoft note le trafic de HTTP dans le format de fichier de notation prolongé par W3C. De même au format fait sur commande de notation d'Apache, des notations d'IIS peuvent être configurées pour capturer des paramètres prolongés tels que la durée de la transformation de demande. Des notations prolongées par W3C peuvent être identifiées par la présence d'une ou plusieurs lignes de format, telles que celle montrée ci-dessous.
#Fields : la Cs-uri-tige date-heure de Cs-méthode de s-ip Cs-uri-questionnent les Cs-bytes time-takende Sc-bytes de Sc-statut de Cs de Cs de Cs-username CIP de sport (Utilisateur-Agent) (Referer)
La version originale du Webalizer peut traiter des fichiers de consignation de CLF, comme des fichiers de consignation de la procuration de HTTP de produits par des serveurs du calmar . D'autres formats de fichier de notation sont habituellement convertis en CLF afin de pour être analysés. Certaines des fourchettes ont énuméré dans les liens externes que la section ci-dessous sont capable de traiter IIS et fichiers de consignation d'Apache sans devoir les convertir en CLF d'abord.
Ligne de commande
Le Webalizer est une ligne de commande application et est lancé du message de sollicitation de coquille d'OS . Une commande typique est montrée ci-dessous.
le
webalizer - p - le clf de F - n en.org - o rapporte les fichiers de consignation/access_log
Cette commande demande au Webalizer d'analyser l'access_log de fichier de consignation, courir en mode par accroissement (- p), interpréter la notation pendant qu'un fichier de consignation de CLF (- F), emploient le Domain Name en.org pour des liens de rapport (- n) et produisent le sous-répertoire de rendement de l'annuaire courant.
Employer - l'option de h pour voir la liste complète de ligne de commande options.
Configuration
Sans compter que la ligne de commande options, le Webalizer peut être configuré par des paramètres d'un fichier de configuration. Par défaut, le Webalizer lit le dossier webalizer.conf et interprète chaque ligne comme instruction de traitement. Alternativement, un dossier personnalisé par l'utilisateur peut être fourni using - l'option de c.
Par exemple, si le webmaster voudrait ignorer toutes les demandes faites à partir d'un groupe particulier de centres serveurs, lui ou elle peut employer le paramètre d'IgnoreSite pour jeter tous les disques de notation avec l'IP address assortissant le modèle spécifique :
IgnoreSite 192.*
Il y a plus de cent paramètres disponibles de configuration, qui font au Webalizer une demande haut-configurable d'analyse de trafic de Web. Pour une liste complète de configuration les paramètres satisfont se rapportent au dossier de README embarqué avec chaque source ou distribution binaire.
Rapports
Par défaut, le Webalizer produit deux genres de rapports - un compte rendu succinct annuel et un rapport mensuel détaillé, un pour chaque mois analysé.
Le compte rendu succinct annuel fournit une telle informations comme le nombre de coups, de dossier et de demandes de page, centres serveurs et visites, aussi bien que des moyennes quotidiennes de ces compteurs pour chaque mois. Le rapport est accompagné d'un graphique récapitulatif annuel.
Chacun des rapports mensuels est produit pendant qu'un HTML page simple contenant un compte rendu succinct mensuel (énumérant le nombre global de coups, demandes de dossier et de page, visites, centres serveurs, etc.), un rapport quotidien (groupant ces compteurs pour chacun des jours du mois), un rapport horaire agrégé (compteurs de groupement pour la même heure de chaque jour ensemble), un rapport d'URL (groupant des informations collectées par l'URL), un rapport de centre serveur (par IP address), l'entrée de site Web et les rapports d'URL de sortie (en montrant plus le terrain communal d'abord et visiter pour la dernière fois les URL), un rapport de referrer (groupant les tiers URL de référence menant au site Web analysé), un rapport de corde de recherche (zones déterminant un groupement par des termes de recherche utilisés dans des moteurs de recherche tels que Google), un rapport d'agent d'utilisateur (groupant par le type de navigateur) et un rapport de pays (groupant par le pays d'origine de l'accueil).
Chacun des rapports standard de HTML décrits au-dessus des entrées supérieures de listes seulement pour chaque article (par exemple URL de principal 20). Le nombre de lignes réel pour chacun des rapports est commandé par configuration. Le Webalizer peut également être configuré pour produire un rapport séparé pour chacun des articles, qui énuméreront chaque article simple, tel que tous les visiteurs de site Web, tous les URL demandés, etc.
En plus des rapports de HTML, le Webalizer peut être configuré pour produire les dossiers virgule-délimités de décharge, qui énumèrent toutes les données de rapport dans un dossier de plain-text. Des dossiers de décharge peuvent être importés vers des demandes ou des bases de données de bilan d'analyse approfondie.
Internationalisation
Les rapports de HTML peuvent être des rapports produits dans plus de 30 langues, y compris le catalan, Croate, Tchèque, le danois, Néerlandais, les anglais, estonien, finlandais, français, galicien, allemand, grec, hongrois, islandais, indonésien, italien, japonais, coréen, letton, malais, norvégien, polonais, portugais, portugais (le Brésil), Roumain, Russe, Serbian, Chinois simplifié, slovaque, slovène, espagnol, suédois, turc, Ukrainien.
Pour produire des rapports dans une langue alternative exige une binaire séparée de webalizer compilée spécifiquement pour cette langue.
Critique
Le développement s'est arrêté en 2002 (voir ci-dessous pour des avancements) Les statistiques produites ne différencient pas entre les visiteurs et les robots humains. En conséquence toute la métrique rapportée est plus haute que ceux dues seuls aux gens.
Les coups rapportés sont trop hauts pour des directeurs de téléchargement avec des téléchargements segmentés, chaque " 206 ; Content" partiel ; est rapporté en tant qu'un frappé
Aucune analyse de corde de question, des sites Web produits dynamiques ne peut être énumérée séparément (par exemple les pages de PHP avec des arguments)
.
| Random links: | Marie, Arkansas | École d'Université de Stanford des sciences humaines et des sciences | Casier Hamud d'Ali de Zanzibar | Autoroute urbaine de Tōmei | Edwin Bryant | Webalizer |