|
Analog analizza i log che sono
memorizzati normalmente in un formato standard, detto common log
format. Tale formato è quello adottato dai primi due
server Web della storia, il CERN httpd e l’NCSA
httpd. Il nostro programma fornisce un conteggio degli accessi
per ogni URL e un conteggio dei contatti per ogni per sito da cui
sono state fatte delle richieste; è possibile limitare
l’analisi ad alcuni siti, ad alcune URL e ad un intervallo di
tempo. Vediamo la specifica del formato con un esempio:
saturno.insinet.it - - [02/Oct/1995:11:00:55 +0100] \
"GET /cgi-bin/reg-new-user-auto.cgi HTTP/1.0" 200 2295
I campi sono in ordine:
Host l'host da cui proviene la richiesta
Rfc931 informazioni sull'utente fornite da identd,
"-" se non è stato possibile identificare l'utente
Username il nome utente per documenti protetti da password
"-" se nessuno (il documento non ha password)
Data/Ora data e ora dell'accesso
Richiesta l'URL esatto richiesta dal browser
Stato codice di risposta fornito dal server (200 è OK)
N. Byte il numero di byte forniti in risposta dal server
"-" se non ha senso (per esempio c'è stato un errore)
Analog può essere invocato sia da una form come CGI
che a linea di comando e produce sempre risultati in HTML. Può
quindi essere utilizzato sia per eseguire delle analisi interattive,
sia per produrre automaticamente dei report periodici.
Gli argomenti trattati in questo
articolo sono vari e comprendono:
il programma Analog in se
stesso, che pur nella sua semplicità si rivela concretamente
utile (difatti è nato come sostituito di programmi più
complessi, che fornivano una miriade di opzioni non necessarie);
una tecnica per scrivere script
utilizzabili sia come CGI che richiamati direttamente dalla
linea di comando;
le espressioni regolari del Perl,
che sono utilizzate intensamente e verranno approfondite.
|