|
Per rendere più flessibile il
programma è possibile limitare l’analisi sia per siti di
provenienza che per URL richieste: possiamo per esempio esaminare
tutte le richieste di quest’anno provenienti dall’Italia,
escludendo quelle che provengono dalla nostra rete, riferite ad una
particolare directory ed escludendo le immagini. Cioè:
analog
start=01/gen/1996 \
site=*.it
site=!*.insinet.it \
url=/jazz/*
url=!*.gif
Come si vede i parametri sono
forniti sulla linea di comando nel formato <opzione>=<parametro>.
Le opzioni che è possibile specificare sono:
file=<file> considera il file di log <file>
url=<url> considera solo le <url> specificate
url=!<url> esclude le <url> specificate
site=<site> considera solo i <site> specificati
site=!<site> esclude i <site> specificati
begin=<date> considera gli accessi avvenuti dopo <date>
end=<date> considera gli accessi avvenuti prima di <date>
Tutti i parametri sono opzionali. Se non specificato altrimenti si
considerano tutte le url da tutti i siti durante tutto il periodo
coperto dal file di log e si utilizza il file di log
/var/log/httpd/access_log.
I parametri url e site possono essere specificati più
volte. I parametri file, begin, end possono essere specificati una
volta sola. Se sono specificati più di una volta si considera
soltanto l'ultimo.
Gli argomenti <url> e <site> possono contenere i
caratteri jolly '?' e '*' che abbreviano rispettivamente un carattere
qualsiasi e una sequenza di caratteri qualsiasi. Se <url> o
<site> sono preceduti dal carattere '!' viene escluso
l'argomento, altrimenti viene incluso.
Le <date>
devono essere nel formato gg/mmm/yyyy, dove il giorno e l'anno devono
essere numerici, mentre il mese va abbreviato alle prime tre lettere
(in italiano o in inglese, maiuscolo o minuscolo).
Per rendere più flessibile le
possibilità di selezione, si specificano siti e URL
utilizzando dei “pattern”, che attribuiscono ai caratteri
* e ? un significato speciale. Questi ultimi infatti
vengono utilizzati in maniera simile al modo in cui sono specificati
i file nel mondo DOS: il ? sostituisce qualsiasi carattere
mentre il * sostituisce qualsiasi sequenza di caratteri. Il
carattere ! all’inizio di un argomento permette di
escludere quell’argomento (sito o URL) dall’analisi.
Attenzione: il punto . non ha significato particolare, è
un carattere come tutti gli altri: quindi l’analogia con il DOS
non è perfetta, l’equivalente di *.* nel nostro
caso è semplicemente *.
Per ragioni di sicurezza il
programma non accetta il parametro “file” quando è
invocato da una form: altrimenti un malintenzionato potrebbe
(teoricamente) utilizzare il programma per carpire informazioni sul
sistema: nel caso della form si può analizzare soltanto un
file fisso, quello di default (che deve essere modificato a mano nel
programma se non è /var/log/httpd/access_log). Qualora
si installasse il programma come CGI, occorre anche
decidere se si vuole consentire ad utenti esterni (e quindi eventuali
concorrenti) di analizzare i log degli accessi: se si vuole
proteggere la privacy dei log del proprio sito ma anche avere la
possibilità di analizzarli interattivamente, è
opportuno pensare a proteggere lo script con una password.
|