Alla luce dei risultati ottenuti nei test e dalle caratteristiche supportate da ognuno dei motori di ricerca studiati, è possibile trarre le conclusioni finali.
Per il filesystem, ht://Dig offre le prestazioni migliori sia per quanto riguarda il temp…
Per effettuare i test sulle query, ho scelto il dataset più grande, cioè composto dalla documentazione Php, più la documentazione del Tomcat per quanto riguarda query in locale e, i due dataset composti da www.univaq.it e www.arredamenti-casa.com …
Il primo sito indicizzato è stato quello dell’Università degli studi dell’Aquila (http://www.univaq.it); questo sito è molto complesso perché possiede frames e pagine duplicate. I risultati ottenuti sono mostrati in Tab. 3.
Crawl …
Come primo dataset ho scelto il manuale in Php, composto da 5185 file per un totale di 25,4 MB, sia HTML che immagini; i risultati ottenuti sono riassunti in Tab.1.
Crawl File Time Dim.Index %dim.index/dataset Depth HT://DIG 5174 …
Per confrontare le caratteristiche di scalabilità, efficienza e qualità delle risposte alla query, ho effettuato una serie di test su diversi tipi di dataset.
Innanzitutto ho scelto due documentazioni html di dimensioni diverse nel filesystem, misur…
Phpdig è un software di molteplici qualità che lo rendono versatile per tutti i tipi di ambienti in cui viene usato. L’istallazione, semplice e veloce, può essere eseguita con il winzard; il pannello di amministrazione ed un unico file di conf…
Le interrogazioni possono essere effettuate attraverso l’interfaccia web all’URL http://localhost/phpdig/search.php.
I risultati delle ricerche sono strutturati in questo modo:
nella prima riga si evidenzia il titolo della notizia che coll…
I prerequisiti per l’istallazione sono:
• Apache come server web.
• MySQL per il database.
Una volta scompattato il file e posto all’interno del server, si apre il file config.php e si settano username_login e password. Successi…
Per cercare le pagine da indicizzare Phpdig [19] segue i link href che gli sono mostrati dal web browser. I link possono essere in AreaMap, o semplici come window.open(),window.location() JavaScript.
Phpdig supporta redirections e non attraversa direct…
Per concludere, data la sua versatilità e la sua semplice configurazione, ht://Dig è uno dei motori di ricerca più usati per i singoli domini. Punti a favore sono: la possibilità, grazie a parser esterni, di indicizzare molti tipi di file con vari algoritmi (molto utile è quello per i sinonimi); la possibilità di rieffettuare il [...]