Nutch: Conclusioni

La semplice istallazione e la facilità con cui può essere configurato, pongono Nutch alla portata di tutti i tipi di utenza. Esso si è distinto subito dai concorrenti per la praticità, bontà d’uso e grande scalabilità. I suoi punti forti sono stati riscontrati nel Web, dove grazie alla funzionalità analyze può scalare in qualità, visto che sceglie a priori quali pagine dovrà scaricare e indicizzare.

Per quanto riguarda le query, non si basa sulla complessità di query booleane composte o wildcard, ma sulla semplicità, che effettivamente il web richiede, di query in AND e per frase. Altri punti a favore sono la cache e la spiegazione del punteggio ottenuto, anche queste componenti essenziali per un search engine. I punti forti per il web sono quelli deboli per il filesystem, dove la mancanza di query differenziate e i pochi formati di file supportati, non permettono ad utenti più esperti di compiere interrogazioni approfondite, per esempio su file xml.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *