Directory - Ultimi Aggiunti
|
|
|

|
Crawlermotori Prerequisiti e Installazione
|
|
Prerequisiti installazione Sphider
I prerequisiti per l’istallazione sono: • Apache come server web. • MySQL per il database. Una volta compattato il file, bisogna copiarlo nel server e attraverso il database SQL, creare un nuovo database con il nome contenuto nel file database.php, a sua volta compreso nella cartella stessa. A questo punto costruiamo delle tabelle già contenute nel file tables.sql. Infine, immettendo nell’Url la dicitura “localhost” seguita dal nome dello spider si può accedere alla sezione admin e quindi al pannello di amministrazione prima citato ed analizzato. 3.2.2 Query Le interrogazioni possono essere effettuate attraverso l’interfaccia web all’URL http://localhost/sphider-1.3.1e/sphider/search.php (Fig. 8). I risultati delle ricerche sono strutturati in questo modo: nella prima riga si evidenzia il titolo della notizia che collega al contenuto, questo titolo è preceduto dalla percentuale di aderenza della notizia alle chiavi di ricerca; sotto viene indicata la data di pubblicazione e nella terza riga il punteggio della notizia ottenuto per sua aderenza alle chiavi o parole indicate nel campo di ricerca; affianco vengono indicate anche le parole trovate con un numero che evidenzia quante volte esse si ripetono nel testo. Nel campo di ricerca come detto precedentemente, è possibile inserire anche intere frasi, ma Sphider elimina le parole più corte di 3 caratteri, quindi articoli, preposizioni ecc.. Il consiglio comunque, è di utilizzare parole non più corte di 4 caratteri per ottenere risultati soddisfacenti; infatti se si ricerca "Con un programma", allora la key "un" non viene proprio analizzata perché più corta di tre caratteri, ma quelle che rimangono sono "Con" e "programma". Ebbene "con", che è comune come parola, potrebbe sovvertire i risultati attesi poiché in una notizia potrebbe essere contenuta svariate volte e farla figurare in testa alla lista, mentre quello che interessa veramente è la key "Programma". Specifico inoltre, che la ricerca è case insensitive, quindi "ProgRaMma" è uguale a "programma".
|
|