Crawlermotori arrow Prerequisiti e Installazione

Prerequisiti installazione Sphider

 

www.aruba.it

I prerequisiti per l’istallazione sono:

• Apache come server web.
• MySQL per il database.

Una volta compattato il file, bisogna copiarlo nel server e attraverso il database SQL, creare un nuovo database con il nome contenuto nel file database.php, a sua volta compreso nella cartella stessa.
A questo punto costruiamo delle tabelle già contenute nel file tables.sql.
Infine, immettendo nell’Url la dicitura “localhost” seguita dal nome dello spider si può accedere alla sezione admin e quindi al pannello di amministrazione prima citato ed analizzato.

3.2.2 Query
Le interrogazioni possono essere effettuate attraverso l’interfaccia web all’URL http://localhost/sphider-1.3.1e/sphider/search.php (Fig. 8). 

I risultati delle ricerche sono strutturati in questo modo:
nella prima riga si evidenzia il titolo della notizia che collega al contenuto, questo titolo è preceduto dalla percentuale di aderenza della notizia alle chiavi di ricerca; sotto viene indicata la data di pubblicazione e nella terza riga il punteggio della notizia ottenuto per sua aderenza alle chiavi o parole indicate nel campo di ricerca; affianco vengono indicate anche le parole trovate con un numero che evidenzia quante volte esse si ripetono nel testo.

Nel campo di ricerca come detto precedentemente, è possibile inserire anche intere frasi, ma Sphider elimina le parole più corte di 3 caratteri, quindi articoli, preposizioni ecc.. Il consiglio comunque, è di utilizzare parole non più corte di 4 caratteri per ottenere risultati soddisfacenti; infatti se si ricerca "Con un programma", allora la key "un" non viene proprio analizzata perché più corta di tre caratteri, ma quelle che rimangono sono "Con" e "programma". Ebbene "con", che è comune come parola, potrebbe sovvertire i risultati attesi poiché in una notizia potrebbe essere contenuta svariate volte e farla figurare in testa alla lista, mentre quello che interessa veramente è la key "Programma".

Specifico inoltre, che la ricerca è case insensitive, quindi "ProgRaMma" è uguale a "programma".

We register it!
 

 
< Prec.   Pros. >
©

Internet e motori di ricerca, Crawler Module, indexer module, Ranking system, motore di ricerca sphider, prerequisiti e installazione sphider, motore di ricerca Nutch, indicizzazione locale o intranet, indicizzazione intero web, query, motore di ricerca ht://dig, prerequisiti e installazione, motore di ricerca phpdig, crawler/spider-serch engine: crawler open source, ricerca, test, tutorial, conclusioni, htdig, web, module, internet, sui.