Crawlermotori arrow Indicizzazione in locale

ht://Dig aut Lhtdig: indicizzazione locale

www.aruba.it
 

PHt://Dig non è stato progettato esplicitamente per il filesystem, tuttavia può compiere indicizzazione in locale nella stessa maniera in cui lo fa in remoto; è necessario inserire nel file htdig.conf le seguenti direttive:

start_url: http://localhost/
local_urls_only: true
local_urls: http://localhost/=/home/user/file/

Praticamente, quando l’opzione local_urls_only è settata a true, htdig cerca i file da scaricare nella directory in local_urls; se non vengono trovati prosegue la ricerca nell’URL specificata in start_url.

Tuttavia, htdig segue solo i link, quindi le pagine devono essere collegate tra loro oppure è necessario passare come path un file contenete tutti i percorsi assoluti dei file da indicizzare.

We register it!
 

 
< Prec.   Pros. >
©

Internet e motori di ricerca, Crawler Module, indexer module, Ranking system, motore di ricerca sphider, prerequisiti e installazione sphider, motore di ricerca Nutch, indicizzazione locale o intranet, indicizzazione intero web, query, motore di ricerca ht://dig, prerequisiti e installazione, motore di ricerca phpdig, crawler/spider-serch engine: crawler open source, ricerca, test, tutorial, conclusioni, htdig, web, module, internet, sui.