Per concludere, data la sua versatilità e la sua semplice configurazione, ht://Dig è uno dei motori di ricerca più usati per i singoli domini. Punti a favore sono: la possibilità, grazie a parser esterni, di indicizzare molti tipi di file con vari algoritmi (molto utile è quello per i sinonimi); la possibilità di rieffettuare il… Continua a leggere ht://Dig aut Lhtdig: conclusioni
Categoria: Motore di ricerca ht://Dig
ht://Dig aut Lhtdig: query
Per interrogare l’indice si utilizza il CGI htsearch, che è possibile trovare nella directory cgi-bin nel server web, come specificato nel file Config all’inizio dell’istallazione. Quindi, dopo aver modificato il file httpd.conf di Apache aggiungendo il path dell’applicazione, si possono effettuare le query all’indirizzo http://localhost/HTDIG/search.html. Selezionando un’opzione nel campo “Match” dell’interfaccia web, sono possibili le… Continua a leggere ht://Dig aut Lhtdig: query
Indicizzazione in locale
PHt://Dig non è stato progettato esplicitamente per il filesystem, tuttavia può compiere indicizzazione in locale nella stessa maniera in cui lo fa in remoto; è necessario inserire nel file htdig.conf le seguenti direttive: start_url: http://localhost/ local_urls_only: true local_urls: http://localhost/=/home/user/file/ Praticamente, quando l’opzione local_urls_only è settata a true, htdig cerca i file da scaricare nella directory… Continua a leggere Indicizzazione in locale
Indicizzazione in remoto
Prima di lanciare il crawler è necessario impostare il file di configurazione che si trova nella directory CONFIG_DIR; quello di default è htdig.conf e le direttive principali sono: #directory in cui htdig creerà i database database_dir: /usr/local/HTDIG/db/ #l’Url di partenza start_url: http://www.univaq.it #limitare il crawling a quel dominio limit_urls_to: ${start_url} #Per escludere URL contenenti queste… Continua a leggere Indicizzazione in remoto
Prerequisiti e installazione ht://Dig aut htdig
Essendo ht://Dig sviluppato sotto Unix e in C++, qualsiasi distribuzione Linux è adatta; per compilare sia i sorgenti che alcune librerie GNU, si è adottato gcc/g++ con GNU make come makefile; poi bisogna solo verificare la presenza della libreria libstdc++ che, in vecchie versioni del gcc/c++ non è inclusa. Come web server CGI engine, si… Continua a leggere Prerequisiti e installazione ht://Dig aut htdig
Motore di ricerca ht://Dig
Informazioni htdig aut ht:/Dig Lhtdig, o meglio ht://Dig [18] è un progetto di ricerca in stato avanzato, un programma in grado di indicizzare ed effettuare ricerche in siti web, adatto per un piccolo dominio o una intranet e viene distribuito secondo la GPL. ht://Dig è stato sviluppato alla San Diego University a partire dal 1995,… Continua a leggere Motore di ricerca ht://Dig