Motore di ricerca ht://Dig Archives

ht://Dig aut Lhtdig: conclusioni

Per concludere, data la sua versatilità e la sua semplice configurazione, ht://Dig è uno dei motori di ricerca più usati per i singoli domini. Punti a favore sono: la possibilità, grazie a parser esterni, di indicizzare molti tipi di file con vari algoritmi (molto utile è quello per i sinonimi); la possibilità di rieffettuare il… Continua a leggere ht://Dig aut Lhtdig: conclusioni

ht://Dig aut Lhtdig: query

Per interrogare l’indice si utilizza il CGI htsearch, che è possibile trovare nella directory cgi-bin nel server web, come specificato nel file Config all’inizio dell’istallazione. Quindi, dopo aver modificato il file httpd.conf di Apache aggiungendo il path dell’applicazione, si possono effettuare le query all’indirizzo http://localhost/HTDIG/search.html. Selezionando un’opzione nel campo “Match” dell’interfaccia web, sono possibili le… Continua a leggere ht://Dig aut Lhtdig: query

Indicizzazione in locale

PHt://Dig non è stato progettato esplicitamente per il filesystem, tuttavia può compiere indicizzazione in locale nella stessa maniera in cui lo fa in remoto; è necessario inserire nel file htdig.conf le seguenti direttive: start_url: http://localhost/ local_urls_only: true local_urls: http://localhost/=/home/user/file/ Praticamente, quando l’opzione local_urls_only è settata a true, htdig cerca i file da scaricare nella directory… Continua a leggere Indicizzazione in locale

Indicizzazione in remoto

Prima di lanciare il crawler è necessario impostare il file di configurazione che si trova nella directory CONFIG_DIR; quello di default è htdig.conf e le direttive principali sono: #directory in cui htdig creerà i database database_dir: /usr/local/HTDIG/db/ #l’Url di partenza start_url: http://www.univaq.it #limitare il crawling a quel dominio limit_urls_to: ${start_url} #Per escludere URL contenenti queste… Continua a leggere Indicizzazione in remoto

Prerequisiti e installazione ht://Dig aut htdig

Essendo ht://Dig sviluppato sotto Unix e in C++, qualsiasi distribuzione Linux è adatta; per compilare sia i sorgenti che alcune librerie GNU, si è adottato gcc/g++ con GNU make come makefile; poi bisogna solo verificare la presenza della libreria libstdc++ che, in vecchie versioni del gcc/c++ non è inclusa. Come web server CGI engine, si… Continua a leggere Prerequisiti e installazione ht://Dig aut htdig

Motore di ricerca ht://Dig

Informazioni htdig aut ht:/Dig Lhtdig, o meglio ht://Dig [18] è un progetto di ricerca in stato avanzato, un programma in grado di indicizzare ed effettuare ricerche in siti web, adatto per un piccolo dominio o una intranet e viene distribuito secondo la GPL. ht://Dig è stato sviluppato alla San Diego University a partire dal 1995,… Continua a leggere Motore di ricerca ht://Dig