Motore di ricerca di PHpdig

Per cercare le pagine da indicizzare Phpdig [19] segue i link href che gli sono mostrati dal web browser. I link possono essere in AreaMap, o semplici come window.open(),window.location() JavaScript.
Phpdig supporta redirections e non attraversa directory o database tables per indicizzare contenuti.

Di default, Phpdig non esce dal dominio che gli si definisce per l’indicizzazione. Varie opzioni di indicizzazione sono scelte dall’user, incluso un parametro per estendere l’indicizzazione ai sottodomini e un parametro per limitare la stessa ad una specifica directory.

Si può limitare l’indicizzazione così che il massimo dei link trovati sia ((x*y*)+1), dove x è il link e y la profondità. In alternativa si può indicizzare una sola pagina o si possono settare le opzioni per indicizzare un maggior numero di pagine.

Phpdig indicizza tutte le parole del documento e, le parole del titolo, possono avere un peso molto importante ai fini del risultato. Phpdig indicizza html e file di testo autonomamente, può inoltre indicizzare php, Ms-word, Ms-excel e Ms-powerPoint, se si istallano esterni binari sul server preposto a tale scopo.

Quando Phpdig prova a leggere un file robots.txt al server web root, considera anche meta robots tags. L’ultima modifica dell’header è memorizzata nel database per evitare indicizzazioni ridondanti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *