Bonjour,
J'ai un serveur qui héberge une 60aine de site, j'aimerais bien les indexer pour faire un moteur de recherche.
Ne connaissant qu'htdig, je l'ai installé et hop ca index.
Mais le problème c'est que c'est pas du tout adapté à des sites en PHP. Par exemple s'il indexe un forum PhpBB, il y'aura à chaque fois une variable SID qui change à chaque visite, et lui ne voit pas la différence entre ca et un page.php?go=index (ce qui est normal). De plus par exemple pour un calendrier avec des liens du type go.php?annee=2003 puis y'aura un lien vers go.php?annee=2004, 2005, ... et il ne finit jamais.
Comme solution j'ai mis une limite dans la profondeur des liens, et ca règle le problème des variables du type année, mais pas celles du type SID. J'ai exclut les forum de l'index, mais certains site utilisent des SID et ne sont pas des forums.
Donc quelqu'un connait une autre solution pour mettre en place un petit moteur de recherche ? Vos expériences ?
# Re: Alternative à HtDig
Posté par Jérôme FIX (site web personnel) . Évalué à 2.
Tu peux essayer de regarder du côté de mnogosearch ( http://mnogosearch.org/(...) ).
Et notamment la configuration de la commande ReverseAlias qui permet d'exclure les variables de type SID ou autres de l'indexation.
cf. http://mnogosearch.org/doc/msearch-indexer-configuration.html(...)
Jérôme.
[^] # Re: Alternative à HtDig
Posté par Benjamin (site web personnel) . Évalué à 1.
je n'ai plus l'url sous les yeux
...
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.