Je dois faire une petite étude, sur les possibilités de mettre en place un "moteur de recherche plein texte", dans un intranet.
Il doit pouvoir indexer le filesystem d'une machine, et permettre de faire des recherches dans les documents (de type doc, xls, pdf, html, ...)
J'ai carte blanche, à partir du moment ou celui-ci est free ou gpl ...
Evidemment, le GPL serait un réel plus ...
peu importe le langage utilisé du moteur de recherche, mais le top serait en c#, python, java ...
connaissez vous ce genre d'outil ?
j'ai un peu regardé du côté de lucene, qui réponds exactement aux critères, cependant, il a l'air d'être assez "chaud" à mettre en oeuvre ...
connaissez vous des produits, dans le même style ou un peu plus simple ?
# ht://Dig
Posté par Ju. . Évalué à 2.
http://www.htdig.org/(...)
Et autant que je m'en souvienne pas trop compliqué à installer.
Il gere le full text pouvu que tu ais installé des outils pour exporter en texte...
http://www.htdig.org/FAQ.html#q4.8(...)
# swish-e
Posté par Yves Agostini (site web personnel) . Évalué à 2.
plus simple et plus facile à intégrer que ht://Dig
[^] # Re: swish-e
Posté par Yves Agostini (site web personnel) . Évalué à 2.
un tutorial en français
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.