Jeudis du Libre à Mons (Belgique) : Créer un moteur de recherche avec des logiciels libres

Posté par  (site web personnel) . Édité par tuiu pol, Nÿco et claudex. Modéré par claudex. Licence CC By‑SA.
5
7
mai
2012
Communauté

Ce mercredi 16 mai 2012 à 19h se déroulera la neuvième séance montoise des Jeudis du Libre de Belgique.

Attention, du fait du congé légal de l'ascension le jeudi 17 mai, la séance se déroulera la veille !

Le sujet de cette séance : Créer un moteur de recherche avec des logiciels libres
Thématique : Traitement des données
Public : sysadmin, entreprises, étudiants, Analystes-programmeurs

L'animateur conférencier : Robert Viseur est Docteur en Sciences Appliquées, Assistant dans le service d'Économie et de Management de l'Innovation à la Faculté Polytechnique de l'Université de Mons (UMONS) et Ingénieur de recherche Senior au Centre d'Excellence en Technologie de l'Information et de la Communication (CETIC) à Charleroi. Ses domaines d'expertise sont le management de l'Innovation, le logiciel libre et les technologies d'indexation (moteurs de recherche).

Lieu de cette séance : MUNDANEUM, 76 rue de Nimy à 7000 Mons (cf. ce plan sur le site d'Openstreetmap)

La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l'entrée de la séance. Merci d'indiquer votre intention (même incertaine) en vous inscrivant via la page http://jdl-mons-2012-mai.eventbrite.com/

Cette séance sera suivie d'un verre de l'amitié offert par le Mundaneum.

Si vous êtes intéressé(e) par ce cycle mensuel, n’hésitez pas à consulter l'agenda et à vous inscrire sur la liste de diffusion afin de recevoir systématiquement les annonces.

Description : Lorsque l'on parle de moteur de recherche, les noms de Google, Bing ou Yahoo! viennent immédiatement à l'esprit. La taille de ces moteurs (plusieurs milliards de pages indexées), l'importance des infrastructures (grands centres de données) et la pertinence des résultats de recherche peuvent donner l'impression que les développements spécifiques sont devenus impossibles ou sans intérêt.

La création de moteurs de recherche spécialisés reste cependant possible, et utile pour certains usages particuliers (ex.: moteurs de recherche d'entreprise, mise en place de systèmes de veille, etc.). Pour ce faire, le développeur peut s'appuyer sur les interfaces de programmation (API) généralement mises à disposition par les moteurs de recherche commerciaux mais aussi sur les très nombreux composants et logiciels libres existants. Ces derniers couvrent la collecte des données textuelles, leur analyse, leur indexation et leur présentation.

La présentation reviendra sur les différentes étapes de création d'un moteur de recherche. Les outils libres disponibles, ainsi que leurs limites et cadres d'utilisation privilégiés, seront ensuite présentés.

Pour rappel, les Jeudis du Libre se veulent des rencontres autour de thématiques des Logiciels Libres. Les rencontres montoises se déroulent chaque troisième jeudi du mois, et sont organisées dans des locaux et en collaboration avec des Hautes Écoles et Facultés Universitaires du Pôle Hainuyer d'enseignement supérieur impliquées dans les formations d’informaticiens (UMONS, HECFH et Condorcet), et avec le concours de l’A.S.B.L. LoLiGrUB, active dans la promotion des logiciels libres.

Aller plus loin

  • # Ignorance

    Posté par  . Évalué à 1.

    Il me semblait que Seeks était déjà libre, comme moteur de recherche.

    • [^] # Re: Ignorance

      Posté par  . Évalué à 1.

      Si je ne me trompe seeks n'est pas un moteur de recherche mais plutôt un agrégateur de moteur de recherche.

      Grosso modo seeks permet de faire une recherche sur plusieurs moteurs(google,bing,yahoo et d'autres moteurs) et rebalance les résultats à l'utilisateur avec une couche peer2peer pour définir le ranking, Si j'ai bien compris.

    • [^] # Re: Ignorance

      Posté par  (site web personnel) . Évalué à 1.

      Il y a au moins Nutch et Yacy (P2P) comme moteurs complets, Seeks (P2P) et Carrots² comme métamoteurs.

  • # Le Lieu

    Posté par  (site web personnel) . Évalué à 3.

    Très bon choix de lieu après l'accord de google pour numériser les documents qui y sont

    Pour ceux qui ne connaissent pas, le mundaneum c'est l'équivalent de wikipédia mais en version 1900 (rassembler toute la connaissance du monde)

  • # info sujet de la presentation

    Posté par  . Évalué à 1.

    Est-il possible d'obtenir plus d'info sur les sujets qui seront abordés?
    La mise en ligne d'un support (slides ou autre) est-elle prévue?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.