Ce mercredi 16 mai 2012 à 19h se déroulera la neuvième séance montoise des Jeudis du Libre de Belgique.
Attention, du fait du congé légal de l'ascension le jeudi 17 mai, la séance se déroulera la veille !
Le sujet de cette séance : Créer un moteur de recherche avec des logiciels libres
Thématique : Traitement des données
Public : sysadmin, entreprises, étudiants, Analystes-programmeurs
L'animateur conférencier : Robert Viseur est Docteur en Sciences Appliquées, Assistant dans le service d'Économie et de Management de l'Innovation à la Faculté Polytechnique de l'Université de Mons (UMONS) et Ingénieur de recherche Senior au Centre d'Excellence en Technologie de l'Information et de la Communication (CETIC) à Charleroi. Ses domaines d'expertise sont le management de l'Innovation, le logiciel libre et les technologies d'indexation (moteurs de recherche).
Lieu de cette séance : MUNDANEUM, 76 rue de Nimy à 7000 Mons (cf. ce plan sur le site d'Openstreetmap)
La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l'entrée de la séance. Merci d'indiquer votre intention (même incertaine) en vous inscrivant via la page http://jdl-mons-2012-mai.eventbrite.com/
Cette séance sera suivie d'un verre de l'amitié offert par le Mundaneum.
Si vous êtes intéressé(e) par ce cycle mensuel, n’hésitez pas à consulter l'agenda et à vous inscrire sur la liste de diffusion afin de recevoir systématiquement les annonces.
Description : Lorsque l'on parle de moteur de recherche, les noms de Google, Bing ou Yahoo! viennent immédiatement à l'esprit. La taille de ces moteurs (plusieurs milliards de pages indexées), l'importance des infrastructures (grands centres de données) et la pertinence des résultats de recherche peuvent donner l'impression que les développements spécifiques sont devenus impossibles ou sans intérêt.
La création de moteurs de recherche spécialisés reste cependant possible, et utile pour certains usages particuliers (ex.: moteurs de recherche d'entreprise, mise en place de systèmes de veille, etc.). Pour ce faire, le développeur peut s'appuyer sur les interfaces de programmation (API) généralement mises à disposition par les moteurs de recherche commerciaux mais aussi sur les très nombreux composants et logiciels libres existants. Ces derniers couvrent la collecte des données textuelles, leur analyse, leur indexation et leur présentation.
La présentation reviendra sur les différentes étapes de création d'un moteur de recherche. Les outils libres disponibles, ainsi que leurs limites et cadres d'utilisation privilégiés, seront ensuite présentés.
Pour rappel, les Jeudis du Libre se veulent des rencontres autour de thématiques des Logiciels Libres. Les rencontres montoises se déroulent chaque troisième jeudi du mois, et sont organisées dans des locaux et en collaboration avec des Hautes Écoles et Facultés Universitaires du Pôle Hainuyer d'enseignement supérieur impliquées dans les formations d’informaticiens (UMONS, HECFH et Condorcet), et avec le concours de l’A.S.B.L. LoLiGrUB, active dans la promotion des logiciels libres.
Aller plus loin
- Jeudis du Libre (52 clics)
- Robert Viseur (26 clics)
- Formulaire inscription (16 clics)
- Mundaneum (lieu) (19 clics)
- HECFH (10 clics)
- UMONS (11 clics)
- Condorcet (11 clics)
- LoLiGrUB (14 clics)
- Cetic (12 clics)
# Ignorance
Posté par TchorT . Évalué à 1.
Il me semblait que Seeks était déjà libre, comme moteur de recherche.
[^] # Re: Ignorance
Posté par l0optr . Évalué à 1.
Si je ne me trompe seeks n'est pas un moteur de recherche mais plutôt un agrégateur de moteur de recherche.
Grosso modo seeks permet de faire une recherche sur plusieurs moteurs(google,bing,yahoo et d'autres moteurs) et rebalance les résultats à l'utilisateur avec une couche peer2peer pour définir le ranking, Si j'ai bien compris.
[^] # Re: Ignorance
Posté par Robert VISEUR (site web personnel) . Évalué à 1.
Il y a au moins Nutch et Yacy (P2P) comme moteurs complets, Seeks (P2P) et Carrots² comme métamoteurs.
# Le Lieu
Posté par dj_ (site web personnel) . Évalué à 3.
Très bon choix de lieu après l'accord de google pour numériser les documents qui y sont
Pour ceux qui ne connaissent pas, le mundaneum c'est l'équivalent de wikipédia mais en version 1900 (rassembler toute la connaissance du monde)
[^] # Re: Le Lieu
Posté par Francois Bayart (site web personnel) . Évalué à 1.
Nous avons effectivement pensé que cette conférence sera parfaite pour avoir lieu au Mundaneum :)
# info sujet de la presentation
Posté par l0optr . Évalué à 1.
Est-il possible d'obtenir plus d'info sur les sujets qui seront abordés?
La mise en ligne d'un support (slides ou autre) est-elle prévue?
[^] # Re: info sujet de la presentation
Posté par Francois Bayart (site web personnel) . Évalué à 1.
Je vais laisser le conférencier te répondre sur l'aspect contenu.
D'un point de vue logistique, les slides seront en ligne après la conférence et la conférence sera filmer (mise en ligne 1 mois après en général) sur http://www.youtube.com/loligrub
[^] # Re: info sujet de la presentation
Posté par Robert VISEUR (site web personnel) . Évalué à 1.
Bonjour,
La conférence vise les personnes intéressées par la création de moteurs de recherche mais n'étant pas des spécialistes de la question.
La présentation sera découpée en quatre parties: (1) présentation des concepts de base (en particulier, présentation des différentes composantes d'un moteur de recherche) [but: rendre la suite compréhensible par tous], (2) SGBD fulltext vs indexeur, (3) outils libres disponibles (+ explications et limitations) et (4) 1 exemple complet de création d'un moteur de recherche spécialisé sur base de composants libres.
Comme signalé par François, le diapo sera rendu disponible.
Cordialement,
RV.
[^] # Re: info sujet de la presentation
Posté par Francois Bayart (site web personnel) . Évalué à 1.
les slides sont en lignes :
http://jeudisdulibre.be/2012/05/04/mons-mercredi-16-mai-creer-un-moteur-de-recherche-avec-des-logiciels-libres/
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.