Sortie de Datafari 5.3, moteur de recherche open source pour entreprise

Posté par  . Édité par Ysabeau 🧶, Benoît Sibaud et Pierre Jarillon. Modéré par Benoît Sibaud. Licence CC By‑SA.
19
5
oct.
2022
Base de données

Nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.3. Pas mal de changements depuis la version 5.0 sur laquelle nous avions communiqué, on en fait la liste un peu plus bas.

Pour rappel, Datafari est une solution de recherche pour entreprise, sous licence Apache v2. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. On parle également de fédération des connaissances et des savoirs au sein d’une organisation. Pour cette dépêche, on se concentre sur la version libre et open source (mais il y a aussi d’autres nouveautés sur la version entreprise propriétaire).

Amazon OpenSearch - fruit d'une rivalité avec Elastic ?

Posté par  . Édité par palm123, Benoît Sibaud, Arkem, Xavier Teyssier, Pierre Jarillon et Ysabeau 🧶. Modéré par Xavier Teyssier. Licence CC By‑SA.
21
18
avr.
2021
Base de données

Pour faire écho à Elastic, qui a changé la licence de ses produits Elasticsearch (moteur de recherche) et Kibana (visualisation de données), Amazon vient d’annoncer il y a peu la sortie de son produit OpenSearch en open-source, un fork de ces deux produits.

Sortie de Datafari 5.0, moteur de recherche open source pour entreprise

Posté par  . Édité par Nils Ratusznik et Ysabeau 🧶. Modéré par claudex. Licence CC By‑SA.
30
14
avr.
2021
Base de données

Un peu comme pour la dernière news, nous avons oublié de parler de la version 4.4, mais nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.0

Changement majeur donc, synonyme de mise à jour majeure des composants utilisés.

Pour rappel, Datafari est une solution de recherche pour entreprise. Ça veut dire qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. Linuxfr oblige, le focus dans cette dépêche sera sur la version libre (mais on a plein d’autres nouveautés aussi sur la version entreprise propriétaire)

Écran de recherche

Illico Editor : nouveautés depuis 2019

Posté par  . Édité par orfenor, theojouedubanjo et Benoît Sibaud. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
34
18
jan.
2021
Base de données

Pour faire court, Illico Editor est un couteau suisse de la qualification de données qui simplifie les opérations de préparation de données : formatage, pivot, croisement, comparaison avec d’autres jeux de données. Il s’utilise à travers une interface web, et n’a pas besoin de serveur.

explorer les données avec Illico

Pour l’installer on se contente de décompresser une archive et d’ouvrir le fichier HTML. L’application est écrite en Javascript et distribuée sous licence GPL. Je présente ici en résumé les nouveautés depuis la précédente dépêche en 2019. J’en profite pour vous souhaiter une excellente année 2021 !

Sortie de MongoPassion

Posté par  . Édité par Ysabeau 🧶 et Davy Defaud. Modéré par Davy Defaud. Licence CC By‑SA.
Étiquettes :
24
26
nov.
2020
Base de données

Après plus de trois mois de développement, une équipe de stagiaires autogérée du 24ème a mis au point une application de gestion de bases de données MongoDB. L’objectif ? Créer un outil corrigeant certains défauts des outils libres actuels tout en conservant une interface ergonomique et agréable.

MongoPassion est un outil libre sous licence AGPL 3.0, développé en PHP, entièrement gratuit et utilisable par tous les utilisateurs et les utilisatrices de MongoDB.

Requêtes et jointures avec pgModeler (PostgreSQL)

Posté par  . Édité par BAud, Davy Defaud, Ysabeau 🧶, Benoît Sibaud, claudex et ZeroHeure. Modéré par claudex. Licence CC By‑SA.
64
29
jan.
2020
Base de données

Bon, voilà, j’ai développé ce greffon pour pgModeler (C++/Qt), et j’ai envie de le partager dans une petite dépêche.

Mes motivations principales étaient de pouvoir effectuer des requêtes dans mon logiciel de modélisation préféré, bien entendu, et le fait que les logiciels de modélisation que je connais ne prennent pas en charge les jointures existantes ou automatiques.

Votre client SQL est cool ? Mais est‑il cool à ce point ?! :)

Rapide présentation de pgModeler

pgModeler est un logiciel de modélisation de base de données. Bien que plutôt généraliste — si l’on s’en tient à un modèle logique des données — il est spécialisé PostgreSQL. Il permet entre autres de :

  • construire par interface graphique un modèle de base de données (tables, schémas, rôles…), mais bien plus ; en fait, il propose toutes les fonctionnalités offertes par PostgreSQL, allant jusqu’aux extensions PostGIS ;
  • créer une base de données à partir d’un modèle : passer de la représentation à l’implémentation ;
  • à l’inverse, créer un modèle à partir d’une base de données ;
  • comparer une instance PostgreSQL avec un modèle et produire — voire réintégrer — les différences entre schémas ;
  • administrer sa base, avec un module riche, mais qui n’égalera sans doute pas pgAdmin ;
  • produire un dictionnaire des données.

Des discussions sont en cours pour rendre pgModeler nativement compatible avec les autres systèmes de gestion de bases de données relationnelles (SGBDR) grâce à l’excellent extracto‑chargeur (ETL) pgLoader.

Appel à contributions de la Fondation MariaDB auprès des universités

Posté par  . Édité par Davy Defaud, Ysabeau 🧶 et ZeroHeure. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
22
5
nov.
2019
Base de données

La Fondation MariaDB lance un appel à contributions auprès des enseignants et de la communauté afin de contribuer à un curriculum de formation théorique et pratique sur les bases de données, en s’appuyant tout ou partie sur MariaDB. Kaj Arnö, président de la Fondation MariaDB, viendra présenter l’initiative à Paris le 12 novembre à 16 h au Bistro du Canal (75010), juste avant l’événement organisé par le Fonds de Dotation du Libre et le CNLL à Cap Digital.

L’objectif de cet enseignement est de s’attaquer à la pénurie de compétences avancées sur les bases de données et d’améliorer la pédagogie sur les aspects algorithmiques (caches, structures des index, prédiction de jointure, tables de hachage sans verrou, etc.) qu’il faut aujourd’hui environ dix ans à acquérir. Kaj Arnö présentera également la feuille de route de MariaDB (10.5).

PostgreSQL 11.0

Posté par  . Édité par Snark, ZeroHeure, Davy Defaud, BAud, Julien Jorge, palm123, Nils Ratusznik et NeoX. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
64
22
oct.
2018
Base de données

PostgreSQL est un système de gestion de base de données relationnelle. La version 11 est sortie ce 18 octobre 2018.

Logo PostgreSQL

Les principales nouveautés, détaillées en seconde partie de la dépêche, se sont concentrées sur la gestion des bases ayant un très gros volume de données.

OpenDBViewer 1.1.0

Posté par  (site web personnel) . Édité par bubar🦥, Xavier Teyssier, Davy Defaud et patrick_g. Modéré par patrick_g. Licence CC By‑SA.
53
29
août
2018
Base de données

Il y a presque un an, une dépêche annonçait le logiciel OpenDBViewer, sponsorisé par l’entreprise Jet1oeil et supervisé par moi‐même.

Il s’agit, comme son nom le suggère, d’un petit logiciel très léger écrit en C++/Qt pour lire et modifier les bases de données SQLite, MySQL et PostgreSQL. Le logiciel est sous licence GPL v3.

Avec la venue de stagiaires dans l’entreprise, nous avons pu développer de nouvelles fonctionnalités durant l’année afin d’encore améliorer son ergonomie.

Libération de FoundationDB

Posté par  (site web personnel) . Édité par Davy Defaud et Pierre Jarillon. Modéré par Nÿco. Licence CC By‑SA.
Étiquettes :
27
25
avr.
2018
Base de données

FoundationDB, une base de données distribuée adaptée à de grands volumes de données, a été libérée. Apple avait racheté la société FoundationDB, éditrice de la solution de base de données du même nom, il y a trois ans. Avant le rachat, une version gratuite mais non libre était disponible. Depuis, certaines personnes regrettaient qu’une base de données de cette qualité ne soit plus disponible. Apple a fait le choix tout récemment de publier FoundationDB sous une licence libre (licence Apache 2.0) et d’encourager le développement d’un écosystème autour de celle‐ci.

Logo de FoundationDB

Elastic inclura X-Pack dans sa distribution

Posté par  . Édité par ZeroHeure, Davy Defaud et Pierre Jarillon. Modéré par Pierre Jarillon. Licence CC By‑SA.
36
7
mar.
2018
Base de données

Dans un article de blog, en anglais, Shay Banon, le créateur de ElasticSearch, annonce qu’il va « ouvrir » le code de X-Pack, la suite d’extensions propriétaires de l’ensemble de produit Elastic. Mais cette ouverture n’en est pas une au sens où on aurait aimé l’entendre !

Interview de Dimitri Fontaine, contributeur majeur à PostgreSQL

Posté par  . Édité par ZeroHeure, Davy Defaud, Benoît Sibaud, Nils Ratusznik et palm123. Modéré par ZeroHeure. Licence CC By‑SA.
56
25
fév.
2018
Base de données

Contributeur de longue date au projet PostgreSQL, Dimitri Fontaine a publié il y a quelques mois un ouvrage consacré au développement d’applications et au « SGBD libre de référence » : Mastering PostgreSQL in Application Development. On s’est dit que cela pourrait être une bonne occasion pour avoir sa vision sur l’évolution de PostgreSQL et des rapports entre développeurs et bases de données.

Sortie de Bokeh 7.10

Posté par  (site web personnel) . Édité par Davy Defaud, Paul POULAIN, Xavier Teyssier et claudex. Modéré par Pierre Jarillon. Licence CC By‑SA.
Étiquettes :
17
13
sept.
2017
Base de données

Bokeh est un portail documentaire libre (AGPL v3) initialement destiné aux réseaux de lecture publique. Il est utilisé en production par plus de 1 500 médiathèques. Son utilisation s’étend aujourd’hui aux bibliothèques privées ainsi qu’aux sites qui ne nécessitent qu’une gestion de contenu (CMS) sans aucun lien avec un SIGB.

Logo de Bokeh

Cette version comporte entre autres :

  • une nouvelle gestion des outils d’administration dans l’interface publique (boîte à outils, gestion des menus, des boîtes, des fenêtres surgissantes) ;
  • un moteur de recherche dans le gestionnaire des articles ;
  • des fonctionnalités personnalisables dans l’en‐tête des résultats ;
  • le versionnage des articles et des paramétrages des boîtes, afin de pouvoir les restaurer individuellement ;
  • de nouvelles fonctionnalités pour les Bokeh en lien avec le SIGB Nanook (mise a jour des codifications, préinscription en ligne, authentification par courriel) ;
  • des connecteurs à de nouvelles ressources numériques ou des améliorations (La souris qui raconte, Le Kiosk, BiblioonDemand, Capturator) ;
  • le partage par courriel d’une liste de résultats.

La suite de la dépêche détaille quelques‐unes de ces nouveautés.

OpenDBViewer 1.0.1, lecteur de base de données léger SQLite & MySQL

Posté par  (site web personnel) . Édité par Davy Defaud, ZeroHeure, bubar🦥, Pierre Jarillon et palm123. Modéré par claudex. Licence CC By‑SA.
Étiquettes :
27
12
sept.
2017
Base de données

OpenDBViewer est un petit logiciel qui permet dans une interface très simple de se connecter à une base de données SQLite ou MySQL.

Je l’avais d’abord conçu en Python pour mes besoins personnels et professionnels. Ce logiciel a été ensuite converti en C++ avec Qt. Bien qu’il soit opérationnel, beaucoup de choses pourraient l’améliorer. Pour cela, les contributions des utilisateurs et des développeurs sont chaleureusement espérées.

Au revoir Open Food Facts et Open Beauty Facts, bienvenue à Open Pet Food Facts ! — 31 mars 2017

Posté par  . Édité par Davy Defaud, Benoît Sibaud, Nils Ratusznik et palm123. Modéré par Benoît Sibaud. Licence CC By‑SA.
11
1
avr.
2017
Base de données

Dans la grande tradition de mettre la technologie à la disposition de nos animaux de compagnie et à leurs propriétaires, l’équipe de bénévoles derrière Open Food Facts et Open Beauty Facts est fière de dévoiler une solution au problème grandissant du surpoids chez les animaux de compagnie.

Open Pet Food Facts
Voici Open Pet Food Facts, la base de données alimentaires pour animaux domestiques.

Sortie de Bokeh 7.8

Posté par  (site web personnel) . Édité par Davy Defaud, Nÿco, ZeroHeure et Nils Ratusznik. Modéré par claudex. Licence CC By‑SA.
26
31
jan.
2017
Base de données

Bokeh, disponible maintenant en version 7.8, est un portail documentaire libre (AGPL 3) destiné aux médiathèques publiques, etc., mais pas seulement !

Logo de Bokeh

Il permet d’agréger en un point d’entrée unique leurs fonds physiques et numériques, ainsi que des catalogues numériques externes. Les utilisateurs peuvent consulter des documents, en réserver, gérer leurs prêts…

SPARQL, le SQL du Web, et Linked Data Fragment : le point sur le requêtage du Web

Posté par  . Édité par Davy Defaud, bubar🦥, palm123, Benoît Sibaud et ZeroHeure. Modéré par Nils Ratusznik. Licence CC By‑SA.
Étiquettes :
49
1
jan.
2017
Base de données

« Chère pêche »,

En ce début d'année, il ne me semble pas inutile de faire le pont entre la rétrospective et la perspective, afin de conjuguer l’avenir du Web au présent. :-)

Le but de cette dépêche est de faire un tour d’horizon de technologies permettant de faire des requêtes sur des données structurées : le Web sémantique. Comment il a évolué en dix ou quinze ans et ce qu’il permet de faire. Après une introduction contextuelle et historique, il sera question de Sparql et de linked data fragments, ainsi que de leurs usages en pratique chez Wikimedia Foundation.

Accrochez‐vous à votre fauteuil, il va être question de niveaux d’abstractions, d’enrichissement croisé de données, de manipulation de tables, de la pertinence du choix de RDF par rapport à SQL, des outils utilisés par les contributeurs Wikimedia mis au point par les développeurs du projet et, enfin, des limites actuelles et d’un avenir possible.

Lancement de GapMea logiciel de modélisation de données

Posté par  (site web personnel) . Édité par Davy Defaud, Anonyme, Benoît Sibaud, ZeroHeure, palm123 et bubar🦥. Modéré par bubar🦥. Licence CC By‑SA.
39
30
déc.
2016
Base de données

GapMea est un outil de conception de bases de données (code sous licence GPL v3+ et documentation sous GFDL v1.3+).

GapMea est un outil graphique de modélisation des données écrit en C++ à l’aide de la bibliothèque Qt. Il permet de formaliser des schémas recueillant et structurant les informations nécessaires à un domaine de gestion. Le schéma obtenu est enregistré dans un fichier texte au format XML. Le logiciel permet la génération du code SQL nécessaire à la création des tables de la base de données qui vont accueillir les informations.

Ancestris v0.9

Posté par  . Édité par bubar🦥, Davy Defaud, Benoît Sibaud et ZeroHeure. Modéré par Benoît Sibaud. Licence CC By‑SA.
26
28
déc.
2016
Base de données

Ancestris est un logiciel de généalogie libre. Ancestris est gratuit et libre, et il respecte strictement la spécification GEDCOM. Il est disponible pour GNU/Linux, *BSD, Solaris, Mac OS X et Windows, est écrit en langage Java (en tant que projet Netbeans 8) et est distribué selon les termes de la GPL v2.

Le projet vient de sortir, la veille de Noël 2016, la nouvelle version stable, la 0.9. Des améliorations et des nouveautés sont au menu. Ces améliorations et nouveautés sont les conséquences directes des demandes et souhaits des utilisateurs au travers de la liste de discussion.

Ancestris   Ancestris

CouchDB passe la seconde vitesse

Posté par  (site web personnel) . Édité par Davy Defaud, Xavier Teyssier et Benoît Sibaud. Modéré par Xavier Teyssier. Licence CC By‑SA.
Étiquettes :
49
20
sept.
2016
Base de données

CouchDB est une base de données de la famille NoSQL. C’est même l’une des plus anciennes, sortie en 2005. Elle est ensuite devenue un projet Apache en 2008. Elle a pris du retard sur ses concurrents sur de nombreux aspects, mais sa grande force, la réplication entre instances primaires, reste inégalée. Pouchdb, un portage de CouchDB en JavaScript capable de tourner dans les navigateurs, est compatible avec le protocole de réplication de CouchDB et la combinaison des deux est très intéressante pour développer des applications Web dites « progressives » (PWA), capables de travailler sans connexion Internet. Il existe d’autres implémentations compatibles avec ce protocole de réplication, dont Couchbase lite pour mobile.

La version 2.0 de CouchDB est attendue depuis plusieurs années et a pris beaucoup de retard. Elle vient enfin de sortir avec de grandes nouveautés, dont la prise en charge du clustering, un nouveau moteur de « requêtage » et une interface d’administration plus moderne.

Logo de CouchDB

Sortie de la version 7.6 de Bokeh

Posté par  . Édité par Benoît Sibaud, patbator, dorothy_rainbow, Paul POULAIN et palm123. Modéré par patrick_g. Licence CC By‑SA.
30
30
août
2016
Base de données

Bokeh est un portail documentaire libre et communautaire sous licence AGPLv3.
Il permet aux bibliothèques et médiathèques de tous types, isolées ou en réseau, avec un ou plusieurs systèmes de gestion de bibliothèque d'agréger en un point d'entrée unique:

  • leurs fonds physiques (livres, DVD, journaux…),
  • leurs fonds numériques (fonds patrimonial numérisé, par exemple)
  • des catalogues numériques externes (Arte VOD, Jamendo, Numerique Premium…).

Logo

Le moteur d'indexation et de recherche intégrée offre une interface unifiée aux utilisateurs pour qu'ils puissent consulter ce fonds, rechercher des documents précis ou bien élargir sur des ressources susceptibles de les intéresser.

Les abonnés aux médiathèques peuvent réserver des documents ou gérer leurs prêts entre autres. CMS et gestion de lettres d'information permettent aux médiathécaires de publier la programmation événementielle du réseau, d'enrichir et mettre en avant leurs fonds.

PostgreSQL et la streaming replication (Belgique, Mons, 19 mai 2016)

Posté par  (site web personnel) . Édité par Nÿco, Benoît Sibaud et ZeroHeure. Modéré par Ontologia. Licence CC By‑SA.
Étiquettes :
14
13
mai
2016
Base de données

Ce jeudi 19 mai 2016 à 19h se déroulera la 49e séance montoise des Jeudis du Libre de Belgique.

Le sujet de cette séance : PostgreSQL et la streaming replication

Thématique : Base de données|sysadmin|communauté

Public : DBA|sysadmin|entreprises|étudiants

L’animateur conférencier : Stefan Fercot

Lieu de cette séance : HEPH Condorcet, Chemin du Champ de Mars, 15 – 7000 Mons – Auditoire Bloc E – situé au fond du parking (cf. ce plan sur le site d’Openstreetmap ; ATTENTION, l’entrée est peu visible de la voie principale, elle se trouve dans l’angle formé par un très grand parking. le bâtiment est différent de celui utilisé lors des autres séances).

La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l’entrée de la séance. Merci d’indiquer votre intention en vous inscrivant via la page http://jeudisdulibre.fikket.com/. La séance sera suivie d’un verre de l’amitié.

PgDay France 2016 - Appel à orateurs

Posté par  . Édité par Benoît Sibaud et ZeroHeure. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
10
7
jan.
2016
Base de données

Le PG Day France est la conférence annuelle de la communauté francophone de PostgreSQL.

Cette année, l’événement se tiendra le 31 mai 2016 à Lille. Une centaine de participants sont attendus pour une journée d'échanges autour de PostgreSQL et de ses projets associés.

  • Vous êtes expert sur un domaine lié aux bases de données libres ?
  • Vous avez utilisé PostgreSQL dans un contexte spécifique (gros volumes, forte charge, client reconnu, projet innovant, etc.) ?
  • Vous participez à un projet libre lié à PostgreSQL ?

Alors n'hésitez pas à proposer une présentation !

Elasticsearch 2.0

Posté par  (site web personnel) . Édité par palm123, bubar🦥, Benoît Sibaud et Pierre Jarillon. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
38
30
oct.
2015
Base de données

Elasticsearch est un moteur de recherche distribué, RESTful, reposant sur la bibliothèque Apache Lucene et sous licence Apache 2.

Si vous ne le connaissez pas encore, vous pouvez vous reporter à la précédente dépêche, Sortie d'Elasticsearch en version 1.0 où un rapide test est disponible.

Vous pouvez aussi voir tous les contenus taggés avec elasticsearch.