La version 2.0.0 de Talend Open Studio est sortie le 11 avril 2007. Talend Open Studio est un outil d’intégration de données utilisé pour l'
ETL et l’intégration de données opérationnelle. Il est distribué sous licence GPL. Talend Open Studio propose une interface permettant de concevoir graphiquement les connexions aux sources et les traitements sur les données. L'interface graphique utilise la plateforme Eclipse.
Le travail sur les données est réalisé par des scripts générés. Pour ces derniers, le choix des langages s'est naturellement porté sur des langages ouverts et répandus. Depuis l'origine, Talend Open Studio génère du Perl. La version 2 a introduit la génération de code Java et
SQL. En fonction des traitements à réaliser et de l'environnement technique cible, Talend Open Studio propose le choix entre une architecture ETL (exécution des transformations par les scripts Perl ou Java) ou ELT (exécution des transformations dans le SGBD en SQL natif). Très tôt dans la conception du logiciel, tout est mis en oeuvre pour optimiser les performances des scripts générés.
Talend Open Studio dispose de connexions vers les bases de données (MySQL, PostgreSQL, Oracle...), les fichiers (
CSV, positionnel, Excel,
XML...) ou bien encore les
services web. L'application permet par exemple de gérer graphiquement des jointures entre différentes sources de données, de récupérer ou d'envoyer des fichiers via
FTP ou bien encore d'envoyer des notifications par mail.
La conception très visuelle des "jobs" permet de présenter des statistiques d'exécution en temps réel ou encore de tracer les données transitant ligne à ligne dans les composants de la chaîne de traitement.
L'architecture de Talend Open Studio a été conçue pour être étendue par des composants que les utilisateurs peuvent écrire eux-mêmes, adaptant ainsi au mieux les possibilités techniques de l'outil pour une utilisation plus spécifique.