Partage et Mutualisation

Partage et Mutualisation

Partage de licences

Sont disponibles en ligne, des jetons de licence pour les logiciels suivants :

  • SAP Sybase PowerAMC v15.0 pour modélisation de données (Modèle Entité-Relation, UML, jusqu'à la génération de schéma, script SQL de création de base de données relationnelles),
  • MatLab de MathWorks
  • The UnScrambler X10.2 : analyse de données (statistiques, régression, classification, exploration, prédiction, ...) , visualisation, importation depuis de nombreux formats générés par les appareils d'analyse (Matlab, netCDF, ...) .

API Server Management
Instance de Graviteeio, un API Management Server, pour enregistrement, publication, déploiement et contrôle d'accès aux services web (API REST, WS*, gRPC)
Plastic graviteeio portal,
Plastic graviteeio gateway,
Plastic graviteeio API Management

ECM - Gestionnaire électronique de documents
Une instance du ECM/GED Nuxeo pour la gestion de vos documents.
- Plastic Nuxeo 

Hébergement d'applications web
Selon la disponibilité des ressources, nous offrons sur nos serveurs l'hébergement d'applications web développées par les équipes de recherche du département CEPIA.  

Partage/Mutualisation ebooks informatiques
Des livres, format PDF, sont consultables et téléchargeables depuis l'adresse suivante Plastic eBooks.
Pour raison de copyright, seuls les agents INRA utilisant leur login/password LDAP National en vigueur pourront y accéder.

Outils logiciels, supports informatiques à disposition
serveur de dépot code sourde Git (Serveur Atlassian Bitbucket),

 

Liste d'outils logiciels à conseiller :

♦ Logiciels de représentation, de modélisation de données, de concepts
Xmind : éditeur visuel de modèles de données à structure réseau, graphe, hiérarchique, matricielle ... 
CmapTools : éditeur visuel de modèles de connaissance, cartes conceptuelles.
- AnalyseSI : un logiciel de modélisation de bases de données. Il s'appuie sur la méthode Merise et nécessite un environnement Java pour fonctionner. 
                    En construisant simplement le schéma MCD, il génère ensuite les requêtes SQL nécessaires à la création de la base de données.
                    Enfin, on peut connecter le logiciel à sa base de donnée pour qu'il construise la BDD, en respectant les syntaxes MySQL, PostgreSQL ou OracleDB.
DB-Main : outil de modélisation et de structuration de données pour développeurs et analystes.
- Dbeaver community : un unique outil pour la gestion de multiples base de données relationnelles.
- DBSchema community : outil universel de conception de schéma, de documentation, de génération de scripts pour différents types de bases de données: SQL, NO SQL.
- DBKoda IDE : développé par Soutbank Software (Australie), permettant de développer sa base de données MongoDB depuis un éditeur moderne (une interface Électron).

♦ Logiciels de visualisation de données (Reports, Dashbords, Data Viz)
Power BI Desktop : disponible sous Windows et MacOS, gratuit (le service de partage sur cloud est payant), cet outil d'analyse de données offre :
. une liste pléthorique de connecteurs à des sources de données, 
. une interface très conviviale de création de reports et de dashbord, 
. un riche panel de widgets pour la visualisation/représentation de données.
L'éditeur propose en ligne une documentation et un tutoriel de prise en main de niveau professionnel.

Qlik sense desktop : disponible sous windows et MacOs, gratuit pour une utilisation personnelle et professionnelle interne, cet outil d'analyse de données se caractérise par :
 - intégration de plusieurs sources de données,
 - un riche panel de widgets pour la visualisation/représentation de données.
Un guide de prise en main est également disponible.

Tableau Public: version gratuite de l'offre Tableau Desktop, disponible sous windows et MacOs, cet outil d'analyse de données se caractérise par :
. une liste restreinte de connecteurs à des sources de données,
. une interface très pratique de création de reports et dashbords,
. un riche panel de widgets pour la visualisation/représentation de données.
L'éditeur propose en ligne des vidéos et tutoriaux  de prise en main.

♦ Desktop toolbox pour analyse statistique
XLStat pour MSExcel: ajout de plus de 200 fonctionnalités à votre MS Office dont 13 est disponible avec la version gratuite. 

 ♦ Data science toolbox et plateformes d'analyse de données

- Galaxy : une plateforme web d'analyse pour des données intensives issue de la recherche bio médicale. Distribué en open source, l'installation d'une instance de serveur galaxy est relativement aisée. Galaxy est bien connu et quelques instances déployées au sein de l'institut (par ex:  chemProject, pfpTools ).

- Apache Hop : outil de type Extraction Transformation Load, plus orienté pour faire  du  "Data Preparation" dans une chaîne de traitement de données. Apache Hop se présente comme une alternative open source à des outils comme Talend ou Pentaho Data Integration. 
Principalement, Apache Hop permet de réaliser :
(a) les séquences de traitements (Pipeline) à l'aide d'une bibliothèque très riche de composants élémentaires et ceci de manière graphique,
(b) et les taches de traitement (workflow).

Pour une documentation générale : what is hop
Un webinar réalisé par la sté ATOL en avril 2024 présente un aperçu de réalisation de pipelines et de workflows (jobs) avec Apache Hop.  

- Talend Open Studio:  un desktop, type IDE Eclipse,  pour la conception/test/exécution manuelle de pipelines d’intégration de données (Collect, Transform, Share). Talend community rassemble beaucoup d'informations (tutorial, Documentation, user groups ) sur le produit.
Une fiche descriptive est également disponible sur PLUME.

Knime, disponible en dual licence, desktop d'analyse end to end de données (lecture, transformation, analyse, déploiement). Analyse des données de taille moyenne ou large sans recours à de la programmation R ou python mais en alignant de manière graphique des modules ou noeuds de traitement fournis (pipelines).
Une documentation très riche, slides de présentation rapide et un tutoriel bien organisé.
Knime Essentiels, un condensé de cas d'usage, est disponible en téléchargement ( pdf ).

- H2O : une plateforme d'algorithmes, bibliothèques de fonctions statistiques, analyses de données, machines learning et de l'AI. Une présentation assez générale est à voir ici.

Pyramid analytics : disponible en version community jusqu'à trois utilisateurs et en mode licensing au delà, plateforme de type BI allant jusqu'à permettre de faire de l'analyse prédictive (type machine learning). Un produit avec une IHM très conviviale et riche en fonctionnalités.

RapidMiner :  une plateforme pour data scientistes proposant un environnement graphique et intuitive ( drag'n drop designer ) de création de chaine de traitement. 
Une version académique est également disponible. 

Data Science Studio de DataiKu (un éditeur français), disponible en version free et enterprise, est une plateforme web d'analyse pour data scientistes couvrant toutes les étapes (lecture, préparation, enrichissement) > traitement > déploiement, visualisation. Deux modes "Click or Code" permettent une analyse s'appuyant sur une inteface graphique(drag'n drop de composants),  ou en écrivant ses scripts notebooks (R, Python, Scala, Hive, Pig, Spark, etc.) . L'aspect collaboratif de dataIku, permet le travail en équipe et garde toutes traces d'intervention tout au long du traitement du dataset. 
Au cours de notre test, nous avons constaté que la partie amont (préparation, enrichissement) est le point fort de Dataiku. Nous sommes également impressionné par les helpers contextuels, la qualité de la présentation générale, la richesse des tutoriaux et de la documentation.

Orange : disponible en version desktop,  un toolbox possedant un catalogue grandisssant de widgets, pour une analyse de données du type machine learning, data mining, interactive data visualisation. Cet outil est bien connu par les universitaires (profs, étudiants) et peut convenir aux experts dans le domaine. 

Pour un périmètre plus large, voir aussi :
     - SILL : Socle Interministériel des Logiciels Libres,
     - Comptoir du libre,
     - Bitnami stack
     - communauté Apache.org,
     - fondation eclipse.org

Date de modification : 20 avril 2024 | Date de création : 05 avril 2019 | Rédaction : M. Rakotoson