Comment utiliser nos solutions avec les outils de data-science ?

b.ridel Non classifié(e) août 6, 2020 | 0

Nos solutions ont été conçues pour les opérationnels afin de leur faciliter l’accès à l’information pour améliorer la performance de l’usine.

De ce fait elles apportent des solutions métiers aux utilisateurs pour répondre à leurs usages de terrain. Certaines fonctionnalités font appel à des techniques basées sur le Machine Learning pour répondre à des besoins d’analyse de données en évitant d’exposer la complexité de ces techniques aux utilisateurs.

Pour autant, nos solutions permettent de faciliter la tâche des métiers en charge du traitement des données (data scientists, data analysts, data engineers…) qui peuvent ainsi plus facilement mettre à disposition le fruit de leur travail au service des opérationnels.

S’appuyer sur des outils largement déployés pour le traitement de données

Le constat que nous faisons est simple : le langage qui émerge pour travailler sur du traitement de données ou du Machine Learning est incontestablement Python. Grâce à ses fonctions de manipulation et de nettoyage de données, ses librairies très complètes et sa polyvalence, Python s’est imposé sur le marché face à des langages comme R, historiquement très utilisé par les data scientists.

Il s’agit d’un langage libre bénéficiant de la production de la communauté scientifique internationale. De plus, de nombreuses solutions commerciales de Data Science s’appuient sur ce langage (Dataiku, Rapideminer…).

Faciliter la production des jeux de données (data-set)

Avec le Process Data Lake d’OIAnalytics, nous collectons, stockons, structurons et traitons en continu les données de l’usine. Il est donc possible de construire très rapidement un jeu de données avec des données issues de sources multiples, déjà combinées et avec l’agrégation souhaitée (par pas de temps, par lot de production…) en fonction du besoin d’analyse ou de modélisation.

Ainsi nous faisons gagner un temps très important aux équipes en charge en gommant la complexité souvent sous-estimée de cette étape. Le Process Data Lake dispose de nombreuses possibilités d’exports (fichiers CSV, XLS) ou d’interrogation de données (API Rest).

Permettre une mise en œuvre simplifiée des modèles sur le terrain

Un autre point dur pour les équipes en charge des modèles est leur mise en œuvre sur le terrain. Il faut pouvoir disposer des données nécessaires en continu, être en mesure d’exécuter les modèles à la cadence souhaitée et restituer l’information résultante de l’exécution des modèles vers les opérationnels. Cela peut devenir un casse-tête et générer des délais et des coûts important.

Pour remédier à cela, nous avons intégré à notre Process Data Lake la possibilité d’exécuter des modèles construits en Python en bénéficiant de toute la couche de collecte, de structuration et de traitement des données. Les informations issues des modèles sont ensuite disponibles comme n’importe quelle autre donnée et ainsi utilisable dans l’ensemble des fonctionnalités de nos solutions (visualisation, reporting, contrôle opérationnel, analyse…).

Optimistik s’occupe de l’infrastructure, de la performance, de la disponibilité et de la sécurité des données et de l’exécution des modèles, permettant ainsi aux équipes de rester focalisées sur leur métier.

OIAnalytics, un pont entre les experts en analyse de données et les opérationnels

Nos solutions permettent ainsi de fluidifier la collaboration entre les opérationnels et les data scientists qui on l’expertise de la donnée dans l’objectif commun d’améliorer la performance de l’usine.

Elles se positionnent donc comme une approche complémentaire aux outils de data-science du marché.

Auteur : Mathieu Cura

Comment utiliser nos solutions avec les outils de data-science ?