Dans le cadre du Data Challenge du Festival IA PAU 5, 4 projets ont été étudiés par plus de 110 étudiants de différentes écoles. Ces projets étaient portés par une association et 3 entreprises :
– HUMANS BY NATURE : un collectif partageant des valeurs communes sur l’éthique et l’environnement, et une forte volonté d’agir
– HOLIS : startup spécialisée en ingénierie d’inspection et de maintenance
– MPSI SANTE SOCIAL : société de conseil spécialisée dans le traitement de l’information médicale
– PREZZUP – AGENCE LIBRE : éditeur de solutions de création de vidéos pédagogiques immersives


Merci aux nombreux étudiants participants, aux mentors, aux jurys et aux entreprises ayant transmis et suivi les projets.

Le déroulement

Le vendredi 1er décembre 2023, à partir de 17h00, plusieurs entreprises ont présenté sur notre chaine Youtube un problème à résoudre avec une technologie d’intelligence artificielle. Puis, les 110 étudiants présents en ligne et inscrits ont constitué des équipes (généralement entre 3 et 8 personnes) et choisi un sujet.

Jusqu’au dimanche 3 décembre 14h00, chaque équipe a recherché une solution pour son projet et préparé un rendu sous forme de maquette et diapositives de présentation. Durant cette période, des points réguliers ont été effectués avec un mentor technique de chaque projet et un ou des représentants des porteurs des projets; le samedi en début d’après-midi, un expert en IA a sensibilisé les étudiants sur l’impact environnemental du numérique et a présenté G.AI.A (Green AI Arena), notre plateforme de calcul d’impact environnemental durant les phases d’apprentissage et d’inférence de tout modèle IA, puis un expert en communication a animé une session de coaching à la présentation des résultats.

Le dimanche 3 décembre après-midi, chaque équipe a présenté en distanciel son projet devant des jurys d’experts et des représentants des porteurs des projets qui ont sélectionné un vainqueur pour chaque projet d’entreprise.

Puis ces 4 gagnants ont été départagés par un nouveau jury lors d’une nouvelle présentation diffusée en direct sur notre chaîne Youtube. Sur la base des prototypes réalisés, de leurs performances, des présentations et des réponses aux questions, des prix ont été décernés aux 4 équipes : 3 000 € à la meilleure équipe, 2 000 € à la seconde, 1 000 € aux deux autres équipes.

Les sujets proposés

HUMANS BY NATURE : mettre en place un algorithme de recommandations de mise en relation.

Problématique et objectifs : lorsqu’un nouveau membre de HBN décide de rejoindre l’organisation, il remplit un questionnaire, où il renseigne une vingtaine de champs sur ses valeurs, sa vision, ses objectifs, et ses réseaux de circularité. L’objectif du data challenge est double : construire un algorithme de recommandation qui permet à un nouveau membre d’être orienté vers les projets et les porteurs favorisant la circularité, construire une interface de visualisation de données qui permet de représenter les connexions potentielles entre porteurs de compétences et projets.

Descriptif du jeu de données fourni : les données se composent d’un fichier Google sheet contenant plusieurs onglets, notamment la table de la communauté HBN et la table des projets.

Voir la vidéo de présentation du projet

Voir la vidéo de la soutenance du projet de l’équipe gagnante

HOLIS : détection et extraction de tables dans des documents non structurés.

Problématique et objectifs : l’identification précise des données relatives aux pièces de rechange est une étape cruciale pour le développement et la mise en œuvre de bases de données opérationnelles qui assurent une maintenance efficace et sécurisée des installations industrielles. Une bonne identification permet une gestion efficace et garantit la continuité des opérations. L’objectif est de construire un pipeline de traitement qui permet d’extraire les tables des pièces détachées qui se trouvent dans des documents PDF, avec une approche à 2 niveaux : le premier détecte des tables dans des images (détection), le second sélectionne uniquement les tables intéressantes (classification).

Descriptif du jeu de données fourni : 70 documents PDF (1-200 pages); certains documents sont annotés avec les tables intéressantes.

Voir la vidéo de présentation du projet

Voir la vidéo de la soutenance du projet de l’équipe gagnante

MPSI SANTE SOCIAL : analyse (data clustering) des séjours des patients hospitalisés.

Problématique et objectifs : dans les établissements de soins médicaux, chaque semaine d’hospitalisation donne ainsi lieu à la production d’un compte-rendu normé de l’ensemble des soins apportés au patient. La codification est réalisée par plusieurs variables s’appuyant sur des nomenclatures médicales et techniques internationales et nationales. Les objectifs du projet sont de faciliter l’identification des séjours patients « cohérents » du point de vue de leur prise en charge pour préparer un protocole de parcours patient pertinent et optimiser son codage, renforcer les contrôles qualité en identifiant les séjours en écart avec les regroupements identifiés, enrichir le moteur de recherche d’aide au codage existant, disposer d’une interface utilisateur conviviale et facile d’utilisation pour visualiser la représentation des regroupements calculés.

Descriptif du jeu de données fourni : plusieurs fichiers csv , dont des historiques de séjours anonymisés et des nomenclatures de références pour chaque variable.

Voir la vidéo de présentation du projet

Voir la vidéo de la soutenance du projet de l’équipe gagnante

PREZZUP – AGENCE LIBRE : analyse automatique de pitch vidéos pour évaluer leur qualité.

Problématique et objectifs : la présentation est une tâche complexe impliquant de nombreux critères organisationnels, psychologiques, de communication, etc. En d’autres mots, c’est beaucoup plus compliqué que de dire si une image contient un passage piéton! L’objectif est de construire une IA qui permet l’évaluation automatique de la qualité d’une présentation, notamment de relier des outils générateurs d’informations visuelles (MediaPipe, Whisper) avec des critères professionnels d’appréciation d’une présentation.

Descriptif du jeu de données fourni : un corpus de vidéos avec différentes annotations d’évaluations (globale, par évènements (sourire, gestes, mouvements du corps, …)).

Voir la vidéo de présentation du projet

Voir la vidéo de la soutenance du projet de l’équipe gagnante

Les résultats

De nombreuses équipes ont travaillé intensément durant 2 jours et 2 nuits et ont apporté des solutions de très grande qualité aux 4 projets proposés.

Toutes nos félicitations aux vainqueurs, une équipe d’étudiants de l’école INSA Toulouse.

REJOIGNEZ-NOUS

Contactez-nous pour toutes vos interrogations

#IAPAU