Pr. Sotiris Manitsaris: « L’IA peut redéfinir la création musicale »

Pr. Sotiris Manitsaris: « L’IA peut redéfinir la création musicale »
Image générée à l'aide de Midjourney (IA).

Les machines peuvent-elles, grâce à l’IA, comprendre et anticiper les comportements humains ? C’est l’une des questions auxquelles a répondu le professeur Sotiris Manitsaris, directeur adjoint du Centre de Robotique de MINES ParisTech, à l’occasion de la série de séminaires du SKEMA Centre for Artificial Intelligence (SCAI). En marge de cet événement, la directrice du SCAI Margherita Pagani a poursuivi la conversation avec lui.

La collaboration homme-robot

Vous travaillez sur des machines capables d’anticiper nos comportements pour y répondre de manière optimale. Comment appréhendez-vous le caractère imprévisible des actions humaines ?

Sotiris Manitsaris, à SKEMA Business School.

Lorsque je parle d’anticipation, je fais davantage référence aux contextes professionnels qu’à la vie quotidienne. Mes travaux portent par exemple sur la production industrielle, un secteur dans lequel les opérateurs exécutent des tâches précises en réalisant des gestes et des actions coordonnées dans l’espace et dans le temps.

Dans ce genre d’environnement contrôlé, les actions peuvent être anticipées plus facilement. Prenons un exemple : lorsqu’un homme et un robot collaborent au montage d’une portière sur une ligne d’assemblage automobile, ils doivent être parfaitement synchronisés. Pour ce faire, le robot doit anticiper la cadence de l’opérateur, sa vitesse ou sa lenteur, ainsi que ses actions dans l’espace pour être en mesure de lui tendre un tournevis au bon moment et au bon endroit.

Mais, même dans un cadre maîtrisé, l’imprévisibilité reste un facteur…

Absolument. Lorsque l’opérateur fait un mouvement inattendu, le robot déclenche son « système anti-collision ». En d’autres termes, l’algorithme recalcule des trajectoires alternatives pour éviter tout télescopage, ce qui permet de garantir la sécurité et la continuité des opérations. Cette approche est comparable au calcul d’un nouvel itinéraire lorsque vous quittez la route proposée par votre GPS.

C’est ce que nous appelons la « robotique collaborative ». Les robots sont équipés de capteurs capables de percevoir la présence humaine et d’évaluer la distance dans une pièce, mais également d’une intelligence artificielle (IA) qui calcule les trajectoires optimales en permanence. Nos robots sont réactifs, ce qui signifie qu’ils s’adaptent dans le temps et l’espace au comportement de l’opérateur.

« La variabilité augmente en fonction des caractéristiques personnelles ou culturelles et de la gestuelle propre à chacun »

sotiris manitsaris

Qu’en est-il des particularités individuelles en matière de gestuelle et de langage corporel ?

C’est un véritable défi dans le domaine de la collaboration homme-robot. Demandez à quelqu’un de réaliser le même geste dix fois de suite : vous remarquerez quelques variations. Et plus il y a d’individus, plus la variabilité augmente en raison des caractéristiques personnelles ou culturelles et de la gestuelle propre à chacun. Pour gérer cet aspect, nous devons collecter autant de données que possible auprès d’un large panel d’utilisateurs. Afin d’entraîner efficacement l’IA, nous enregistrons donc les gestes répétés d’un grand nombre de personnes aux profils variés.

Mais se fier uniquement à la collecte de données n’est pas toujours réaliste ou suffisant. Dans de tels cas, nous utilisons des modèles mathématiques pour décrire les actions d’une manière invariable. Il s’agit d’identifier les éléments fondamentaux d’un mouvement, ceux qui restent constants indépendamment des variations individuelles.

Imaginons qu’un opérateur tende la main pour saisir un outil sur une ligne de montage. Son action cardinale, qui consiste à saisir un outil, peut être décomposée en fondamentaux. Les fondamentaux sont les unités de base du mouvement reposant sur le même postulat, comme le fait d’adopter une posture ou de saisir un outil. En se focalisant sur eux plutôt que sur la reproduction exacte des mouvements, les robots peuvent mieux comprendre et anticiper les actions humaines. Ainsi, ils peuvent collaborer plus efficacement avec un large panel d’utilisateurs.

Comment peut-on garantir que le système d’IA fonctionne bien auprès de personnes différentes et dans des contextes très divers ?

La généralisation est une question complexe. Les performances d’un système d’IA dépendent largement de la qualité et de la diversité des données d’entraînement. Si elles reflètent majoritairement une seule catégorie de personnes, l’IA peut rencontrer des difficultés à s’adapter à d’autres profils.

Dans le domaine industriel, où les données restent souvent confidentielles, nous privilégions la précision par rapport à la généralisation. Nous cherchons à développer des modèles adaptés à des groupes ou des tâches spécifiques, ce qui garantit une précision et une fiabilité accrues dans un environnement contrôlé.


A voir aussi : Pr. Christopher Tucci : « La plupart des entreprises sont trop lentes à adopter l’IA ».


À l’inverse, pour les applications dans des espaces publics comme les aéroports ou les musées, l’objectif est tout autre. Nous souhaitons que le système comprenne les gestes de tous, en visant une plus grande inclusivité et une meilleure généralisation. Cela passe par la collecte d’une grande variété de données d’entraînement.

Cependant, concilier précision et généralisation reste un défi, car il n’est pas toujours possible d’accéder à d’importants volumes de données, et le caractère confidentiel des informations limite souvent l’utilisation de différentes sources. Nous travaillons en permanence sur des méthodes innovantes pour collecter des jeux de données diversifiés et développer des algorithmes capables de s’adapter à différents groupes et différents contextes. Cela permet d’obtenir des systèmes d’IA à la fois précis et inclusifs.

L’IA nous permet d’élargir les possibilités musicales en utilisant l’ensemble du corps, pas seulement les doigts ou les mains.

SOTIRIS MANITSARIS

Quelles considérations éthiques prenez-vous en compte pour concevoir des systèmes d’IA capables d’analyser et de prédire les comportements humains ?

Plusieurs considérations éthiques importantes sont à prendre en compte. L’un des aspects essentiels est la transparence : les utilisateurs doivent comprendre clairement comment leurs données seront utilisées. Lorsque les utilisateurs réalisent que leurs gestes sont enregistrés, ils peuvent craindre d’être remplacés par des robots. Il est donc crucial d’expliquer clairement le but du système d’IA. Dans mon travail, il ne s’agit pas de remplacer les travailleurs, mais de les aider. Par exemple, en facilitant l’exécution de certaines tâches, nous pouvons réduire les risques pour la santé et les problèmes d’ergonomie, tout en améliorant leur expérience de travail et leur bien-être.

Un autre défi majeur consiste à vérifier que les algorithmes sont équitables et non biaisés. Ils ne doivent pas fonctionner comme des « boîtes noires ». Il est essentiel de développer des systèmes capables d’expliquer leur fonctionnement interne. Cela implique de concevoir des algorithmes interprétables et de fournir une documentation claire sur les critères de décision.

La confidentialité et le consentement sont également des considérations importantes. Les utilisateurs doivent fournir leur consentement pour la collecte et l’utilisation des données, ce qui implique de fournir des informations détaillées sur les informations collectées, leur utilisation et les tiers qui pourront y accéder. Il est également crucial de garantir l’anonymisation des données et leur stockage sécurisé afin de protéger leur vie privée.

L’IA et la création artistique

Lors du séminaire, vous avez évoqué l’utilisation de l’IA pour accroître les possibilités offertes par les instruments de musique. Comment cela fonctionne-t-il ?

L’IA nous permet d’élargir les possibilités musicales en utilisant l’ensemble du corps, et pas seulement les doigts ou les mains. Nous pouvons par exemple mettre au point des systèmes où les mouvements d’un danseur génèrent des sons en temps réel. Ses gestes se transforment alors en musique. Contrairement aux instruments traditionnels, qui reposent principalement sur les mouvements des doigts, de tels systèmes offrent une expérience musicale plus immersive et expressive.


A lire aussi : ChatGPT est-il vraiment une menace pour le monde de l’éducation ?


La traduction des mouvements en sons, appelée « sonification du mouvement », repose sur l’utilisation combinée de capteurs et de l’IA. Les capteurs détectent les mouvements de l’interprète pour extraire des informations pertinentes telles que la vitesse, la direction ou l’intensité. L’IA intervient ensuite pour filtrer et interpréter ces données, afin d’identifier des gestes ou des motifs spécifiques. Ces informations sont ensuite associées à différents paramètres sonores. À titre d’exemple, la vitesse d’un mouvement peut influencer la hauteur du son. Le plus souvent, cette association est personnalisable et permet donc à l’interprète d’adapter la « sonification » de sa vision artistique. Enfin, les données traitées génèrent du son en temps réel à l’aide de synthétiseurs, de samplers ou d’autres techniques de génération sonore.

Avez-vous quelques exemples d’applications quotidiennes ?

Nous pouvons utiliser l’IA pour développer de nouveaux instruments et stimuler la créativité musicale. Imaginez par exemple un « synthétiseur de table », où l’on joue des notes d’une main tout en utilisant l’autre pour moduler le son en temps réel, ce qui renforce l’impact et l’expressivité. Cela révolutionne la création et l’interprétation de la musique, en introduisant des instruments qui suivent nos gestes en 3D.

La sonification du mouvement peut également être utilisée à des fins pédagogiques, pour faciliter l’apprentissage de nouvelles compétences. Les gestes d’un souffleur de verre peuvent par exemple être traduits en musique. En reproduisant ses gestes, son apprenti peut immédiatement percevoir le moindre écart, car la moindre erreur se traduit par des sons dissonants ou qui sonnent faux. Ce retour instantané permet d’ajuster et d’améliorer sa technique. Ce concept peut être appliqué dans de nombreux autres domaines, notamment la rééducation physique ou la pratique du sport.

L’IA peut-elle créer quelque chose de totalement nouveau, ou est-elle limitée ?

Le concept de nouveauté est subjectif et difficile à définir de manière mathématique. Bien que l’IA puisse produire des combinaisons inédites de données existantes, elle est incapable de créer quelque chose de totalement original. Ses productions sont intrinsèquement basées sur ses données d’entraînement. En d’autres termes, ce qu’on lui a appris. Par exemple, si vous entraînez une IA sur un style de marche spécifique, elle ne pourra que l’imiter ou générer des variations de ce style. Elle ne pourra pas inventer quelque chose à partir de zéro. Nous gardons constamment à l’esprit une règle fondamentale : les données doivent représenter ce que l’on souhaite reconnaître ou générer.

Margherita PaganiDirectrice du SKEMA Centre for Artificial Intelligence

Tous ses articles

Fermer le menu