Aux limites de l’innovation

Une IA pour monter des vidéos

Une intelligence artificielle capable de monter des scènes de films en quelques secondes, contre plusieurs heures pour un monteur humain : faut-il-voir dans cette innovation l’avenir du cinéma ?

 

Au cinéma, monter une scène de dialogue tournée plusieurs fois sous des angles différents est un véritable défi, y compris pour les monteurs professionnels. Pour une scène de dialogue d’environ 1 minute 30, il faut en moyen trois heures à un professionnel pour réaliser un montage utilisable. Mais ça, c’était avant qu’une équipe de chercheurs de l’université de Stanford s’attaque à cette pratique, et ne mette au point une intelligence artificielle capable de faire le même travail… en deux à trois secondes seulement !

 

Découpage et analyse

Le fonctionnement de l’IA est à la fois simple et précis : un algorithme se charge d’analyser les différentes prises de vue en les classant par rapport aux émotions affichées par les acteurs. Le regard, les mouvements de la bouche, ainsi que les intonations de la voix sont pris en compte pour reconstituer le dialogue.

L’intervention humaine se fait au tout départ du processus : le monteur doit intégrer différentes requêtes artistiques au sein du logiciel. Par exemple, il peut demander à l’IA de ne pas faire de raccord dans l’axe, c’est-à-dire utiliser deux plans à la suite qui présentent le même cadrage. Il peut également demander un nombre spécifiquement de plans larges ou rapprochés, par exemple. En clair, il donne des consignes de mise en scène, que l’intelligence artificielle va suivre à la lettre, dans la mesure des plans qui lui sont fournis.

Une poignée de secondes plus tard, le montage est disponible. Et si le monteur humain décèle des imperfections, il peut donner de nouvelles consignes à l’IA qui se remettra au travail instantanément.

 

Un outil limité

Comme on peut le découvrir dans la vidéo ci-dessous, la performance est impressionnante. Est-ce que cela signifie que le montage des films que l’on peut voir en salles sera prochainement uniquement réalisé par des intelligences artificielles ? Pas du tout : l’IA développée à Stanford ne prend en charge que les scènes de dialogue, qui fonctionnent selon des schémas spécifiques et sont donc simples à cerner. Difficile, pour l’heure, de reproduire la démarche avec d’autres types de scènes, comme des courses-poursuite en voiture ou des scènes qui n’obéissent à aucunes règles en particulier.

Néanmoins, cela ne veut pas dire que l’outil ne pourra être utilisé à l’avenir, pour faciliter le travail des monteurs pour ce type de scène, notamment pour réaliser rapidement un pré-montage à affiner à la main. Pour les YouTuber qui parlent face caméra, un tel logiciel pourrait être pratique pour gagner du temps lors de la réalisation de vidéos. Et quand on y pense, ce n’est déjà pas si mal !

 

 

Audrey Oeillet

Partager cet article

Read Full Story