Dilatation et transposition sous contraintes perceptives des signaux audio : Application au transfert cinéma-vidéo

       

Authors: Pallone G.
Publication Date: June 2003 (PhD thesis, Aix-Marseille II University, 2003)

Tags: , ,


Abstract (in french)

La coexistence de deux formats: cinéma à 24 images/s et vidéo à 25 images/s, implique l’accélération ou le ralentissement de la bande-son lors du transfert d’un format vers l’autre. Ceci provoque une modification temporelle du signal sonore, et par conséquent une modification spectrale avec altération du timbre. Les studios de post-production audiovisuelle souhaitent compenser cet effet par l’application d’une transformation sonore adéquate.
L’objectif de ce travail est de fournir à l’industrie audiovisuelle un système permettant de pallier la modification de timbre engendrée par le changement de vitesse de lecture. Ce système se compose d’une part d’un algorithme de traitement et d’autre part d’une machine sur lequel il est implanté. L’algorithme est conçu et développé pour répondre aux contraintes liées à la qualité sonore et à la compatibilité multicanal. La machine, baptisée HARMO, est conçue spécifiquement par la société GENESIS sur la base de processeurs de signaux numériques, et doit répondre à la contrainte de temps-réel. Cet aspect ”valorisation” conduit à intégrer dans le projet les contraintes de coût et de délai de réalisation.
Un état de l’art basé sur une bibliographie quasi-exhaustive aboutit à une classification originale des méthodes de dilatation et de transposition existantes. Ceci nous amène à distinguer et à étudier les méthodes classiques temporelles et fréquentielles, et à introduire les méthodes temps-fréquence. Cette classification est à la base de plusieurs méthodes innovantes :
– deux méthodes temps-fréquence dont l’analyse est adaptée à l’audition,
– deux méthodes couplées qui associent les avantages des méthodes temporelles et fréquentielles,
– une méthode temporelle basée sur une amélioration des méthodes existantes.
Les algorithmes sont évalués grâce à une banque de sons-test spécifiquement élaborée pour mettre en évidence les défauts caractéristiques des algorithmes. Notre choix final s’est porté sur l’approche temporelle, que nous optimisons par l’adjonction de critères de segmentation basés sur l’autocorrélation normalisée et la détection de transitoires. Cet algorithme s’intègre dans un logiciel qui a été structuré pour un fonctionnement temps-réel et multicanal sur le système HARMO.