Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL

Vincent Roger; Jérôme Farinas; Virginie Woisard; Julien Pinquier

Poster De Conférence Année : 2021

Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL

(1) , (1) , (2) , (1)

1
2

Vincent Roger

Fonction : Auteur
PersonId : 1157428

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Jérôme Farinas

Fonction : Auteur
PersonId : 172411
IdHAL : jerome-farinas
ORCID : 0000-0002-7456-9019
IdRef : 20073234X

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Virginie Woisard

Fonction : Auteur

Unité de Recherche Interdisciplinaire Octogone-Lordat

Julien Pinquier

Fonction : Auteur
PersonId : 21789
IdHAL : julien-pinquier
ORCID : 0000-0003-1556-1284
IdRef : 086752839

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Résumé

Entre 2007 et 2016, le nombre de cancers de la cavité buccale et du pharynx combinés a augmenté, avec une incidence de 3 % aux États-Unis chaque année [1]. De nombreuses autres pathologies peuvent entraîner des troubles de la parole en influant sur les mécanismes de production de la parole [2]. Cela peut réduire la qualité de vie des patients affectés [3]. Pour quantifier l'impact de ces pathologies sur la production de la parole, il est courant d'utiliser des scores qui reflètent l'intelligibilité de la production et l'indice de sévérité de la parole. Ils mesurent l'impact des pathologies. Ainsi, ces scores ne mesurent pas la qualité du signal audio, mais la capacité des patients à produire des sons intelligibles. Les experts obtiennent ces scores en écoutant leurs patients. La familiarité avec les patients et l'habitude d'entendre la voix pathologique peuvent influencer ce score [4]. Afin d'augmenter la stabilité de la mesure, celle-ci peut être traitée par un groupe d'experts [5]. Néanmoins, le fait de demander à un groupe d'obtenir un score objectif complique le suivi des patients. L'utilisation d'un outil automatique, calculé par un ordinateur sur un échantillon de discours enregistré, pourrait fournir un moyen objectif et libérer du temps pour les experts. Dans notre étude, nous proposons une nouvelle méthode non supervisée utilisant un modèle appris sur la parole standard en Anglais. Nous proposons un formalisme basé sur des caractéristiques de la parole qui produisent un score de sévérité. Cette méthode, utilisant l’encodeur PASE+[6], s’inspire du modèle Inception [7] (modèle de réseau de neurones profonds, généralement utilisé en vision par ordinateur pour évaluer la qualité des images générées où les locuteurs sont ici considérés comme des générateurs). Cette approche, bien que fondée sur un modèle en Anglais, nous donne d’excellents résultats sur les données en Français de lecture du corpus de voix pathologiques C2SI [8]. En effet, une corrélation de Spearman de 0,87 est obtenue par rapport à l'indice de sévérité, réalisé manuellement par un groupe d'experts cliniques (voir figure 1). Notons que la mesure de sévérité est très corrélée (> 0,91) avec la mesure d’intelligibilité [9]. Nous arrivons à des résultats comparables avec ceux obtenus par des méthodes qui ont réalisé un apprentissage sur les données du corpus [10,11]. La corrélation élevée et le fait que cette méthode ne nécessite aucun apprentissage sur des enregistrements de voix pathologiques, nous permettent d'envisager des applications cliniques intéressantes.

Mots clés

modélisation automatique mesure de la sévérité parole pathologique

Domaines

Traitement du signal et de l'image [eess.SP] Apprentissage [cs.LG] Informatique et langage [cs.CL]

Fichier principal

AFCP-JPC2021_Roger.pdf (216.14 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Jérôme Farinas : Connectez-vous pour contacter le contributeur

https://ut3-toulouseinp.hal.science/hal-03269228

Soumis le : mercredi 23 juin 2021-21:34:32

Dernière modification le : jeudi 1 février 2024-16:48:23

Archivage à long terme le : vendredi 24 septembre 2021-19:06:37

Dates et versions

hal-03269228 , version 1 (23-06-2021)

Identifiants

HAL Id : hal-03269228 , version 1

Citer

Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier. Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL. Séminaire AFCP 2021 – Phonétique Clinique, May 2021, Toulouse (virtuel), France. , 2021. ⟨hal-03269228⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS OCTOGONE UT1-CAPITOLE IRIT IRIT-SAMOVA ANR IRIT-SI IRIT-UT3 TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

119 Consultations

12 Téléchargements

Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager