Empowering Predictivity and Speed of hiPSC CM Assays by Machine Learning Approach - Thèses de Sorbonne Université Accéder directement au contenu
Thèse Année : 2024

Empowering Predictivity and Speed of hiPSC CM Assays by Machine Learning Approach

Améliorer la prédictivité et la rapidité des tests hiPSC CM par des approches d’apprentissage automatique

Haibo Liu
  • Fonction : Auteur
  • PersonId : 1336562
  • IdRef : 27758437X

Résumé

This thesis mainly addresses two topics: the first focuses on parameter estimation while the second explores applications relevant to safety pharmacology and disease studies. Solving parameter estimation problems poses significant challenges, especially in dynamical systems characterised by a large number of equations and parameters. The difficulties arise from the need to solve non-linear, non-convex, and potentially high-dimensional optimisation problems. Classical optimisation methods often rely solely on the underlying dynamical systems and neglect the advantages offered by all available data. In response to this gap, we introduced a novel approach named Latent Variable Gradient Flow (LVGF), designed to leverage both data and the underlying dynamical system. This method is based on two steps. In the first step, an autoencoder is trained on the data set in order to represent it with latent variables in smaller dimension. Then, in the second step, with the help of a non-linear mapping that allows to link the latent variables and the parameter variables, we developed an algorithm that can be described as a gradient flow for the latent variables of the autoencoder. We proved convergence results for our method and the numerical tests highlighted the fact that the LVGF approach could overcome the challenges associated with parameter estimation compared with the classical gradient descent method, particularly in situations involving non-convex optimisation problems. Regarding the applications in safety pharmacology and disease studies, we investigated several Artificial Neural Networks (ANN) methods for classifying drugs based on their effects on ion channels. Firstly, we focused on classifying whether a given data from a drug experiment alters the normal behaviour of the human ether-a-go-go-related gene (hERG) channel. The Multilayer Perception (MLP) and multivariate 1-dimensional Convolutional Neural Network (1D-CNN) demonstrated efficiency and high accuracy in drug classification, showcasing their potential to enhance drug high-throughput screening. Furthermore, we extended the application of MLP and multivariate 1D-CNN to identify healthy individuals from patients with Brugada syndrome. This testing confirmed their versatility in addressing different problems. Additionally, we explored the use of autoencoder methods in anomaly detection to automatically identify abnormal data from experimental data sets. This approach aims to enhance the quality of data during the experimental recording stage. Lastly, we presented a comparative analysis of ANN, statistical, and mathematical modelling methods employed in extit{in vivo} studies to examine the ageing effects on dogs' cardiovascular systems.
Cette thèse aborde principalement deux thèmes : le premier se concentre sur l'estimation des paramètres tandis que le second explore des applications pertinentes pour la pharmacologie de la sécurité et les études sur les maladies. La résolution de problèmes d'estimation des paramètres présente des défis significatifs, notamment dans les systèmes dynamiques caractérisés par un grand nombre d'équations et de paramètres. Les difficultés découlent de la nécessité de résoudre des problèmes d'optimisation non linéaires, non convexes et potentiellement de grande dimension. Les méthodes d'optimisation traditionnelles s'appuient souvent uniquement sur les systèmes dynamiques sous-jacents et négligent les avantages offerts par l'ensemble des données disponibles. En réponse à cette lacune, nous avons introduit une nouvelle approche appelée Latent Variable Gradient Flow (LVGF), conçue pour tirer parti à la fois des données et du système dynamique sous-jacent. Cette méthode repose sur deux étapes. Dans un premier temps, un auto-encodeur est entraîné sur l'ensemble de données afin de le représenter avec des variables latentes en plus petite dimension. Ensuite, dans la deuxième étape, à l'aide d'une application non linéaire qui relie les variables latentes et les paramètres, nous avons développé un algorithme qui peut être décrit comme une méthode de flot gradient pour les variables latentes de l'auto-encodeur. Nous avons prouvé des résultats de convergence pour cette méthode et les tests numériques ont mis en évidence le fait que l'approche LVGF pouvait surmonter les défis associés à l'estimation des paramètres par rapport à la méthode classique de descente de gradient, en particulier dans les situations impliquant des problèmes d'optimisation non convexes. Pour ce qui est des applications en pharmacologie de la sécurité et les études sur les maladies, nous avons examiné plusieurs méthodes d'Artificial Neural Networks (ANN) pour classer les médicaments en fonction de leurs effets sur les canaux ioniques. Tout d'abord, nous nous sommes concentrés sur la classification pour déterminer si des données provenant d'une expérience sur un médicament altèrent le comportement normal du canal human ether-a-go-go-related gene (hERG). Le Multilayer Perception (MLP) et le multivariate 1-dimensional Convolutional Neural Network (1D-CNN) ont démontré une efficacité et une précision élevées dans la classification des médicaments, illustrant leur potentiel pour améliorer le criblage à haut débit des médicaments. De plus, nous avons étendu l'application du MLP et du 1D-CNN multivarié pour identifier les individus en bonne santé parmi les patients atteints du syndrome de Brugada. Ces tests ont confirmé leur polyvalence pour résoudre différents problèmes. De plus, nous avons exploré l'utilisation de méthodes d'autoencodeurs dans la détection d'anomalies pour identifier automatiquement des données anormales dans des ensembles de données expérimentales. Cette approche vise à améliorer la qualité des données lors de l'enregistrement expérimental. Enfin, nous avons présenté une analyse comparative des méthodes d'ANN, statistiques et de modélisation mathématique utilisées dans des études in vivo pour examiner les effets du vieillissement sur le système cardiovasculaire des chiens.
Fichier principal
Vignette du fichier
144146_LIU_Haibo_2024_archivage.pdf (22.01 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04573685 , version 1 (13-05-2024)

Identifiants

  • HAL Id : tel-04573685 , version 1

Citer

Haibo Liu. Empowering Predictivity and Speed of hiPSC CM Assays by Machine Learning Approach. Machine Learning [cs.LG]. Sorbonne Université, 2024. English. ⟨NNT : 2024SORUS045⟩. ⟨tel-04573685⟩
0 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More