banner
Centre d'Information
Des machines sophistiquées et de superbes compétences

Regroupement

Jun 27, 2023

Rapports scientifiques volume 13, Numéro d'article : 12701 (2023) Citer cet article

Détails des métriques

L’apprentissage automatique appliqué à la pathologie numérique est de plus en plus utilisé pour évaluer la fonction rénale et diagnostiquer la cause sous-jacente de l’insuffisance rénale chronique (IRC). Nous avons développé un nouveau cadre informatique, l'analyse spatiale basée sur le clustering (CluSA), qui exploite l'apprentissage non supervisé pour apprendre les relations spatiales entre les modèles visuels locaux dans le tissu rénal. Ce cadre minimise le besoin d’annotations d’experts fastidieuses et peu pratiques. 107 471 images histopathologiques obtenues à partir de 172 carottes de biopsie ont été utilisées dans le regroupement et dans le modèle d’apprentissage profond. Pour incorporer des informations spatiales sur les modèles d'images regroupés sur l'échantillon de biopsie, nous avons codé spatialement des modèles regroupés avec des couleurs et effectué une analyse spatiale via un réseau neuronal graphique. Un classificateur forestier aléatoire avec divers groupes de caractéristiques a été utilisé pour prédire la maladie rénale chronique. Pour prédire le DFGe lors de la biopsie, nous avons obtenu une sensibilité de 0,97, une spécificité de 0,90 et une précision de 0,95. L'ASC était de 0,96. Pour prédire les modifications du DFGe sur un an, nous avons obtenu une sensibilité de 0,83, une spécificité de 0,85 et une précision de 0,84. L'ASC était de 0,85. Cette étude présente la première analyse spatiale basée sur des algorithmes d'apprentissage automatique non supervisés. Sans annotation d'experts, le cadre CluSA peut non seulement classer et prédire avec précision le degré de fonction rénale lors de la biopsie et sur un an, mais également identifier de nouveaux prédicteurs de la fonction rénale et du pronostic rénal.

L'insuffisance rénale chronique (IRC) implique une perte progressive de la fonction rénale et n'est pas facilement détectée aux premiers stades jusqu'à ce que la maladie soit avancée. Selon les Centers for Disease Control and Prevention, on estime que plus de 37 millions de personnes (15 % des adultes américains) souffrent d’insuffisance rénale chronique (IRC) et jusqu’à 9 adultes sur 10 atteints d’IRC ne savent pas qu’ils sont atteints d’IRC1. Le diabète, l’hypertension artérielle, les maladies cardiaques et les antécédents familiaux d’insuffisance rénale sont les causes les plus courantes de maladie rénale. Actuellement, l’IRC, qui cause plus de décès que le cancer du sein ou le cancer de la prostate, est la 9ème cause de décès aux États-Unis1.

Comme le degré de dysfonctionnement rénal est associé à une mortalité et un risque accrus de maladie cardiaque2,3, un diagnostic précis et précoce est crucial pour ralentir la progression vers l’insuffisance rénale4. Les mesures actuelles typiques de la fonction rénale et du risque de progression, telles que le taux de créatinine dans le sang et les protéines dans l'urine5,6, présentent plusieurs limites et ne sont pas précises à des niveaux plus élevés de fonction rénale7. Bien que les échantillons de biopsie rénale puissent fournir des informations pronostiques supplémentaires, par exemple le degré de sclérose glomérulaire et de fibrose interstitielle8, ils sont souvent estimés visuellement et leur interprétation peut varier selon les pathologistes. Les algorithmes assistés par ordinateur peuvent fournir une évaluation rénale plus objective et aider à surmonter une variabilité inter-observateur importante.

Plusieurs approches d’apprentissage profond et d’apprentissage automatique pour l’analyse d’images histopathologiques sont devenues de plus en plus courantes avec la disponibilité croissante de scanners numériques de lames entières9. Coudray et coll. utilisé des réseaux neuronaux à convolution (CNN) sur des images de diapositives entières (WSI) pour les classer en adénocarcinome du poumon (LUAD), carcinome épidermoïde du poumon (LUSC) ou tissu pulmonaire normal10. En outre, CNN a été appliqué à WSI pour classer les glomérules sclérosés et non sclérosés11,12. Kolachalama et coll. ont démontré que les modèles d'apprentissage profond de CNN peuvent surpasser le score de fibrose estimé par les pathologistes dans les tâches de classification et peuvent être appliqués aux images de biopsie rénale de routine13.

À ce jour, la plupart des algorithmes d’apprentissage automatique et d’apprentissage profond appliqués aux images histopathologiques reposaient sur des approches (de formation) supervisées. Cependant, les algorithmes supervisés nécessitent l’utilisation d’une grande quantité de données d’entraînement étiquetées, ce qui constitue une tâche longue, souvent peu pratique et coûteuse. Pour surmonter ce problème, plusieurs études ont proposé des méthodes telles que l'apprentissage faiblement supervisé et l'apprentissage à instances multiples (MIL) qui ont donné des performances relativement élevées14,15,16,17,18. Cependant, il s’agit toujours de méthodes supervisées qui nécessitent des étiquettes au niveau du patient.