ORIGINAL
Uso del aprendizaje automático en el diagnóstico del melanoma. Limitaciones por superarMachine Learning in Melanoma Diagnosis. Limitations About to be Overcome

https://doi.org/10.1016/j.ad.2019.09.002Get rights and content

Resumen

Antecedentes

La clasificación automática de imágenes es una rama prometedora del aprendizaje automático (de sus siglas en inglés Machine Learning [ML]), y es una herramienta útil en el diagnóstico de cáncer de piel. Sin embargo, poco se ha estudiado acerca de las limitaciones de su uso en la práctica clínica diaria.

Objetivo

Determinar las limitaciones que existen en cuanto a la selección de imágenes usadas para el análisis por ML de las neoplasias cutáneas, en particular del melanoma.

Métodos

Se diseñó un estudio de cohorte retrospectivo, donde se incluyeron de forma consecutiva 2.849 imágenes dermatoscópicas de alta calidad de tumores cutáneos para su valoración por un sistema de ML, recogidas entre los años 2010 y 2014. Cada imagen dermatoscópica fue clasificada según las características de elegibilidad para el análisis por ML.

Resultados

De las 2.849 imágenes elegidas a partir de nuestra base de datos, 968 (34%) cumplieron los criterios de inclusión. De los 528 melanomas, 335 (63,4%) fueron excluidos. La ausencia de piel normal circundante (40,5% de todos los melanomas de nuestra base de datos) y la ausencia de pigmentación (14,2%) fueron las causas más frecuentes de exclusión para el análisis por ML.

Discusión

Solo el 36,6% de nuestros melanomas se consideraron aceptables para el análisis por sistemas de ML de última generación. Concluimos que los futuros sistemas de ML deberán ser entrenados a partir de bases de datos más grandes que incluyan imágenes representativas de la práctica clínica habitual. Afortunadamente, muchas de estas limitaciones están siendo superadas gracias a los avances realizados recientemente por la comunidad científica, como se ha demostrado en trabajos recientes.

Abstract

Background

Automated image classification is a promising branch of machine learning (ML) useful for skin cancer diagnosis, but little has been determined about its limitations for general usability in current clinical practice.

Objective

To determine limitations in the selection of skin cancer images for ML analysis, particularly in melanoma.

Methods

Retrospective cohort study design, including 2,849 consecutive high-quality dermoscopy images of skin tumors from 2010 to 2014, for evaluation by a ML system. Each dermoscopy image was assorted according to its eligibility for ML analysis.

Results

Of the 2,849 images chosen from our database, 968 (34%) met the inclusion criteria for analysis by the ML system. Only 64.7% of nevi and 36.6% of melanoma met the inclusion criteria. Of the 528 melanomas, 335 (63.4%) were excluded. An absence of normal surrounding skin (40.5% of all melanomas from our database) and absence of pigmentation (14.2%) were the most common reasons for exclusion from ML analysis.

Discussion

Only 36.6% of our melanomas were admissible for analysis by state-of-the-art ML systems. We conclude that future ML systems should be trained on larger datasets which include relevant non-ideal images from lesions evaluated in real clinical practice. Fortunately, many of these limitations are being overcome by the scientific community as recent works show.

Section snippets

Introducción

La clasificación automatizada de imágenes por reconocimiento de patrones es una rama del aprendizaje automático (del inglés «Machine Learning» [ML]) que ofrece al dermatólogo una herramienta útil para diagnóstico de cáncer de piel1. Las redes neuronales convolucionales profundas (del inglés «Deep convolutional neural networks» [DCNN]) han mejorado de manera extraordinaria la precisión en el aprendizaje de patrones y la clasificación de objetos2, son utilizadas de manera satisfactoria en la

Materiales y métodos

Este estudio se realizó en un hospital universitario de tercer nivel especializado en cáncer cutáneo, localizado en Barcelona, España. Se diseñó un estudio de cohorte retrospectivo donde se incluyeron de manera consecutiva 2.849 imágenes dermatoscópicas de alta calidad de tumores cutáneos, obtenidas a partir de la base de datos de la Unidad de Melanoma, recogidas entre el 2010 y 2014. Se utilizó el sistema de microscopia de epiluminiscencia fotográfica digital DermLite® 3 Gen con una conexión de

Resultados

De las 2.849 imágenes obtenidas a partir de nuestra base de datos, 968 (34%) se consideraron elegibles ya que no presentaron ningún criterio de exclusión para su análisis por ML. Nevus, melanomas y carcinomas basocelulares fueron las lesiones más frecuentes de nuestra base de datos. Solo el 64,7% de los nevus y el 36,6% de los melanomas no tenían ningún criterio de exclusión (tabla 1). De los 528 melanomas, 335 (63,4%) fueron excluidos. La ausencia de piel circundante normal (40,5% de todos los

Discusión

El melanoma representa la causa más frecuente de muerte por neoplasias cutáneas. El diagnóstico y el tratamiento precoz mejoran significativamente su pronóstico. Se requiere el desarrollo de un método de detección que sea eficaz. La clasificación automática de imágenes a partir del reconocimiento de patrones puede alcanzar una precisión diagnóstica similar a la de un dermatólogo experto6. Sin embargo, existen algunas limitaciones que tendrán que ser superadas. Entre ellas se destacan los

Financiación

Este estudio de la Unidad de Melanoma, Hospital Clínic, Barcelona fue financiado en parte por subvenciones del Fondo de Investigaciones Sanitarias P.I. 12/00840, PI15/00956 y PI15/00716 España; por el CIBER de Enfermedades Raras del Instituto de Salud Carlos III, España, cofinanciado por el Fondo Europeo de Desarrollo Regional (FEDER). Unión Europea. Una manera de hacer Europa; por el AGAUR 2014_SGR_603 y 2017_SGR_1134 del Gobierno catalán, España; por una beca de la «Fundació La Marató de TV3,

Conflicto de intereses

Los autores declaran no tener ningún conflicto de intereses.

Agradecimientos

Gracias a nuestros pacientes y a sus familias, que son la razón principal de nuestros estudios; a las enfermeras de la Unidad de Melanoma del Hospital Clínic de Barcelona, Daniel Gabriel, Pablo Iglesias y María E. Moliner por ayudar a recopilar datos de pacientes y a Paul Hetherington por ayudar con la edición y la corrección al inglés del manuscrito.

Bibliografía (8)

  • D.S. Gareau et al.

    Digital imaging biomarkers feed machine learning for melanoma screening

    Exp Dermatol.

    (2017)
  • Y. Fujisawa et al.

    Deep-learning-based, computer-aided classifier developed with a small dataset of clinical images surpasses board-certified dermatologists in skin tumour diagnosis

    Br J Dermatol.

    (2018.)
  • M.A. Marchetti et al.

    Results of the 2016 International Skin Imaging Collaboration International Symposium on Biomedical Imaging challenge: Comparison of the accuracy of computer algorithms to dermatologists for the diagnosis of melanoma from dermoscopic images

    J Am Acad Dermatol.

    (2018)
  • P. Tschandl et al.

    The HAM10000 dataset, a large collection of multi-source dermatoscopic images of common pigmented skin lesions

    Sci Data.

    (2018)
There are more references available in the full text version of this article.

Cited by (11)

View all citing articles on Scopus
View full text