Scientific journal
International Journal of Applied and fundamental research
ISSN 1996-3955
ИФ РИНЦ = 0,593

DETERMINING THE PRESENCE OF MELANOMA BY ANALYZING A DERMATOSCOPIC IMAGE USING A CONVOLUTIONAL NEURAL NETWORK

Chudakov G.A. 1 Dzhunkovskiy A.V. 1
1 Moscow Polytechnical University
The purpose of the study is the applicability of neural networks and computer vision technologies in the diagnosis of melanoma of the skin. Now there are software products for the analysis of images from a conventional smartphone camera that warn a person about the high probability of the presence of a malignant process and the need to consult a doctor. Any data on the accuracy of diagnostics using these programs are not freely available and purely theoretically, these programs are more entertaining than research since their verdict is most often, “You should not / should consult a doctor.” The scientific novelty of this development lies in the fact that dermatoscopic images obtained using professional equipment are analyzed, since it is such images that are analyzed in everyday medical practice. The hypothesis is that the neural network is able to diagnose dermatoscopic images suspicious of melanoma with a quality commensurate with a sufficiently experienced doctor. There are similar foreign studies in which it is shown that the neural network is able to determine the presence of melanoma from a dermatoscopic image with an accuracy no worse than the average oncologist. To test the neural network, a dataset and a transcript to it, which was compiled by an oncologist. Result of the study is a prototype of a neural network, which was developed, and a number of experiments, which consisted in evaluating dermatoscopic images by a neural network and comparing them with data from decoding.
melanoma
neural networks
convolutional neural networks
big data
image classification

На сегодняшний день меланома является одним из самых опасных видов рака. Заболеваемость в России, по статистике, составляет около 8700 случаев в год [1].

Первичная диагностика меланомы представляет собой довольно сложный процесс. Для успешного диагностирования к опыту врача-онколога должно быть приложено оборудование соответствующего качества. И если со вторым фактором в последнее время есть некоторые положительные сдвиги, то с первым, к сожалению, ситуация сложнее. Опытных врачей-онкологов, специализирующихся в области дерматоскопии, в России не так много, как хотелось бы. Особенно ценны специалисты, способные распознать опасное образование на самой ранней стадии, заподозрить так называемую меланому in situ, тем самым существенно повысить шансы пациента на полное выздоровление. Ведь именно от стадии обнаружения меланомы существенно зависят показатели выживаемости больных [2]. На рис. 1 представлен график, описывающий выживаемость пациентов.

missing image file

Рис. 1. График выживаемости в зависимости от стадий заболевания

По итогам исследования были проведены сравнения результатов нейронной сети с заключениями врачей-онкологов, и мнение врачей на 86 % совпадало с ответом нейронной сети, что можно считать хорошим результатом, не уступающим результатам зарубежных исследований [3].

Цель данной работы заключается в доказательстве гипотезы, которая заключается в том, что нейронная сеть способна диагностировать подозрительные в отношении меланомы дерматоскопические снимки с качеством, соизмеримым с достаточно опытным врачом.

Материалы и методы исследования

При определении меланомы по дерматоскопическим снимкам в качестве одного из критериев для постановки диагноза часто используют так называемую систему ABCDE [4]: Asymmetry (асимметрия), Border (края), Color (цвет), Dimension (диаметр), Evolution (развитие). Принимаются во внимание также факторы, перечисленные на рис. 2.

Исходя из того, что дооперационное диагностирование меланомы, как показано выше, происходит визуальным путем, возникает идея привлечения к данной проблеме нейронных сетей, которые с успехом справляются с задачами классификации изображений в других предметных областях. Например, VGG16 – модель сверточной нейронной сети, предложенная K. Simonyan и A. Zisserman из Оксфордского университета в статье [5]. Модель достигает точности 92,7 % – топ-5 при тестировании на ImageNet в задаче распознавания объектов на изображении.

missing image file

Рис. 2. Факторы, характерные для меланомы

Были поставлены две задачи:

1. Разработать сверточную нейронную сеть.

2. Провести ряд тестов, используя наборы графических данных, которые были отобраны и классифицированы врачом-онкологом.

Для обучения нейронной сети был собран датасет из 3300 снимков [6], который был классифицирован по двум категориям:

1. Невус с подозрением на наличие меланомы.

2. Обычный невус.

Также к данному датасету были добавлены изображения, полученные в повседневной врачебной практике врачами специализированной клиники Меланома-Юнит и некоторыми другими специалистами, изъявившими желание помочь проведению данного исследования. Всего к первичному датасету было добавлено около 700 снимков. В таблице можно ознакомиться с соотношением количества изображений каждой категории в двух наборах.

Наборы графических данных

Тип набора изображений

Невус с подозрением на наличие меланомы

Обычный невус

Обучающий набор

500

3500

Набор для тестирования

600

600

Следует отметить, что полученный датасет весьма несимметричен: количество снимков меланом существенно меньше, чем количество снимков обычных невусов. Этот факт объясняется естественными причинами, поскольку частота выявления меланомы среди общего числа дерматологических исследований невелика.

Для разработки прототипа нейронной сети использовалась библиотека TensorFlow. Схема разработанной модели нейронной сети представлена на рис. 3.

missing image file

Рис. 3. Схема модели нейронной сети

Были созданы ядра свертки, которые устанавливают ограничивающие правила, учитывая входные данные слоя, такие как фильтры и размеры ядер слоя, для получения тензоров выходных данных, где тензор – алгебраический объект, который описывает связь между векторами в едином пространстве, затем данные слои связываются друг с другом и создают единую модель, через которую и будут проходить макроснимки [7, 8]. Разработанная модель состоит из 26 слоев.

Нейронная сеть была обучена на описанном выше датасете и протестирована на данных, не использовавшихся при ее обучении. По итогам испытаний ответ нейронной сети совпал с мнением группы высококвалифицированных врачей онкологов-дерматологов в 86 % случаев. Некоторые из проверочных дерматоскопических снимков приведены на рис. 4, 5.

missing image file

Рис. 4. Обычные невусы

missing image file

Рис. 5. Невусы с подозрением на наличие меланомы

Также был произведен эксперимент по выявлению применимости к поставленной задаче иных моделей нейронной сети. Эксперимент проводился с помощью Microsoft ML Builder. В результате при минимальном количестве итераций наилучший результат, по мнению данного инструмента, показала глубокая нейронная сеть модели ResNet50.

На рис. 6 и 9 изображены злокачественные образования, и нейронная сеть на 75+% утверждает, что они являются меланомой.

missing image file

Рис. 6. Случайное изображение из датасета с меланомой

missing image file

Рис. 7. Случайное изображение из датасета с доброкачественным образованием

missing image file

Рис. 8. Случайное изображение из датасета с доброкачественным образованием

missing image file

Рис. 9. Случайное изображение из датасета с меланомой

На рис. 7 и 8 изображены доброкачественные образования, но при этом нейронная сеть больше склоняется к тому, что они злокачественные.

При изучении статьи ResNet (34, 50, 101): «остаточные» CNN для классификации изображений [9] было рассмотрено все семейство ResNet моделей от 18-слойной части до 152-слойной. На рис. 10 можно увидеть таблицу, в которой описывается, из каких слоев состоит каждая из моделей (18-слойная, 34-слойная, 50-слойная, 101-слойная и 152-слойная), а также трудозатратность вычислений каждой из них.

Также в статье присутствуют результаты работы разных моделей нейронных сетей и статистика их ошибок на датасете ImageNet и PASCAL VOC. В датасете присутствуют сложные изображения, на которых расположены объекты, которые могут подходить под несколько меток сразу или входить только в одну категорию.

По результатам эксперимента, описанного в статье [8], при классификации изображений лучший результат показывает ResNet-152, показывая лучшую точность, чем семейство моделей VGG, поэтому требуется провести эксперимент по вычислению лучшей модели для задачи выявления наличия или отсутствия невуса (рис. 11).

top-1 err – данная оценка показывает, совпадает ли высший класс, который имеет наибольшую вероятность, с целевой меткой;

missing image file

Рис. 10. Таблица слоев ResNet18-152

missing image file

Рис. 11. Частота ошибок (%) для одной модели в наборе валидации ImageNet

top-5 err – данная оценка показывает, является ли целевая метка одним из ваших топ-5 прогнозов (5 с наибольшей вероятностью).

Чем меньше каждая из оценок, тем больше совпадение.

Полученный результат демонстрирует, что заявленная гипотеза действительно подтверждает, что использование нейронных сетей в анализе дерматоскопических снимков с изображенными на них невусами, целесообразна, так как результаты работы прототипа собственной нейронной сети и врачи из Меланома Юнит поставили одинаковый диагноз в 86 % случаев, что близко к медицинской практике профессионального врача-онколога.

Также опыт отечественных и зарубежных разработок с использованием уже готовых нейронных сетей и нейронных сетей с иной структурой показывает, что можно улучшить данный результат, унаследовав опыт и модернизируя на его основе прототип.

Заключение

Использование нейронных сетей в дерматоскопии открывает спектр возможностей в первичной диагностике меланомы, что может предоставить дополнительный способ первичного выявления меланомы (сервис второго мнения) и, возможно, заменит отсутствие возможности консультации у квалифицированного врача онколога-дерматолога.