ИИ с интеллектом роя учится обнаруживать рак, болезни легких и COVID-19

Сообщества получают выгоду от обмена знаниями и опытом между своими членами. Следуя аналогичному принципу, называемому «обучение роем», международная исследовательская группа обучила алгоритмы искусственного интеллекта обнаруживать рак крови, заболевания легких и COVID-19 в данных, хранящихся децентрализованно. Этот подход имеет преимущество перед традиционными методами, поскольку он по своей сути обеспечивает технологии сохранения конфиденциальности, которые облегчают межсайтовый анализ научных данных. Таким образом, роевое обучение могло бы значительно способствовать и ускорить сотрудничество и обмен информацией в исследованиях, особенно в области медицины. Об этом в научном журнале Nature сообщают эксперты DZNE, Боннского университета, компании информационных технологий Hewlett Packard Enterprise (HPE) и других исследовательских институтов..

Наука и медицина становятся все более цифровыми. Анализ полученных объемов информации, известный как « большие данные », считается ключом к лучшим вариантам лечения. «Данные медицинских исследований – это настоящее сокровище. Они могут сыграть решающую роль в разработке индивидуализированных методов лечения, которые более точно подходят для каждого человека, чем традиционные методы лечения», – сказал Иоахим Шульце, директор по системной медицине DZNE и профессор Life & Medical Sciences. Институт (LIMES) при Боннском университете. «Для науки критически важно иметь возможность использовать такие данные как можно полнее и из как можно большего числа источников».

Однако обмен данными медицинских исследований в разных местах или даже между странами регулируется правилами защиты данных и суверенитета данных. На практике эти требования обычно можно реализовать, приложив значительные усилия. Кроме того, существуют технические препятствия: например, когда огромные объемы данных должны быть переданы в цифровом виде, линии данных могут быстро достичь предела производительности. Ввиду этих условий, многие медицинские исследования ограничены локальными рамками и не могут использовать данные, доступные где-либо еще.

Данные остаются на сайте

В свете этого исследовательское сотрудничество под руководством Иоахима Шульце протестировало новый подход к оценке данных исследований, хранящихся в децентрализованном виде. Основой для этого послужила еще молодая технология Swarm Learning, разработанная HPE. Помимо ИТ-компании, в исследовании приняли участие многочисленные исследовательские институты из Греции, Нидерландов и Германии, включая участников «Немецкой инициативы COVID-19 OMICS» (DeCOI).

Swarm Learning сочетает в себе особый вид обмена информацией между различными узлами сети с методами из набора инструментов «машинного обучения», ветви искусственного интеллекта (AI). Основой машинного обучения являются алгоритмы, которые обучаются на данных для обнаружения закономерностей в них – и, следовательно, приобретают способность распознавать изученные закономерности и в других данных. «Swarm Learning открывает новые возможности для сотрудничества в области медицинских исследований, а также в бизнесе. Ключевым моментом является то, что все участники могут учиться друг у друга без необходимости делиться конфиденциальными данными», – сказал д-р Энг Лим Го, старший вице-президент и руководитель Специалист по технологиям искусственного интеллекта в HPE.

Фактически, с Swarm Learning все данные исследований остаются на месте. Распространяются только алгоритмы и параметры – в некотором смысле извлеченные уроки. «Swarm Learning естественным образом удовлетворяет требованиям защиты данных», – подчеркнул Йоахим Шульце.

Совместное обучение

В отличие от «федеративного обучения», при котором данные также остаются локально, централизованного командного центра нет, пояснил боннский ученый. «Swarm Learning происходит в кооперации на основе правил, о которых все партнеры заранее согласовали. Этот набор правил фиксируется в блокчейне». Это своего рода цифровой протокол, который регулирует обмен информацией между партнерами в обязательном порядке, он документирует все события, и все стороны имеют к нему доступ. «Блокчейн – это основа Swarm Learning», – сказал Шульце. «Все члены роя имеют равные права. Нет центральной власти над тем, что происходит и над результатами. Так что в некотором смысле нет паука, управляющего паутиной данных».

Таким образом, алгоритмы ИИ обучаются локально, а именно на основе данных, доступных в каждом сетевом узле. Результаты обучения каждого узла собираются в виде параметров через блокчейн и интеллектуально обрабатываются системой. Результат, то есть оптимизированные параметры, передаются всем сторонам. Этот процесс повторяется несколько раз, постепенно улучшая способность алгоритмов распознавать шаблоны в каждом узле сети.

Изображения легких и молекулярные особенности

В настоящее время исследователи предоставляют практические доказательства этого подхода посредством анализа рентгеновских изображений легких и транскриптомов: последние представляют собой данные об активности генов клеток. В текущем исследовании основное внимание уделялось иммунным клеткам, циркулирующим в крови, другими словами, лейкоцитам. «Данные об активности генов клеток крови подобны молекулярным отпечаткам пальцев. Они содержат важную информацию о том, как организм реагирует на болезнь», – сказал Шульце. «Транскриптомы доступны в большом количестве, как и рентгеновские снимки, и они очень сложны. Это именно та информация, которая вам нужна для анализа искусственного интеллекта. Такие данные идеально подходят для тестирования Swarm Learning».

Исследовательская группа рассмотрела в общей сложности четыре инфекционных и неинфекционных заболевания: два варианта рака крови (острый миелоидный лейкоз и острый лимфобластный лейкоз), а также туберкулез и COVID-19. Данные включали в общей сложности более 16 000 транскриптомов. Сеть обучения роя, по которой распределялись данные, обычно состояла как минимум из трех и до 32 узлов. Независимо от транскриптомов, исследователи проанализировали около 100000 рентгеновских снимков грудной клетки. Это были пациенты с накоплением жидкости в легких или другими патологическими находками, а также люди без аномалий. Эти данные были распределены по трем различным узлам.

Высокий уровень успеха

Анализ транскриптомов и рентгеновских изображений проводился по одному и тому же принципу: во-первых, исследователи вводили в свои алгоритмы подмножества соответствующего набора данных. Сюда входила информация о том, какие образцы взяты от пациентов, а какие от лиц, не обнаруживших результатов. Распознавание заученных образов для «больного» или «здорового» затем использовалось для классификации дальнейших данных, другими словами, оно использовалось для сортировки данных по выборкам с заболеванием или без него. Точность, то есть способность алгоритмов различать здоровых и больных людей, составляла в среднем около 90 процентов для транскриптомов (каждое из четырех заболеваний оценивалось отдельно); в случае рентгеновских данных – от 76 до 86 процентов.

«Эта методика лучше всего работает при лейкемии. При этом заболевании характерные признаки активности генов особенно заметны и, следовательно, их легче всего обнаружить искусственному интеллекту. Инфекционные заболевания более разнообразны. Тем не менее, точность также была очень высокой для туберкулеза и COVID-19. Для рентгеновских данных частота была несколько ниже, что связано с более низкими данными или качеством изображения », – прокомментировал результаты Шульце. Таким образом, наше исследование доказывает, что Swarm Learning может быть успешно применен к самым разным данным. В принципе, это применимо к любому типу информации, для которой полезно распознавание образов с помощью искусственного интеллекта. Будь то данные генома, рентгеновские снимки, данные из изображений мозга или других сложных данных “.

Исследование также показало, что Swarm Learning дало значительно лучшие результаты, чем когда узлы в сети обучались по отдельности. «Каждый узел извлекает выгоду из опыта других узлов, хотя всегда доступны только локальные данные. Таким образом, концепция Swarm Learning прошла практическую проверку», – сказал Шульце.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *