Человек и Интернет медицинских вещей
Теперь мы готовы говорить о медицине и ее возросшей, благодаря нашим цифровым машинам и инфраструктуре, интеллектуальной мощи. В настоящее время количество данных, ежегодное производимое в мире в расчете на одного человека, составляет около одного терабайта, или пяти зеттабайтов, данных в год (или 40 секстильонов). Но вспомните из главы 5, когда мы говорили о человеческой ГИС, что только омики одного человека добавят по крайней мере еще пять терабайтов, а мы еще не достигли даже потокового поступления данных с биодатчиков в режиме реального времени, которые быстро заполонят объем генерируемых сейчас данных. И тем не менее едва ли достаточно добавить другие компоненты ГИС, в частности поток данных в пикселях медицинских снимков и предстоящий шквал информации из Интернета медицинских вещей, чтобы все преобразилось.
Но это, безусловно, не просто история исследования с участием одного человека (N = 1). Как было показано в главе 11, хотя иметь много данных о вас было бы полезно, для того, чтобы сделать данные максимально информативными, нужно сравнить их со всеми данными от каждого человека на планете (рис. 13.4). До всех людей мы никогда не доберемся, тем не менее чем их больше, тем лучше, и компании типа Facebook показывают, что можно сделать.
Главное, что обучение машин, подобных стоящим за IBM Watson и другими системами, позволяет нам идти вширь (N = 7 млрд) и вглубь (N = 1) не просто в поисках знаний, но и в поисках предсказаний и понимания. В отношении каждого человека нам нужно знать пусковые механизмы и сложные взаимосвязи на многочисленных уровнях – геномном, биологическом, физиологическом, средовом, – которые отвечают за предрасположенность к заболеванию или состоянию. Цель – не просто оценить риск в течение жизни человека, а в определенное время или момент. Многое мы узнаем и в результате углубленного исследования максимально возможного количества людей на предмет сигналов, обогащающих наше понимание того, что требуется для проявления болезни или для ее предотвращения. Только сейчас мы можем собрать такие паноромные данные по каждому отдельному человеку и в группах населения, и, обладая способностью управлять и обрабатывать огромные наборы данных, мы оказываемся в завидном положении предсказателей болезни. И, может быть, после того, как мы научимся все это делать хорошо, нам удастся даже предотвращать болезни у некоторых людей.
Предсказание болезни: кто, когда, как, почему и что?
Для начала убедимся в том, что мы различаем понятия «предсказание» и «диагноз». Онлайн-тестеры для проверки симптомов66 пользуются все большей популярностью и вниманием в Интернете и помогают людям проводить «самодиагностику» (с помощью компьютера), но они не предсказывают болезнь. В лучшем случае из набора симптомов, которые вводит человек, предлагается дифференциальная диагностика, и правильный диагноз входит в список вариантов. Это полезно и практично, но это ничего не предсказывает. Точно так же разработчики из Biovideo – которые разрабатывают приложение для суперкомпьютера IBM Watson, чтобы «мать с больным ребенком в четыре утра могла воспользоваться IBM Watson и спросить, что случилось с ее ребенком и получить точный ответ»67а, – могут создать что-то полезное, но это что-то не имеет отношения к прогнозу.
У нас очень серьезная проблема с ошибочной диагностикой: диагноз – неправильный или правильный – ставится пациенту слишком поздно, и эта проблема затрагивает 12 млн американцев в год67b, 67c. Для решения этой проблемы можно обратиться к технологиям и контекстуальным вычислениям. Популярный телесериал «Доктор Хаус» очень поучителен в этом плане. Главный герой, Грегори Хаус, – блестящий диагност, который разбирается с самыми редкими и таинственными случаями, ставящими в тупик других врачей68–71. Для того чтобы этого добиться, он использует байесовский подход, при котором вся информация – история болезни, медосмотр, лабораторные исследования, сканограммы – рассматривается в контексте всей ранее известной, относящейся к делу информации (что известно из теоремы Байеса[49] как клиническая предсказуемость результата испытания). Ответ «да» или «нет» не получается. Скорее, есть вероятность, что у пациента диагноз X или Y. Это можно сравнить с распространенным подходом, предусматривающим «да» или «нет» на основании исключительно статистики вероятности (типа Р < 0,05, где Р – коэффициент вероятности). Модель доктора Хауса идеально подходит для компьютерной автоматизации в медицине, и точно так же работает IBM Watson70, 71. Вероятность предварительного диагноза учитывает всю медицинскую литературу, которая была опубликована до сегодняшнего дня. Когда вы вводите в IBM Watson все имеющиеся данные о конкретном пациенте в поиске диагноза, вы получаете список возможных вариантов. Каждому присваивается вес или вероятность (отношение правдоподобия).
Более того, байесовская модель для диагностики с помощью компьютера быстро становится частью клинической практики и может распространиться на рекомендации по лечению. Информационный ресурс в Сети под названием Modernizing Medicine (Модернизация медицины) включает информацию по более чем 15 млн посещений пациентов и 4000 врачей с лечением и результатами по каждому пациенту72. Так что помимо способности IBM Watson к дифференциальной диагностике может быть генерирован список назначений с взвешенной вероятностью и установлено соответствие данных пациента всем остальным в базе данных. (Кстати, специалистам по обработке и анализу данных, которые работают в здравоохранении, не нравится, когда их информационные ресурсы называют базами данных. Вот так-то!) Все это примеры использования искусственного интеллекта для дифференциальной диагностики и лечения в медицине. Но и это еще не предсказания.
Теперь надо убедиться в том, что сбор несметного количества данных не означает, что вы сможете предсказать что-то значительное. К 100-летию со дня рождения Алана Тьюринга в журнале Science был опубликован ряд материалов, включая статью о «доме, полностью оснащенном камерами и аудиооборудованием, [которые] постоянно записывали жизнь ребенка от рождения до трех лет, в результате набралось ~200 000 часов аудио– и видеозаписей, отображающих 85 % жизни ребенка в периоды бодрствования»73. Хорошо, для сбора данных это триумф, но определенно без намерения или даже какой-либо вероятности предсказать болезнь. Это не упражнение и не эксперимент без заданной гипотезы. Точно так же есть много новых полномасштабных проектов по геномному секвенированию, которые охватывают 100 000 людей, – например, совместный проект компаний Geisenger-Regenerson и Human Longevity, Inc., государственная программа Великобритании Genomics England и инициатива Института системной биологии. В то время как эти программы несомненно внесут вклад в науку о геноме, зачисленные в эти программы люди не относятся ни к какому определенному фенотипу и не выдвигается никаких реальных гипотез. Просто считается, что это можно сделать, и этим стоит заниматься, и что в этих данных может оказаться что-то такое, что приведет к созданию нового лекарства. Однако, чтобы предсказать болезнь, нужны определенные гипотезы и очень точные цели, об этом мы поговорим ниже. В противном случае нас собьет с толку низкий показатель отношения сигнал/шум, убаюкает мысль о том, что у нас имеется полная картина данных по всей Вселенной, и введут в заблуждение ложные взаимосвязи.
Еще одно важное соображение состоит в том, что мы стараемся предсказать серьезную болезнь, а не биомаркер. Мы не пытаемся говорить, что у кого-то будет высокий уровень холестерина или аномальные показатели работы печени. В целом эти белковые или генные маркеры обманчивы, в медицинской литературе описано множество кандидатур, но лишь немногие из них когда-либо обследовались в клинике74. Дело в том, что, хотя результаты анализов могут быть полезны, чтобы помочь предсказать наступление болезни, прежде чем она начнется, этого мало.
Шаг в освоении больших данных для понимания процесса развития болезни предприняли исследователи из Дании, располагавшие информацией за 15 лет по 6,2 млн граждан страны75. Они смогли графически представить многие заболевания в виде так называемых траекторий, чтобы показать, как одна болезнь может в конце концов привести к другой, которая, казалось, никак не связана с первой. Это были временны́е связи без каких-либо установленных причинно-следственных отношений75.
Мы же пытаемся предсказывать так, чтобы можно было предотвратить, это главная цель. Если нет оснований для действий, то предсказание становится скорее научным упражнением. Например, много усилий тратится на попытки предсказать, у кого разовьется болезнь Альцгеймера, задолго до того, как начнутся когнитивные нарушения. Бесспорно, это одна из самых важных проблем здравоохранения, которая перед нами стоит, но на сегодняшний день, несмотря на значительные усилия, нет никаких проверенных превентивных стратегий.