Если мы рассмотрим переменную «посещаемость»,
SПосещаемость выше 95 % = -0,33∙log (0,33) — 0,67∙log (0,67) = 0,64;
SПосещаемость выше 95 % = -1∙log(1) = 0
В качестве дискриминантной переменной мы выберем «посещаемость», так как для нее характерна меньшая энтропия.
Метод построения деревьев принятия решений и, следовательно, метод обучения деревьев прост и элегантен, однако обладает двумя значительными недостатками.
Первый из них состоит в том, что задачи с большим числом переменных решаются очень медленно. Второй, более серьезный, заключается в том, что результатом работы алгоритма будет не глобальный, а локальный оптимум. Иными словами, так как дерево всегда анализируется не полностью, а по отдельным уровням, возможно, что на каком-то этапе определенная переменная будет выбрана потому, что она снижает энтропию на своем уровне, однако при выборе другой переменной общее решение будет более оптимальным.
Чтобы повысить качество решений, получаемых с помощью деревьев, часто используются так называемые леса: с помощью различных методов производится обучение нескольких деревьев, а итоговый прогноз формируется с учетом результатов, полученных для каждого дерева..
В рамках этого подхода при обучении леса деревья принятия решений чаще всего строятся путем случайного выбора переменных. Иными словами, если мы хотим обучить 100 деревьев, составляющих лес, то для каждого дерева выберем пять случайных переменных и произведем обучение только с этими пятью переменными. Этот приближенный метод носит поэтическое название random forest («случайный лес»).
Глава 4. Автоматическое планирование и принятие решений
Описанные ниже события могли произойти в любой день.
14:32 — грузовик, двигавшийся по второстепенной дороге с превышением скорости, перевернулся. Водитель получил сильный ушиб головы.
14:53 — на место аварии прибыли пожарные и скорая помощь, которые за несколько минут извлекли из машины водителя в бессознательном состоянии и с серьезной черепно-мозговой травмой.
15:09 — машина скорой помощи прибыла в больницу, где реаниматологи диагностировали смерть мозга водителя.
15:28 — была установлена личность водителя, о его смерти сообщили родственникам.
16:31 — группа психологов связалась с семьей погибшего, чтобы оказать эмоциональную поддержку и получить согласие на передачу донорских органов, не пострадавших при аварии.
16:36 — после непродолжительных споров родственники согласились передать врачам почки умершего (далее — донора).
16:48 — бригада хирургов начала удаление почек и их обследование. Параллельно с этим администрация больницы улаживала необходимые бюрократические формальности.
17:24 — после завершения операции в информационную систему были введены биологические данные донора и характеристики его органов.
Так начинается трансплантация органов.
Как происходит трансплантация17:24 — информационная система мгновенно определила двух реципиентов донорских почек, отправила им уведомление и выделила необходимые ресурсы для перевозки. В первом случае для перевозки почки в соседний город на расстояние 30 километров потребовалось подготовить машину скорой помощи. Во втором случае почка была доставлена самолетом в город, находящийся в 450 километрах, где действовала иная автономная медицинская система. Перевозка второй почки из больницы в ближайший аэропорт была произведена на вертолете. Все необходимые мероприятия были проведены информационной системой автоматически. Одновременно с этим система выполнила большую часть юридических процедур в соответствии с требованиями систем здравоохранения в городах донора и реципиента.
18:10 — началась первая операция по пересадке почки в больнице соседнего города.
19:03 — началась вторая операция в городе, расположенном в 450 километрах.
21:00 — оба реципиента получили необходимые лекарства и иммунодепрессанты.
Обе операции прошли успешно.
Почему испанская система пересадки донорских органов считается одной из лучших в мире? Какие особенности этой системы отличают ее от систем других стран с более высоким уровнем развития науки и техники? Почему Европейская комиссия рассматривает возможность внедрения испанской модели во всех странах Евросоюза? Как уже читатель наверняка догадался, испанская процедура трансплантации основана на мощной интеллектуальной системе, доступ к которой имеют все больницы страны. Эта система не только учитывает потребности и характеристики каждого реципиента и все логистические детали, но также сложность и неоднородность правовых норм, связанных с пересадкой органов, в разных регионах.
Указанная интеллектуальная система состоит из множества относительно простых узкоспециализированных информационных систем, формирующих мощный «коллективный разум» (так называемая многоагентная система). Именно поэтому Испания в сфере трансплантации органов занимает первое место в мире. Система координирования трансплантации, как правило, имеет многоуровневую структуру, в которой выделяются национальный, зональный, региональный уровни и отдельные больницы. На уровне отдельных больниц данные реципиентов могут распределяться по сети больниц или же содержаться в централизованном хранилище данных.
В силу указанных выше особенностей существует множество интеллектуальных агентов, управляющих информацией обо всех реципиентах. С этими агентами непрерывно обмениваются данными другие интеллектуальные агенты, которые задействуются всякий раз, когда становятся доступны донорские органы. Другие агенты системы занимаются самыми разными аспектами, к примеру планируют и распределяют логистические ресурсы для перевозки органов или решают административные вопросы согласно требованиям различных региональных систем здравоохранения.
* * *
ГОЛУБИНЫЙ РЕЙТИНГ
Известнейшая компания Google пользуется огромным авторитетом в мире компьютерных технологий и искусственного интеллекта. Священный Грааль Google — алгоритм, используемый для ранжирования результатов поиска, к которому несколько миллионов раз в секунду обращаются пользователи со всего мира. Этот алгоритм привлек огромный интерес, и в Google поступило столько обращений с просьбами опубликовать его, что утром 1 апреля 2002 года на главной странице поисковика была размещена ссылка, которая вела на описание алгоритма ранжирования. Этот алгоритм назывался pigeon ranking («голубиный рейтинг»), и такое название было выбрано не случайно. В статье, расположенной по ссылке, объяснялось, что Google располагал установками, заполненными PC (от английского pigeon cluster — «голубиный кластер»; это же сокращение обозначает «персональный компьютер»). Перед каждым голубем находились экран и клавиатура. В описании алгоритма указывалось, что всякий раз, когда пользователь вводит запрос в Google, все сайты, удовлетворяющие поисковому запросу, отображаются перед одним из голубей, который затем начинает клевать кнопки на клавиатуре. После этого сайты упорядочиваются в зависимости оттого, сколько раз голубь нажмет на кнопки.
В этой же статье объяснялось, как Google работает с голубями, как они живут и в каких условиях содержатся. Также упоминалось, что в Google пробовали использовать других пернатых, в частности кур и хищных птиц, но больше всего для выполнения задачи подошли именно голуби.
Автор статьи даже осмелился указать, что пусть ни один голубь еще не стал членом Конституционного суда, была доказана их эффективность как авиадиспетчеров и футбольных арбитров.
Многие инженеры и конкуренты Google не сразу поняли, что статья была опубликована 1 апреля — в День смеха, который отмечается в многих странах, в том числе в США.
* * *
Упрощенный пример сети агентов, отвечающей за координацию перевозки органов.
Подобная многоагентная интеллектуальная архитектура обладает множеством преимуществ. В частности, эта система является отказоустойчивой — если один или сразу несколько агентов откажут, система будет по-прежнему способна решать задачи за счет саморегулирования и задействования других агентов. Еще одно важное преимущество подобной архитектуры заключается в использовании относительно простых, но узкоспециализированных агентов, на основе которых можно выстроить интеллектуальную систему, способную за несколько секунд решать сложные междисциплинарные задачи.
* * *
АГЕНТНО-ОРИЕНТИРОВАННОЕ ПРОГРАММИРОВАНИЕ
Компьютерное программирование — быстро развивающаяся дисциплина. На сегодняшний день существует пять больших семейств языков программирования, наиболее популярным из которых является семейство объектно-ориентированных языков. В объектно-ориентированном программировании все сущности представлены с помощью особых единиц информации, называемых объектами. Объекты имеют ряд атрибутов, где хранят информацию о самих себе, и способны выполнять с этой информацией некоторые операции. Объектно-ориентированное программирование требует вмешательства координаторов, которые обладают интеллектом и постоянно направляют запросы тем или иным объектам при решении задач. Неизменно предполагается, что объект — это элемент, не обладающий интеллектом, который ожидает указаний. Но не так давно мощное развитие получило новое направление программирования — агентно-ориентированное. В нем «неразумные» объекты превращаются в намного более интеллектуальные и автономные агенты, и одновременно снижается роль координатора.