пирамиды. Результат – инвариантная нейронная цепь, допускающая значительные изменения угла обзора. Эта простая идея может быть легко воспроизведена на каждом этапе. Нейроны, отвечающие за распознавание профиля Дженнифер Энистон, собирают информацию от клеток более низких уровней, которые идентифицируют фрагменты ее лица. Эти нейроны способны распознать глаз или нос, потому что предыдущий уровень уже обнаружил паттерны света и тени, совместимые с присутствием этих элементов в конкретном месте на сетчатке.
Понятия иерархии и параллельного функционирования – вот главные ключи к зрительной системе приматов. Мысленный образ, разложенный сетчаткой на множество «пикселей», постепенно собирается заново пирамидой нейронов, работающих одновременно. На первый взгляд такой подход может показаться неэффективным: в таком случае каждому из возможных фрагментов, составляющих зрительную сцену, должны быть посвящены миллионы нейронов. Нагрузка на нервную систему, однако, относительно невелика: все, что мы видим, распределяется по гигантской сети простых параллельных процессоров. Подобно тому, как колония муравьев обладает более высоким интеллектом, нежели один муравей, коллективная работа миллионов нейронов позволяет выполнять операции гораздо более сложные, чем те, на которые способна одна клетка. В действительности огромное количество вычислительных блоков приводит к значительной экономии времени обработки. Одиночные нейроны работают медленно. Они получают и передают информацию примерно за 10 миллисекунд, что в миллион раз медленнее скорости электронного микропроцессора. Однако, объединяя активность миллионов нервных клеток, наша зрительная система становится самым эффективным компьютером в мире: ей требуется всего одна шестая доля секунды, чтобы заметить лицо независимо от его внешних особенностей и пространственного расположения [226].
Архитектура мозга вдохновила многих программистов. В настоящее время доступны несколько компьютерных моделей зрительной иерархии, которые я описал [227]. Лучшие из них близки к человеческой как по скорости, так и по степени искажения изображения, которую они допускают. Благодаря этим искусственным нейросетям автоматическое распознавание лиц больше не воспринимается как что-то из области научной фантастики. Это часть реальной жизни – самая простая цифровая камера сегодня может распознавать лица и улыбки.
Алфавит в мозге обезьяны
Пирамидальная модель предполагает, что нейронный код для любого зрительного объекта состоит из иерархии нервных клеток, каждая из которых обнаруживает наличие некоего фрагмента этого объекта в получаемом изображении. Большинство таких нейронов, вероятно, реагируют на упрощенные и ограниченные виды объектов или их частей. Используя эту гипотезу в качестве отправной точки, японский нейробиолог Кэйдзи Танака сделал любопытное открытие: мозг обезьяны содержит мозаику нейронов, посвященных фрагментам формы. В совокупности эти примитивные очертания образуют своего рода «нейронный алфавит», комбинации которого могут описать любую сложную форму.
Для изучения нейронного кода объектов Танака и его коллеги разработали специальный алгоритм, постепенно упрощавший сложные сцены (рис. 3.6). Они брали образ, который провоцировал энергичные разряды нейрона, а затем сводили его к самой простой возможной форме, которая по-прежнему вызывала возбуждение. Рассмотрим нейрон, изначально реагировавший на вид кошки. Танака обнаружил, что эта клетка так же активно срабатывала при виде двух соприкасающихся дисков. Другому нейрону «нравилась» форма яблока, но он так же хорошо откликался на черный кружок с «хвостиком». Третий нейрон, который срабатывал при виде куба, в действительности обнаруживал только Y-образное пересечение его центральных граней. Иными словами, большинство клеток в нижневисочной коре разряжались независимо от кардинальных упрощений изображения [228].
Записав активность сотен нейронов, Танака смог реконструировать приблизительную мозаику объектных клеток на поверхности коры обезьяны. Предпочтения отдельных нейронов менялись плавно: как правило, соседние клетки кодировали схожие формы (рис. 3.6). Например, один сектор отвечал за варианты Y и T. Другие участки специализировались на формах, напоминавших звезды, упрощенный профиль лица или цифру 8. Танака фактически обнаружил целый корковый каталог элементарных форм. В любом заданном месте коры все нейроны внутри вертикальной корковой колонки «интересовались» более или менее похожими фигурами. При этом каждый из них был чувствителен к мельчайшим метрическим отклонениям от базового прототипа.
В совокупности эти клетки обеспечивают алфавит форм, который позволяет классифицировать любое изображение (лицо это или нет?) и выделить его детали, ответив на вопросы: Это лицо Дженнифер Энистон? Сколько ей лет? Она счастлива? Объединяя отклики миллионов таких детекторов, мозг кодирует каждую из миллиардов картинок, которые мы можем увидеть в природе.
Один из учеников Танаки, Манабу Танифудзи, продолжил исследования в этом направлении и выяснил, как множественные колонки нейронов кодируют произвольные объекты. В своих экспериментах он использовал оптическую запись, которая позволила увидеть большую часть коркового кода, связанного со зрительным объектом [229]. Всякий раз, когда мозг активируется, количество света, которое он отражает, уменьшается (механизм этого явления до конца не изучен). Танифудзи измерял нейронную активность всей области мозга с помощью чувствительной видеокамеры, фиксирующей крошечные изменения в отражении света на поверхности коры. С помощью мощного зум-объектива камера отслеживает активные структуры, расположенные на расстоянии всего нескольких десятых миллиметра друг от друга – примерно такого же размера были колонки Танаки, кодировавшие формы.
В одном эксперименте Танифудзи показывал обезьяне изображение огнетушителя. Идея состояла в том, чтобы стимулировать кору предметами, в распознавании которых эволюция не могла сыграть никакой роли. Корковая мозаика, кодировавшая этот объект, проявилась в виде разреженного массива темных пятен – зон выраженной нейронной активности. Эта «корковая опись» огнетушителя возникала всякий раз, когда Танифудзи показывал его обезьяне. Затем ученый убрал рукоятку и шланг. При виде только красного баллона некоторые пятна исчезли, зато другие остались такими же активными. Что еще удивительнее, в этом случае «вспыхнули» новые пятна. Другими словами, как только менялся внешний вид объекта, каждому новому изображению немедленно приписывался уникальный нейронный код.
Рис. 3.6. Упрощение изображения позволяет выявить микротопографию височной коры. Сложный стимул, активирующий нейрон, постепенно упрощается, пока не будет найден наиболее простой образ, по-прежнему вызывающий сильную реакцию (вверху). Некоторые из минимальных форм напоминают буквы (O, T, Y, E и так далее). Реагирующие на них нейроны организованы в вертикальные колонки, перпендикулярные коре головного мозга. В этом положении предпочитаемые формы непрерывно варьируются, образуя локальные секторы «избранной» фигуры (по материалам статьи Tanaka, 2003). Использовано с разрешения Cerebral Cortex.
Регистрируя активность отдельных нейронов в каждом из пятен, Танифудзи смог пролить свет на лежащий в основе комбинаторный код. В одном месте нейроны реагировали на вид одной только рукоятки, а также на любую V-образную форму, похожую на