и сильной исходящей связью с элементом «овощи» в выходном слое.
Чтобы заставить такие сети работать, нужно уметь их обучать. Основная загвоздка — связи, соединяющие входной слой с промежуточным: так как элементы промежуточного слоя нам недоступны, их догадки нельзя сверить с «правильными» значениями, заданными учителем. Это препятствие удалось преодолеть в 1980-е гг. с изобретением обучающего алгоритма обратного распространения ошибки. На первом этапе несовпадение догадки каждого из выходных элементов с верным ответом используется для настройки весовых коэффициентов связей выходного слоя со скрытым — так же, как в двухслойных нейросетях. Затем сумма этих ошибок распространяется в обратном направлении на каждый из промежуточных элементов, настраивая связи входного слоя со скрытым. На первый взгляд кажется, что такая конструкция не может работать, но, если прогнать через сеть пару миллионов обучающих примеров, связи первого и второго яруса приобретают довольно стабильные весовые коэффициенты, позволяющие сети отделять овнов от козлищ. Не менее удивительно, что скрытые элементы способны спонтанно обнаруживать абстрактные категории, например «грибы» или «корнеплоды и клубни», если они нужны для классификации. Но гораздо чаще скрытые элементы соответствуют чему-то такому, для чего у нас и слов-то нет. Они задействуют любые сложные формулы, помогающие выполнить поставленную задачу, скажем «самая малость этого признака, но не слишком много того — кроме случая, когда этого вот третьего признака ну очень много».
Во втором десятилетии XXI в. производительность компьютеров взлетела до небес благодаря развитию графических процессоров, а объем доступных для обучения данных становился все больше по мере того, как миллионы пользователей загружали в глобальную сеть тексты и изображения. Специалисты получили возможность сажать многослойные нейросети на мегавитамины, оснащая их двумя, пятнадцатью или даже тысячей скрытых слоев и натаскивая их на миллиардах или даже триллионах примеров. Такие сети называются системами глубокого обучения — не потому, что они претендуют на глубокое понимание чего бы то ни было, но благодаря глубоко спрятанным промежуточным слоям элементов. Эти системы на наших глазах привели к «великому пробуждению искусственного интеллекта», которое одарило нас первыми работоспособными приложениями, умеющими распознавать речь и образы, отвечать на вопросы, переводить с одного языка на другой и т. д. [143]
Нейросети глубокого обучения во многом превосходят «старый добрый искусственный интеллект», который делает подобные логическим выводы из на основе запрограммированных вручную правил и посылок [144]. Контраст тут разителен: в отличие от логического вывода, внутренние механизмы работы нейросети для человека непостижимы. Почти любой из миллионов скрытых элементов не соответствует никакой целостной концепции, доступной нашему пониманию, и даже специалисты, тренирующие нейросети, не могут объяснить, каким образом эти системы приходят к тому или иному ответу. Вот почему многие техноскептики опасаются, что, если вверить системам искусственного интеллекта решения, касающиеся судеб людей, они могут наделать ошибок, которых никто не успеет заметить и исправить [145]. В 2018 г. Генри Киссинджер предостерегал: так как системы глубокого обучения не используют суждения, которые мы можем проверить или подтвердить, они предвещают конец эпохи Просвещения [146]. Это, конечно, преувеличение, но контраст между логическими и нейросетевыми вычислениями очевиден.
Можно ли назвать мозг человека большой системой глубокого обучения? Конечно, нет — по массе причин, но имеющееся между ними сходство многое объясняет. Мозг состоит из примерно сотни миллиардов нейронов, соединенных сотнями триллионов синапсов, и к моменту, когда человеку исполняется 18 лет, он уже на протяжении более чем 300 млн секунд бодрствования вбирал в себя примеры из внешней среды. Он умеет сравнивать предмет с образцом на основе паттернов и проводить ассоциации точно так же, как это делают системы глубокого обучения. Эти сети были созданы специально для обработки расплывчатых категорий семейного сходства, составляющих львиную долю нашего понятийного репертуара. Таким образом, нейросети дают нам ключ к пониманию той части человеческого мышления, которая рациональна, но, строго говоря, не может быть названа логической. Они снимают покров тайны с трудно формулируемых, но порою поразительных мыслительных способностей, которые мы называем интуицией, инстинктом, нюхом, ясновидением и шестым чувством.
* * *
При всех тех удобствах, что привносят в нашу жизнь Siri и Google Translate, не стоит думать, будто нейронные сети сделали логику ненужной. Эти системы, руководствующиеся туманными ассоциациями и не способные осуществлять синтаксический анализ или сверяться с правилами, могут быть на удивление глупыми [147]. Если вы запросите в Гугле «рестораны быстрого питания поблизости, но только не McDonald’s», он выдаст вам список всех «Макдоналдсов» в радиусе 50 км. Поинтересуйтесь у Siri, «пользовался ли Джордж Вашингтон компьютером», и она перенаправит вас на страницу с компьютерной реконструкцией внешности Джорджа Вашингтона или на сайт вычислительного центра Университета Джорджа Вашингтона. Модули машинного зрения, которые когда-нибудь будут управлять автомобилями, сегодня то и дело путают дорожные знаки с холодильником, а перевернутые машины — с боксерской грушей, пожарным катером или санками.
Человеческая рациональность — гибридная система [148]. Наш мозг оснащен устройствами ассоциативного анализа паттернов, улавливающими черты семейного сходства и в огромных количествах накапливающими статистические подсказки. Но при этом в мозге есть и оперирующий логическими символами аппарат, способный составлять из понятий высказывания и делать из них выводы, — называем ли мы его системой 2, или рекурсивным познанием, или мышлением по заданным правилам. Формальная логика — это инструмент, который позволяет усовершенствовать и расширить этот тип мышления, избавляя его от врожденных дефектов, обусловленных социальностью и эмоциональностью нашего вида.
Поскольку логическое мышление помогает освободиться от сходства и стереотипов, именно ему мы обязаны высочайшими достижениями человеческой рациональности: наукой, моралью и правом [149]. Несмотря на то что дельфины обладают семейным сходством с рыбами, правила, по которым определяется принадлежность к линнеевским таксонам (например, «если животное выкармливает детенышей молоком, то оно — млекопитающее»), сообщают нам, что на самом деле дельфины — не рыбы. С помощью похожих цепочек категориальных суждений мы обнаруживаем, что человек — обезьяна, солнце — звезда, а твердые тела по большей части состоят из пустого пространства. В социальной сфере наши механизмы распознавания паттернов легко улавливают, чем люди отличаются друг от друга: некоторые из них богаче, умнее, сильнее, проворнее, симпатичнее и больше похожи на нас, чем другие. Но, согласившись с утверждением, что все люди созданы равными («Если Х — человек, то у Х есть права»), мы можем игнорировать эти поверхностные впечатления при решении правовых или моральных вопросов, одинаково относясь к любому человеку.
Глава 4. Вероятность и случайность
Тысячи историй, о которых судачат и в которые верят невежи, моментально разваливаются,