адаптировать архитектуру AlphaZero для выполнения многих простых вещей, которые делают люди, таких как проведение аналогий, игры с менее строгими правилами или изучение языка, что мастерски делают сотни миллионов годовалых детей каждый год.
Интеллект AlphaZero в шахматах также очень специфичен. Хотя шахматные ходы AlphaZero в рамках правил игры впечатляют, они не включают в себя тот тип творчества, которым регулярно занимаются люди, например проведение аналогий между неструктурированными, разрозненными средами и поиск решений новых и разнообразных проблем.
Даже GPT-3, хотя и более универсальный, и впечатляющий, чем AlphaZero, демонстрирует те же ограничения. Он не может выполнять задачи, выходящие за рамки тех, для которых он был предварительно обучен, и не проявляет способности к суждению, поэтому противоречивые или необычные инструкции могут поставить его в тупик. Хуже того, в этой технологии нет ни элемента социального или ситуационного интеллекта человека. GPT-3 не может рассуждать о контексте, в котором находятся выполняемые им задачи, и использовать причинно-следственные связи, существующие между действиями и последствиями. В результате он иногда неправильно понимает даже простые инструкции и не надеется адекватно реагировать на изменяющуюся или совершенно новую обстановку.
На самом деле, эта дискуссия иллюстрирует более широкую проблему. Статистические подходы, используемые для распознавания образов и прогнозирования, плохо подходят для отражения сути многих человеческих навыков. Начнем с того, что эти подходы испытывают трудности с ситуационной природой интеллекта, поскольку точную ситуацию трудно определить и закодировать.
Другой извечной проблемой статистических подходов является "чрезмерная подгонка", которая обычно определяется как использование большего количества параметров, чем оправдано для подгонки некоторой эмпирической зависимости. Опасение заключается в том, что чрезмерная подгонка заставляет статистическую модель учитывать нерелевантные аспекты данных, что приводит к неточным прогнозам и выводам. Статистики разработали множество методов предотвращения чрезмерной подгонки - например, разработка алгоритмов на выборке, отличной от той, на которой они применяются. Тем не менее, чрезмерная подгонка остается бельмом на глазу статистических подходов, поскольку она фундаментально связана с недостатками современного подхода к ИИ: отсутствием теории моделируемых явлений.
Чтобы объяснить эту проблему, полезно иметь более широкое представление о проблеме избыточной подгонки, основанной на использовании нерелевантных или непостоянных характеристик приложения. Рассмотрим задачу отличия волков от хаски. Хотя люди прекрасно справляются с этой задачей, она оказывается сложной для ИИ. Когда некоторым алгоритмам удалось добиться хороших результатов, позже стало ясно, что это произошло благодаря чрезмерной подгонке: хаски распознавались на фоне городской среды, например, красивых газонов и пожарных гидрантов, а волки - на фоне природы, например, снежных гор. Это нерелевантные характеристики в двух фундаментальных смыслах. Во-первых, люди не полагаются на этот фон для определения или различения животных. Во-вторых, что еще более тревожно, по мере потепления климата среда обитания волков может измениться, или волков придется идентифицировать в других условиях. Другими словами, поскольку фон не является определяющей характеристикой волков, любой подход, опирающийся на него, приведет к ошибочным прогнозам по мере развития мира или изменения контекста.
Избыточная подгонка особенно опасна для машинного интеллекта, поскольку она создает ложное ощущение успеха, в то время как на самом деле машина работает плохо. Например, статистическая связь между двумя переменными, скажем, температурой и ВВП на душу населения в разных странах, не обязательно указывает на то, что климат оказывает значительное влияние на экономическое развитие. Это может быть просто результат того, как европейский колониализм воздействовал на территории с разными климатическими условиями и в разных частях земного шара в ходе конкретного исторического процесса. Но без правильной теории легко спутать причинно-следственные связи и корреляцию, и машинное обучение часто делает это.
Проблема чрезмерной подгонки становится намного хуже, когда алгоритмы имеют дело с социально значимой ситуацией, в которой люди реагируют на новую информацию. Реакция людей будет означать, что соответствующий контекст часто меняется, или он может измениться из-за действий, которые они предпринимают на основе информации, предоставляемой алгоритмами. Приведем экономическую иллюстрацию. Алгоритм может заметить ошибки, которые человек совершает при поиске работы - например, ищет профессии, где мало вакансий по сравнению с количеством людей, подающих заявления, - и может попытаться исправить их. Процедуры, разработанные против избыточной подгонки, такие как разделение обучающей и тестирующей выборок, не устраняют соответствующую проблему избыточной подгонки: обе выборки могут быть адаптированы к конкретной среде, в которой существует много незаполненных вакансий в розничной торговле. Но это может измениться со временем именно потому, что мы имеем дело с социальной ситуацией, в которой люди реагируют на имеющиеся данные. Например, по мере того, как алгоритмы будут побуждать людей подавать заявки, вакансии в розничной торговле могут стать переполненными и перестать быть такими привлекательными. Без полного понимания этого ситуационного и социального аспекта человеческого познания и того, как динамично меняется поведение, чрезмерная подгонка будет продолжать мешать машинному интеллекту.
Есть и другие тревожные последствия отсутствия у ИИ социального интеллекта. Хотя он использует данные, полученные от большого сообщества пользователей, и таким образом может включать социальное измерение данных, при существующих подходах он не использует тот факт, что человеческое понимание основано на избирательном подражании, общении и аргументации между людьми. В результате многие попытки автоматизации, как представляется, скорее уменьшают, чем увеличивают гибкость, которой хорошо обученные работники могут достичь, быстро и плавно реагируя на изменяющиеся обстоятельства, часто используя навыки и взгляды, которым они учатся у своих коллег.
Конечно, эти аргументы не исключают возможности того, что совершенно новый подход сможет решить проблему AGI в ближайшем будущем. Однако пока нет никаких признаков того, что мы близки к созданию такого подхода. Это также не основная область, в которую инвестируются средства на ИИ. Промышленность по-прежнему сосредоточена на сборе большого количества данных и автоматизации узких задач на основе методов машинного обучения.
Экономическая проблема от такой бизнес-стратегии очевидна: когда люди не так бесполезны, как иногда предполагается, а умные машины не так умны, как обычно предполагается, мы получаем так себе автоматизацию - все перемещения и мало обещанного повышения производительности. На самом деле, даже сами компании не получают большой выгоды от такой автоматизации, и часть внедрения ИИ может быть вызвана шумихой, как отметил бывший ученый в области ИИ Альберто Ромеро, которого мы цитировали ранее: "Маркетинговая сила ИИ такова, что многие компании используют его, сами не зная зачем. Все хотели попасть на волнорез ИИ".
Современный Паноптикон
Другое популярное использование современного ИИ иллюстрирует, как энтузиазм в отношении автономных технологий вместе с массовым сбором данных выковал весьма специфическое направление развития цифровых технологий и как это снова привело к скромным выгодам для корпораций и значительным потерям для общества и работников.
Использование цифровых инструментов