в том, что у разных людей мозг работает одинаково, и это позволяет нам общаться с другими людьми, учиться у них, обучать их и мотивировать на нашем родном языке. Будь все наши роботы такими же непрозрачными, как AlphaGo[28], мы не сможем вести с ними содержательные беседы, что весьма печально. Нам придется переобучать их всякий раз, когда вносятся минимальные изменения в условия задачи или в операционную среду.
Потому, оставляя в стороне эксперименты с «непрозрачными» обучаемыми машинами, я пытаюсь понять их теоретические ограничения и исследовать, каким образом эти ограничения могут быть преодолены. Я изучаю этот вопрос в контексте причинно-следственных задач, которые во многом определяют воззрения ученых на мир и в то же время изобилуют примерами проявления интуиции, вследствие чего мы можем отслеживать прогресс в ходе анализа. В данном контексте мы обнаружили, что существуют некоторые базовые препятствия, которые, если их не преодолеть, не позволят создать подлинный аналог человеческого разума, что бы мы ни делали. Полагаю, подробное описание этих препятствий не менее важно, чем попытки взять их штурмом.
Современные системы машинного обучения работают почти исключительно в статистическом режиме (или режиме модельной слепоты), который во многом аналогичен помещению функции в облако элементов данных. Подобные системы не способны размышлять по принципу «что, если?», а значит, не могут выступать основанием для «сильного» ИИ, то есть для искусственного интеллекта, который имитирует человеческие мышление и компетентность. Чтобы достичь человеческой разумности, обучаемые машины должны руководствоваться своего рода калькой с реальности, моделью наподобие дорожной карты, по которой мы ориентируемся, перемещаясь по незнакомому городу.
Точнее сказать, современные обучаемые машины улучшают свою производительность, оптимизируя параметры потока сенсорных входящих данных, получаемых из окружающей среды. Это небыстрый процесс, аналогичный естественному отбору, который движет дарвиновской эволюцией. Последняя объясняет, как такие виды, как орлы и змеи, обрели превосходное зрение за миллионы лет развития. Однако она не в состоянии объяснить сверхэволюционные процессы, которые позволили людям изобрести и начать производить очки и телескопы всего за какую-то тысячу лет. Люди обладают тем, чего лишены другие виды, а именно ментальными репрезентациями окружающей среды – репрезентациями, которыми возможно манипулировать по желанию, дабы воображать различные альтернативные и гипотетические среды в целях планирования и обучения.
Историки рода Homo Sapiens, скажем Юваль Ной Харари и Стивен Митен[29], в целом согласны с тем, что решающим фактором, который обеспечил нашим предкам глобальное господство на планете около сорока тысяч лет назад, была способность создавать и хранить ментальные репрезентации окружающей среды, обращаться к этим репрезентациям, искажать их посредством актов воображения и, наконец, отвечать на вопросы типа «Что, если?». Примерами могут служить вопросы интервенционные («Что, если я сделаю то-то и то-то?») и ретроспективные, или контрфактивные («Что, если бы я поступил иначе?»). Ни одна обучаемая машина в наши дни не способна давать ответы на такие вопросы. Более того, большинство обучаемых машин не обладают репрезентациями, из которых можно вывести ответы на подобные вопросы.
Отталкиваясь от причинно-следственного мышления, можно сказать, что для нас почти бесполезны любые формы подгонки кривых, модельной слепоты или статистического вывода, сколь бы сложным ни был процесс подгонки. Мы также выявили теоретические рамки для структурирования указанных ограничений по иерархическому признаку.
На первом уровне находится статистическое мышление, которое способно сообщить лишь о том, как наблюдение одного события изменит ваши взгляды на другие события. Например, что симптом может рассказать о болезни?
Далее располагается второй уровень, который опирается на первый, но не наоборот. Здесь помещаются действия. «Что будет, если мы поднимем цены?» «Что, если ты меня рассмешишь?» Этот второй уровень иерархии требует информации о вмешательствах, недоступной на первом уровне. Данную информацию можно закодировать в графическую модель, которая будет уведомлять, какие переменные реагируют на другие.
Третий уровень иерархии является контрфактуальным. Это язык, употребляемый учеными. «Что, если объект будет вдвое тяжелее?» «Что, если я поступлю иначе?» «Это от аспирина у меня перестала болеть голова или все дело в том, что я пошел спать?» Контрфактуальность занимает верхний уровень с той точки зрения, что ее невозможно вывести логически, даже умей мы предсказывать и предугадывать последствия всех своих действий. Тут необходим дополнительный элемент в форме уравнений, чтобы поведать нам, как переменные реагируют на изменения других переменных.
Одним из венчающих труды достижений в исследованиях причинно-следственных связей является алгоритмизация вмешательств и контрфактуальностей, то есть двух верхних уровней нашей иерархии. Иными словами, когда мы закодировали наше научное знание в модели (пусть даже качественной), налицо алгоритмы, позволяющие изучить модель и определить, возможно ли воспринять конкретный запрос, будь то вмешательство или контрфактуальность, на основе имеющихся данных (а если возможно, то как именно). Эта возможность кардинально изменила само занятие наукой, особенно в таких наукоемких дисциплинах, как социология и эпидемиология, где каузальные модели успели стать вторым языком. Указанные дисциплины трактуют описанную лингвистическую трансформацию как каузальную революцию. Цитируя социолога из Гарварда Гэри Кинга: «За последние несколько десятилетий о причинно-следственных связях стало известно намного больше, чем за всю предшествующую историю вопроса».
Размышляя об успехах машинного обучения и пытаясь экстраполировать их на будущее ИИ, я спрашиваю себя: «Известны ли нам базовые ограничения, которые были обнаружены в области причинно-следственных связей? Готовы ли мы преодолеть теоретические препятствия, мешающие нам переходить с одного уровня иерархии на другой?»
Я рассматриваю машинное обучение как инструмент, позволяющий перейти от данных к вероятностям. Но тогда следует сделать два дополнительных шага, чтобы перейти от вероятностей к реальному пониманию, – два больших шага. Один заключается в том, чтобы предсказывать последствия действий, а второй состоит в освоении контрфактуального воображения. Мы не вправе утверждать, что постигли реальность, если не сделаем эти два шага.
В своей блестящей и проницательной работе «Предвидение и понимание» (1961) философ Стивен Тулмин определил противостояние прозрачности и непрозрачности как ключевое условие осознания сути древнего соперничества между греческими и вавилонскими науками. Согласно Тулмину, вавилонские астрономы были мастерами предсказаний по «черному ящику» и сильно превосходили своих греческих соперников по точности и последовательности небесных наблюдений. Тем не менее наука предпочла креативно-умозрительную стратегию греческих астрономов, которая изобиловала метафорическими образами: круглые трубы, полные огня; малые отверстия, сквозь которые сияет небесный огонь (звезды); полусферическая Земля на спине гигантской черепахи… Именно эта безумная стратегия моделирования, а вовсе не вавилонские экстраполяции, побудила Эратосфена (276–194 годы до н. э.) предпринять один из наиболее творческих экспериментов Античности и вычислить окружность Земли. Подобный эксперимент был попросту невозможен среди вавилонских собирателей данных.
Модельная слепота накладывает внутренние ограничения на когнитивные задачи, которые способен выполнять «сильный» ИИ. Мой общий вывод состоит в том,