Какое-то время на волне бума, связанного с матчем между Фишером и Спасским, ему удавалось зарабатывать на хлеб игрой на шахматных турнирах. Еще до прихода компьютеров в игровую сферу он перешел на нарды.
«Я начал играть в них в 1976 году, – сказал Роберти. – Могу рассказать, почему – история забавная. В то время я еще играл в шахматы, но уже достиг своего потолка. Я не мог стать более сильным игроком и зарабатывать шахматами на жизнь не хотел. Я был готов переключиться на что-нибудь другое, но не совсем понимал, на что именно». (Вопрос о том, чтобы перестать играть, даже не рассматривался.) «Я работал программистом в Кеймбридже и однажды вечером ужинал с другом, который был более сильным шахматистом. Он рассказал мне, как его подруга, слабо игравшая в шахматы, пришла недавно вечером домой, уселась на постели и стала пересчитывать стопки купюр, которые она только что выиграла в нарды в бостонском Кавендиш-клубе. Я быстро сложил два и два: слабая шахматистка, стопки денег. А что если сильный шахматист возьмется за эту игру? Так у меня появилась идея. Я сказал: “Окей, я освою эту игру”».
Роберти скупил все, что нашел по нардам в книжных магазинах Бостона. Он научил своих друзей по шахматному клубу играть в эту игру и сколотил небольшую команду. Он играл или изучал игру по 25 дней в месяц, бросил работу и пару лет вообще ничем не занимался, кроме нардов. Он читал старые книги, потом новые, как только они выходили, и все время играл и играл.
Но самая суть его исследований требовала определенного ручного труда. Когда Роберти играл в клубе и натыкался на особенно интересную или заковыристую позицию, он записывал ее и брал записки домой. На следующий день он воспроизводил эту позицию на доске и начинал бросать кости. И бросал их снова и снова, разыгрывая позицию раз за разом и нарабатывая представление о том, какова тенденция ее развития, о том, какие ходы были удачными, и как все это ощущается. Для каждой записанной позиции он повторял все это сотни раз, выполняя процедуру, известную как роллаут. «Иногда для этого приходилось по два вечера играть в одиночестве, – рассказывал Роберти. – Такая домашняя работа, которой я занимался месяц за месяцем, постепенно позволила мне повысить уровень мастерства. И наконец, посещая турниры и видя, как играют другие игроки – известные мастера экстра-класса, я стал говорить себе: “Ого! Да они же играют примерно так, как и я. Я двигаюсь в правильном направлении!”». Сегодня роллауты – стандартная опция выпадающего меню любой программы игры в нарды. Результаты, выдаваемые через миллисекунды, являются основой теории игры.
С точки зрения Роберти, нарды напоминали финансовую деятельность. Он объяснил мне это так, как объясняет своим ученикам: «У вас есть позиция. У вас есть активы и пассивы. По сути, вы стараетесь увеличить свои активы и сократить имеющиеся пассивы в той степени, в какой вам позволяют выпавшие очки». По его словам, после каждого броска костей игрок должен оценивать свои потенциальные ходы и задаваться вопросом: «Так, что дает такая игра? Появляются ли у меня новые активы? Избавляюсь ли я от старых пассивов? Улучшается ли баланс моих фишек в концептуальном плане?»
Благодаря тренировкам и новому мировоззрению Роберти вскоре начал делать деньги в городских клубах. После семи лет работы и бессчетных бросков костей он победил на первом в своей жизни чемпионате мира. Это было в Монте-Карло в 1983 году. «В течение всего [финального] матча я добивался самых сложных позиций, какие только были возможны», – вспоминал Роберти. Через несколько лет после этого ему позвонил Джеральд Тезауро.
В октябре 1991 года Роберти прибыл в кабинет Тезауро на тот самый матч, включавший 31 партию. Они играли почти весь день, и Роберти тщательно конспектировал поединок. TD-Gammon захватила лидерство со старта, победив в первых двух партиях. Роберти ответил победами в шести партиях подряд. Состязание пошло.
Поворотный момент в матче наступил в 16-й партии. На этом этапе у Роберти было преимущество в 15 очков. После того как на начальной стадии поединка тьма фишек была выбита и снова возвращена на доску, игра приняла характер нападения против защиты. TD-Gammon удерживала большой отрыв в гонке, а Роберти выстроил баррикаду в секторе своего дома на доске. На 10-м ходу машина удвоила ставку, и Роберти принял удвоение. Игра все больше обострялась. Баррикада Роберти стала уже почти идеальной, однако TD-Gammon запирала три его фишки, находившиеся далеко от дома, и их нужно было высвободить. На 23-м ходу Роберти, уверенный в надежности своей защиты, повысил ставку вдвое еще раз, то есть учетверил ее. TD-Gammon приняла вызов. «Компьютеры не пугаются», – отметил Роберти в своих заметках. После еще четырех бросков костей в позиции, приведенной ниже, компьютер на своем ходу еще раз удвоил ставку, так что она возросла в восемь раз, поскольку полагался на скорость своих наступательных действий. Столь драматичная эскалация встречается нечасто. Роберти проводит свои белые фишки по часовой стрелке от нижнего правого угла доски к правому верхнему (TD-Gammon совершает то же самое черными в обратном направлении), и ему нужно решить, принимать такой огромный куб удвоения или потерять четыре очка. На первый взгляд ситуация для человека представляется безнадежной: компьютер ведет в гонке с отрывом в 29 шагов (пунктов на доске, которые нужно пройти). Три фишки Роберти под угрозой, причем одна из них увязла глубоко на территории противника.
«Опасно, но у меня много возможностей победить прямо на следующем броске», – записал Роберти. Если компьютер не сможет вывести из-под угрозы свою фишку, находящуюся на 18-м пункте, Роберти получит множество бросков, которые выбивают ее. А поскольку домашняя зона Роберти полностью защищена, эта фишка не сможет вернуться на доску, компьютер на какое-то время увязнет и почти наверняка проиграет. Роберти принял удвоение. Современные программы говорят, что это был правильный ход, и дают Роберти сорокапроцентную вероятность выигрыша. В итоге нечто вроде этого и произошло. Благодаря нехарактерной ошибке в вычислениях компьютер не смог сбросить свои фишки целыми и невредимыми, попал под удар и увяз. В создавшейся ситуации Роберти еще раз удвоил ставку – до шестнадцатикратного уровня, и компьютер потерял восемь очков.