текст. Иногда после нажатия клавиши он появлялся снова, а иногда — нет. Мои беды с курсором относились к самым ужасным ошибкам, с которыми только может столкнуться программист, поскольку неправильное поведение не всегда удавалось исправить, если я возвращался и повторял те же шаги.
У программистов для подобных проблем есть свое название. Мы позаимствовали его из квантовой механики, от имени Вернера Гейзенберга, который вывел принцип неопределенности. Мои проблемы с курсором назывались «гейзенбагами»[23]. И их исправление оказалось самой трудной задачей в программировании, с какой мне когда-либо приходилось сталкиваться.
Чтобы дать полное техническое объяснение этих проблем, я сражался с кодом, заставляя его показывать правильный видимый результат. Мне нужно было описать формат веб-страниц HTML (Hypertext Markup Language, язык гипертекстовой разметки), а также понятные лишь посвященным вещи, такие, как древовидные структуры объектной модели документа, алгоритмы обхода бинарного дерева и многое другое. Проведем аналогию. Представьте себе следующую ситуацию.
Клиент приходит в кондитерскую, чтобы для него испекли торт по индивидуальному заказу. Он говорит: «Я хочу торт с надписью: „С днем рождения!“, а ниже — „Том“».
Как эти люди (клиент и исполнитель заказа) могут убедиться, что поняли друг друга правильно? Это станет еще труднее, если я уберу необходимые знаки препинания и заглавные буквы, чтобы ближе передать ощущения двух людей, разговаривающих друг с другом:
«Я хочу торт с надписью с днем рождения а ниже том».
Мы не будем особенно удивлены, если в некоторых случаях возникает недопонимание по поводу того, как должен выглядеть торт. Возможно, заказчик говорит не слишком четко. Может быть, пекарь страдает хроническим дефицитом здравого смысла или у него просто был длинный тяжелый день. Из-за чего бы ни произошла подобная неудача, в результате может получиться комическая путаница.
В моем примере с заказом предполагалось, что по требованию клиента на торте будет написано только четыре слова: «с», «днем», «рождения» и «Том», но было также и указание о том, как их разместить, и все эти сведения были в неявной форме зашифрованы в первоначальной устной просьбе. В большинстве случаев люди могут понять их из контекста, но иногда интерпретируют неправильно, и то, что получается в итоге, можно увидеть, если набрать в Google поисковый запрос «испорченный праздничный торт».
Текстовые редакторы в чем-то похожи на заказы праздничных тортов. Когда вы набираете в одном из них слово, затем помечаете его и выделяете жирным шрифтом, затем кликаете мышью в другое место и печатаете что-то еще, вы создаете поток данных, который напрямую указывает, как должен выглядеть текст. Как и добросовестно выполняющий свою работу кондитер, принимающий заказы, текстовый редактор должен отслеживать ваши действия, чтобы убедиться: документ всегда соответствует вашим ожиданиям.
В моих попытках заставить курсор двигаться правильно проблемой был HTML — формат данных веб-страниц. Слово «разметка» в названии «язык гипертекстовой разметки» относится к способу, которым данные чередуются с метаданными — информации о другой информации. Вот простой пример HTML-кода и отображаемого результата.
Какой-то <b>текст, выделенный жирным шрифтом, какой-то <i>курсив</i></b> и какой-то простой текст.
Какой-то текст, выделенный жирным шрифтом, какой-то курсив и какой-то простой текст.
Вы видите, что, как и при заказе праздничного торта, когда заказчик говорит с продавцом, текст и его стилизованное оформление вы как бы передаете ему одновременно. В HTML не всегда легко отделить разметку от содержания. Данные и метаданные смешиваются. Вот более сложный и реалистичный пример, который я взял со страницы Википедии, где говорится о белоголовом ксенопсарисе{29} — маленькой южноамериканской птице. В примере ниже HTML-код представлен рядом с его отображением:
Белоголовый ксенопсарис (лат. Xenopsaris albinucha) — вид воробьинообразных птиц из семейства титировых (Tityridae), который выделен в монотипический род белоголовых ксенопсарисов (Xenopsaris).
Какая часть из приведенного выше потока HTML текста визуализируется в отображаемом ниже тексте, а какая часть представляет собой только элементы отображения текста, ссылки и иную неотображаемую информацию? Где начинается и заканчивается разметка? Началом ей служат угловые скобки (< и >), но все гораздо сложнее. На самом деле моей главной трудностью с проектом редактирования в WebKit было то, что мне приходилось иметь дело с HTML, перемешанным форматом, который я с трудом превращал в универсальную информацию для текстового редактора. Я не мог найти эффективного способа переключаться между этой информацией и ее правильным отображением и, поскольку не мог этого сделать, не мог и поместить мигающий курсор на правильное место.
Много месяцев я провел в попытках найти способ разделить содержание и разметку, и чем больше времени проходило, тем сильнее я напрягался из-за того, что не мог решить проблему. Я добавлял больше примеров, чтобы выделить особые последовательности кода HTML. Я делал подробный анализ своих ошибок, пытаясь увидеть структуру ошибок. Я провел недели, размышляя над проблемой в своем кабинете в Apple, и это не принесло заметного успеха. Тогда я начал программировать дома по вечерам и выходным. Но все равно ничего не помогало.
Я зашел в тупик.
В конце концов, я пошел к Дону. Я все еще был разочарован из-за того, что он не выбрал меня руководителем команды Safari, но, несмотря на это, наша давняя дружба сохранилась, и, хотя теперь он не был моим непосредственным начальником, я продолжал советоваться с ним в трудных ситуациях. В проблеме с точкой ввода мне явно была нужна его помощь. Некоторое время назад я признавался ему, что я всю голову сломал с этими программными ошибками, а теперь мне нужен был совет. Хотя у меня были какие-то успехи с другими функциями редактирования, я уже начинал волноваться, что все мои усилия с WebKit пойдут прахом из-за того, что я не в состоянии написать код для курсора без ошибок.
Дон предложил мне встретиться с двумя коллегами из нашей команды, создававшей браузер: Дареном Адлером и Треем Мэттьюсоном, работающим по временному контракту и помогающим нам улучшить код. Оба были отличными программистами и имели намного больше профессионального опыта, чем я. Когда Дарен приступил к работе над Safari, это было фактически его второе место в Apple. Первый раз он работал в компании еще в 1980-х, когда руководил командой, создававшей архитектуру программного обеспечения для System 7 — достойной упоминания операционной системы в истории Mac. Трей был одним из первых разработчиков AppKit в NeXT, и этот код теперь был частью основы программного обеспечения для разрабатываемых в Apple