Отчетливо выраженным трендом стало недавнее появление «науки о данных», изучающей способы анализа больших данных профессиональными аналитиками, а также такой профессии, как «исследователи данных». Основное различие между ними и традиционными профессиональными аналитиками состоит в выборе инструментов и платформ, используемых для анализа. Традиционные профессиональные специалисты в крупных организациях склонны использовать такие инструменты, как SAS и SQL, для анализа базы данных в окружении реляционной базы данных. Исследователи данных чаще применяют такие инструменты, как R и Python, для анализа данных в окружении Hadoop. Тем не менее эти различия носят тактический и в основном семантический характер. Любой специалист, хорошо разбирающийся в том или другом окружении, легко может переключаться между ними. Несмотря на разные наименования, профессиональные аналитики обладают практически одинаковыми базовыми наборами навыков и складом ума. (Подробнее мы обсудим эту тему в восьмой главе.)
В эпоху Аналитики 2.0 профессиональные аналитики хотя и не были включены в процесс принятия решений, но повысили свой статус в организациях до такого уровня, что могут напрямую влиять на принимающих решения лиц. Профессиональные аналитики перестали быть секретным ресурсом, тщательно огражденным от бизнес-сообщества.
Как мы увидим далее в этой главе, многие организации, особенно фирмы, работающие онлайн и в области электронной коммерции, начали разрабатывать коммерческие продукты и услуги, основанные исключительно на данных и аналитике. Первыми это предприняли онлайновые фирмы, они же первыми вступили в эпоху Аналитики 2.0. Одним из самых примечательных примеров является социальная сеть LinkedIn, создавшая такие продукты, как «Люди, которых вы можете знать» и «Группы, которые вам могут понравиться». Такие основанные на аналитике продукты используют информацию, собираемую в рамках управления и поддержания аккаунтов пользователей, и генерируют новую информацию, за которую во многих случаях пользователи платят.
Один из парадоксов Аналитики 2.0 состоит в том, что производимая аналитика зачастую оказывается не очень-то и продвинутой. Отчасти это было обусловлено тем, что объем и сложность данных затрудняют их перевод в пригодный для анализа формат. Отчасти объясняется незрелостью источников данных и аналитических инструментов. При всем поднятом вокруг нее ажиотаже эпоха Аналитики 2.0 по-прежнему в значительной степени опирается на отчетность и описательную аналитику с относительно малыми вкраплениями прогностической и предписывающей аналитики.
Одной лишь Аналитики 2.0 недостаточноЭпоха Аналитики 2.0 выводит на передний план большие данные и новые возможности для применения аналитики. При этом нецелесообразно создавать отдельные команды, технологии и инструменты исключительно для анализа больших данных. Аналитические процессы должны охватывать любые данные и соответствовать любым требованиям, предъявляемым к аналитике. Вот почему Аналитика 2.0 – это не конечный результат.
Одно из заблуждений, характерных для эпохи Аналитики 2.0, проистекает из того факта, что многие профессиональные аналитики не прошли через эпоху Аналитики 1.0. Многие из них имеют подготовку в области компьютерных наук и пришли в аналитику из технологической сферы. Порой аналитики поколения 2.0 попросту не знают всего того, что делали крупные инновационные компании в эпоху Аналитики 1.0. Как следствие, они могут предположить, что все используемые ими концепции и методики являются совершенно новыми. Иногда это действительно так, но чаще всего нет. Давайте рассмотрим пример, который иллюстрирует эту ситуацию.
Как-то на конференции я услышал выступление одного молодого человека. Не буду называть его имя и компанию, поскольку моя цель – пролить свет на распространенную логическую ошибку, а не поставить кого-то в неловкое положение. Докладчик подробно изложил методы, посредством которых он со своей командой разрабатывал разнообразные аналитические процессы для сайта электронной коммерции его компании. И доводы, и методы были вполне разумными. Компания поступала правильно: например, применяла аффинитивный анализ и совместную фильтрацию для определения того, какие дополнительные продукты могли заинтересовать клиента исходя из истории его прошлых покупок и просмотров. Такого рода анализ традиционные ретейлеры применяли на протяжении многих лет.
Однако докладчик ошибочно заявил, что метод аффинитивного анализа нельзя было применять до появления больших данных и некоторых новых технологий. Он искренне верил в то, что применение широко распространенных алгоритмов открывает новые горизонты, поскольку не имел представления о происходившем на протяжении многих лет в традиционной розничной торговле. Метод аффинитивного анализа оказался в новинку только для этого молодого специалиста (и подобных ему). Парень попросту не знал истории аналитики. Действительно, в атмосфере ажиотажа вокруг больших данных легко предположить, что в прошлом ничего интересного не происходило. К сожалению, из-за такой неосведомленности можно потратить массу времени на выработку давно уже существующих решений, вместо того чтобы заняться более полезным делом.
Эпоха Аналитики 2.0 может многое выиграть, если будет заимствовать знания и опыт из эпохи Аналитики 1.0. Для достижения же максимального успеха организациям следует объединить все лучшее из эпохи Аналитики 1.0 и эпохи Аналитики 2.0, а затем двигаться дальше. Так мы придем в эпоху Аналитики 3.0.
Аналитика 3.0: всеобъемлющая аналитика воздействует максимально
Аналитика 3.0 сосредотачивается на дальнейшем развитии, а не на замене знаний, полученных в эпохи Аналитики 1.0 и 2.0. Подобно тому как Аналитика 2.0 не заменила собой Аналитику 1.0, так и Аналитика 3.0 не заменяет собой других. Аналитика 3.0 сочетает все предыдущие знания, накопленные ранее, в единой схеме деятельности, как это видно на рис. 1.3. Она объединяет традиционную аналитику на основе традиционных данных с новой аналитикой больших данных. Когда организации начали использовать большие данные, они обнаружили, что невозможно выделить аналитику больших данных в полностью автономную функцию. Большие данные – это не просто большие объемы обычных данных, требующие больше аналитики. Они требуют интеграции со всеми остальными процессами. Эпоха Аналитики 3.0 знаменует появление новой – интегрированной и развитой – аналитической парадигмы. Сейчас, в начале 2014 г., мы видим, что лидеры из сферы как традиционного, так и интернет-бизнеса начинают вступать в эпоху Аналитики 3.0. Операционная аналитика – естественное следствие этого тренда.
Причем Аналитика 3.0 вновь привлекает внимание к процессу обнаружения нужных данных. Этот процесс направлен на быстрое обнаружение новых знаний в данных и определение действий, продуктов и услуг, которые можно извлечь из добытых знаний. Полная реализация потенциала, заложенного в процесс обнаружения, требует от многих организаций значительной культурной эволюции. Аналитика должна стать сердцевиной стратегии предприятия, и повышение статуса аналитики должно направляться и санкционироваться сверху. Кроме того, необходимо перестроить существующие аналитические платформы и процессы. Далее в книге мы поговорим о процессе обнаружения данных и об изменениях, которые он потребует.
Разнообразие и новизна типов данных и доступных источников представляют собой один из главных вызовов в эпоху Аналитики 3.0 и в то же время ведут к появлению столь же разнообразных и инновационных аналитических технологий. Новые аналитические методы будут одной из определяющих характеристик эпохи Аналитики 3.0. Власть данных и расширение их обработки в конечном итоге подвигнут организации к широкому применению прогностической и предписывающей аналитики. Хотя потребность в описательной аналитике и отчетности по-прежнему останется, в эпоху Аналитики 3.0 организации наконец-то начнут осуществлять мечту об интегрированной и операционной аналитике. Она будет встроена не только в централизованные крупномасштабные корпоративные системы, но и в операционные приложения, используемые конечными пользователями, например в мобильных устройствах, банкоматах и интерактивных терминалах.
Развивайтесь до Аналитики 3.0Эпоха Аналитики 3.0 представляет собой последний на сегодняшний день этап развития аналитики. Сочетая в себе все лучшее, что создано в эпохи Аналитики 1.0 и Аналитики 2.0, она развивает аналитику дальше.
Новые архитектуры, требуемые для Аналитики 3.0, добавят организациям сложностей. Аналитика 3.0 делает необходимым наличие параллельной обработки не только в окружении реляционной базы данных, но и в таком окружении, как распределенная файловая система Hadoop. Также может потребоваться смешение различных систем запоминания, графических процессоров и т. д. Все это мы рассмотрим в пятой главе.