Что такое Big Data?
Появление термина Big Data («Большие данные») можно отнести ко времени Второй мировой войны, когда понятие «Большая наука» (Big Science) описывало период ускоренных изменений в научных дисциплинах во время и после войны. Хорошим примером таких изменений стало изобретение компьютеров.
Во время войны Джон Мокли был физиком в Электротехнической школе Мура Пенсильванского университета. Он полагал, что можно создать электронное вычислительное устройство для предсказания погоды. Идея была озвучена в августе 1942 года, а к июню 1943-го на проект выделили средства. Систему, получившую название «электронный числовой интегратор и вычислитель» (Electronic Numerical Integrator and Computer, ENIAC), разработали к концу войны, и она привела к созданию индустрии, в которой я проработал всю свою жизнь, – информационных технологий, – а еще службы прогноза погоды. Ни в той ни в другой невозможно разобраться до конца.
Выражение Big Data впервые использовалось в качестве термина в конце 1990-х, и никто не знает, где оно появилось. Скорее всего, в научных статьях или документах META Group (ныне Gartner Group). Во всех случаях Big Data определялись следующим образом:
«Big Data – это информационные массивы большого объема, отличающиеся высокой скоростью прироста и/или высоким разнообразием; они требуют новых методов обработки для того, чтобы на их основе принимать решения, выявлять смыслы, оптимизировать процессы».
Возможно, проще сказать, что Big Data – это феномен нашего времени, когда каждый человек на планете создает цифровые данные, в которых мы тонем. Теперь мы создаем эксабайты данных каждый день. Напомню, что эксабайт – 1018 байт – непостижимо большое число, хорошо иллюстрирующее, что мы тонем в данных.
• В мире 2,2 миллиарда пользователей электронной почты, посылающих ежедневно 144 млрд писем, из которых 61 % рассматриваются как несущественные, а 68,8 % из которых – спам.
• В настоящее время существует почти 1 млрд сайтов; из них 87,8 млн – на одном только сервисе микроблогов Tumblr, и средняя веб-страница стала на 35 % тяжелее в 2012 году (благодаря фотографиям, видео и т. п.).
• Facebook имеет более миллиарда активных пользователей (публикующих не менее одного поста в месяц); наиболее активными являются бразильцы.
• Каждый месяц Facebook добавляет 7 петабайт (1015) данных только в виде фотоконтента.
• У Twitter более 200 миллионов пользователей, активных в течение месяца; в 2012 году они публиковали 175 млн сообщений – твитов – каждый день.
• В мире 6,7 миллиардов пользователей мобильной связи и около 5 миллиардов пользователей мобильных телефонов генерируют 13 % глобального интернет-трафика, или 1,3 эксабайта данных каждый месяц (59 % составляет видео).
Проблема этого океана данных заключается в разработке способов просеивания и отбора релевантной информации для целей маркетинга, продаж, обслуживания и рекомендаций. Новой многообещающей возможностью для цифровых банков является извлечение знаний из разрозненных данных; те, кто сможет разобраться в Big Data, выиграют.
Данные – это новый плацдарм для конкурентной войны, а глубинный анализ данных станет оружием массового поражения конкурентов.
Во многих отраслях понимают это, особенно новые игроки, такие как Amazon, Apple, Google и Facebook. Банки боятся этих игроков, потому что они знают, как анализировать данные и извлекать из них суть. Как недавно заявил CEO одного из банков, «с нашими коллегами я могу справиться. Мы в одной лодке. Но если Google, со всеми его данными, откроет банк, тогда мы в большой беде»[76 - Technology take-off threatens bank foundations // Euromoney, September 2012.].
Банки должны бояться Google, поскольку директор по безопасности Google Apps уже ясно дал понять, что «Google – это банк для ваших данных»[77 - Google: we’re like a bank for your data // Wired, 29 May 2012.]. В этом состоит моя доктрина будущего: банкам необходимо стать безопасными хранилищами данных и позиционировать себя именно так.
Мы уже говорили о том, что живем в мире, где интернет вещей интеллектуально распознает наши покупательские привычки. А в ближайшем будущем оборудование станет умнее не за счет использования наборов микросхем и комплектующих следующего поколения, а за счет приложений, придающих ему ценность.
Итак: банки и компании скоро сконцентрируются на обработке мобильных транзакций с помощью сети. Иными словами, вместо мобильных платежей и мобильного банкинга, о которых мы рассуждаем сегодня, завтра мы будем говорить о дополненных платежах и дополненном банкинге – в мире, где деньги не имеют смысла.
Деньги не имеют смысла
Деньги утрачивают смысл, потому что мы больше не имеем с ними дела. Мы имеем дело с данными. Слово «деньги» обычно ассоциируется с наличными, однако наличные теряют свое значение, поскольку банки и процессинговые компании ведут против них войну. Они хотят заменить наличные электронным процессингом, потому что он проще и дешевле, а электронный процессинг означает, что наличные превращаются в данные. Таким образом, деньги становятся бессмысленными, а данные – тем, что по-настоящему важно.
Трудность в том, что вокруг по-прежнему много наличности; она все еще представляет более половины всех платежей в развитых странах, и ее использование растет. Несмотря на всю рекламу бесконтактных и мобильных платежей, отчет по использованию наличных и банкоматов в Великобритании за 2013 год показывает, что пользование наличными возросло на 10 % по сравнению с показателем 2012 года; при этом количество платежей (индивидуальных и корпоративных) наличными увеличилось с 20,6 млрд до 20,8 млрд транзакций, что составляет более половины (54 %) всех платежей. Тем не менее значение наличных в более отдаленной перспективе будет снижаться, так как операторы платежей и финансовые институты нацелены на замену наличных другими формами электронных платежей.
Большинство людей полагают, что со временем наличные придут в упадок и будут заменены электронными транзакциями. Именно поэтому деньги в форме наличных утрачивают свое значение, и для банков особую важность приобретает обработка данных о деньгах, а не обслуживание перемещений самих денег. Поэтому часто цитируемый ответ гангстера Уилли Сатона[78 - Уильям «Вилли» Саттон – американский преступник, грабитель банков, заполучивший за время своей криминальной карьеры таким путем около 2 млн долларов.] на вопрос, почему он грабил банки: «Потому что там деньги», – уже анахронизм. Уилли Сатон грабил банки физически, забирая наличные под дулом пистолета. Сегодня гангстеры забирают деньги байтами.
Теперь смысл заключается в данных. Преступники вынуждены отнимать данные, а не деньги. Большинство кибератак направлены на финансовые институты. По данным ежегодного отчета компании RSA, занимающейся информационной безопасностью, в ноябре 2012 года 284 бренда подверглись фишинговым атакам[79 - Фишинговая атака – мошеннический доступ к конфиденциальным данным пользователя, например, к логину и паролю. Прим. перев.], что на 6 % ниже по сравнению с предыдущим месяцем. Из этих 284 брендов 45 % подвергались пяти атакам или меньше. Банки остаются наиболее привлекательными мишенями для фишинга, на них приходится почти 80 % всех атак.