На рис. 10.2 приведена схема распределения в компании данных, необходимых для анализа CLTV. Здесь показано, каким образом все важнейшие с точки зрения прибыльности клиента данные накапливаются в различных функциональных зонах бизнеса: они поступают из различных источников. Для анализа нужен доступ к этим данным и их интеграция, что само по себе может стать непростой задачей.
Рис. 10.2. Данные от различных подразделений, необходимые для расчета CLTV
Источник: Ричард Уинтер, www.wintercorp.com
Однако самое важное – грамотный процесс мышления. Поймите суть маркетинговой проблемы, которую вы пытаетесь решить, и определите вопросы, на которые вам нужно получить ответ. Они определят инфраструктуру и набор необходимых данных. Существует целый ряд дополнительных факторов, влияющих на требования к управлению данными: и количество клиентов, и необходимая степень детализации данных, и сложность запросов и анализа, и необходимость в анализе непредсказуемых событий.
Какая инфраструктура вам нужна: одноэтажный фермерский домик или Эмпайр-стейт-билдинг?
Объем и инфраструктура хранилища, которое необходимо для маркетинга, основанного на данных, зависит от двух важных параметров: количества клиентов и сложности требований. Первая переменная напрямую связана с размером EDW: каждое взаимодействие с клиентом (покупки, звонки в колл-центр, возвраты продукта и т. д.) создает новые данные о нем. Для анализа CLTV эти данные нужно собирать за период 3–5 лет. Если клиентская база велика, объем хранилища также будет большим. Вторая переменная выступает как множитель для расходов на создание сложной инфраструктуры. В следующем разделе я расскажу об этом подробнее.
В табл. 10.1 сравниваются три организации различного размера по возрастанию уровня сложности. Пример приведен для ретейла, но та же схема может применяться в любом бизнесе. Для уровня сложности в данном случае будет уместна аналогия со зданиями – в табл. 10.1 инфраструктура маркетинга, основанного на данных, для компаний различного размера сравнивается с домиком фермера, офисным зданием среднего размера и небоскребом Эмпайр-стейт-билдинг соответственно.
На нижнем уровне находится региональный ретейлер с 10 магазинами и 100 000 клиентов. Насколько велико будет хранилище данных для компании такого размера? Не больше фермерского домика (согласно данным последней переписи в США, площадь обычного американского дома чуть больше 200 м²). Что касается объема данных, то для небольшого регионального ретейлера со 100 000 клиентов он составит 1 терабайт, то есть в среднем объем данных о каждом клиенте будет равен примерно 10 мегабайтам (1012 байт / 105 клиентов = 107 байт в расчете на клиента = 10 мегабайт в расчете на клиента), что представляется вполне реалистичным. Приобретение системы, способной хранить и обрабатывать такие массивы данных (при среднем уровне сложности анализа), потребует инвестиций в оборудование и программное обеспечение в размере 50 000–250 000 долларов. Величины расходов ориентировочны и представлены лишь для того, чтобы вы могли оценить порядок цифр.
Табл. 10.1. Инфраструктура хранилища данных – домик фермера против Эмпайр-стейт-билдинг
Источник: Ричард Уинтер, www.wintercorp.com, и Марк Джеффри, www.agileinsights.com
Ретейлер среднего размера соответствует в нашей системе офисному зданию площадью около 2440 м² (примерно в 12 раз больше фермерского домика). У него региональная сеть из 400 магазинов и 1 миллион клиентов. Объем данных для него составляет примерно 10 терабайт. Иными словами, у ретейлера среднего размера в 10 раз больше данных, чем у небольшого! Для таких объемов данных вам понадобятся и значительные мощности, и инфраструктура – это может обойтись в сумму 500 тысяч – 2,5 миллиона долларов, в зависимости от сложности анализа данных (опять же, примерно).
На третьем уровне располагается национальный ретейлер с 5000 магазинов и 100 миллионами клиентов. Здесь вполне уместна аналогия с Эмпайр-стейт-билдинг – зданием площадью свыше 200 000 м². Такое здание примерно в 1000 раз больше фермерского дома. В распоряжении национального ретейлера будут массивы данных объемом 1000 терабайт, то есть в 1000 раз больше, чем у местного ретейлера! Для работы со столь массивными объемами данных и запросов вам нужна настоящая инфраструктура промышленного масштаба стоимостью 50–250 миллионов долларов.
Вывод очевиден: разница в требованиях к системе, определяемая разницей в решаемых бизнес-задачах, может приводить к значительным последствиям; дом фермера ничуть не похож на Эмпайр-стейт-билдинг, а инфраструктура стоимостью в несколько сотен тысяч долларов – не то же самое, что инфраструктура стоимостью несколько сотен миллионов. Ричард Уинтер, СЕО WinterCorp и эксперт в области дизайна и архитектуры масштабных хранилищ данных, рассказал мне следующее:
Бизнесмены должны понимать масштаб и сложность хранилищ данных, создаваемых для них (примерно как в случае финансирования строительства здания). Они должны представлять себе, предполагает ли проект строительство дома для престарелых или башни Сирс[49] – соответственно, дизайн, техническое проектирование и конструкция будут разными. К сожалению, хранилища данных физически не ощутимы, и руководители порой затевают проекты, напоминающие по сложности и масштабу башню Сирс, при этом представляя себе, что строят обычный дом престарелых… Тут-то и возникают проблемы.
Самая сложная ситуация возникает в том случае, если ваша команда IT-отдела раньше строила только фермерские дома. Старая поговорка гласит, что, когда у вас есть только молоток, все вокруг напоминает гвоздь. Это справедливо и в отношении IТ: если вы умеете строить только деревенские дома, то ваша IT-система, обслуживающая маркетинг, тоже будет напоминать такой дом. И здесь возникает проблема масштабируемости: сможет ли система работать после добавления в нее новых клиентов? Если система хорошо работает с несколькими клиентами, будет ли она так же эффективно работать с сотнями?
Ошибка, связанная с невозможностью масштабирования, возникает очень часто, а ее последствия получают широкую огласку. В 2001 году AT&T[50] начала брендинговую кампанию для mLife, пакета услуг мобильной связи. Кампания, запущенная в период проведения Суперкубка по американскому футболу в 2001 году, обошлась фирме более чем в 20 миллионов долларов. Телевизионные ролики были очень простыми: адрес сайта www.mLife.com на белом фоне. Однако в итоге более 100 миллионов зрителей Суперкубка ожидало разочарование: когда на сайт зашло одновременно огромное количество пользователей, он рухнул, и никто не смог понять ни что такое mLife, ни каким образом сайт связан с AT&T. Так погиб только что родившийся бренд. Это классический пример того, что происходит, когда сотрудники отдела маркетинга не общаются с IT-специалистами.