Как сформировать команду по обработке данных

Есть весомая причина, по которой «погуглив» фразу «Наука о данных – это командный вид спорта», можно найти множество статей, в том числе и оригинал этой. Навыки, которыми должен обладать сотрудник по обработке данных, должны быть настолько обширными, что едва ли они будут вмещаться в одном человеке.
И даже если вы найдете сотрудника, который умеет все это делать, вероятнее всего, придется хорошенько потратится на его зарплату. Но давайте предположим, что ваша сфера деятельности не выходит на столь большой рынок, как Северная Америка, и сложность такого поиска возрастет. Именно с таким вызовом столкнулась компания Vodafone NZ (Новая Зеландия), когда управляющему отделом аналитики и стратегии обработки информации Давиду Блоху пришлось формировать команду по обработке данных. На этой неделе он поделился своим опытом перед участниками конференции Teradata Partners.
Не удивительно, что в стране с населением менее 5 миллионов, национальная телекоммуникационная компания вероятнее всего будет обладать самым большим Hadoop-кластером и самой многообещающей аналитической программой в городе. Согласно утверждениям Блоха, традиционный кадровый подход к поиску специалистов с многолетним стажем не будет работать на небольшом рынке. Потому что менеджеры по персоналу, вероятно, проигнорируют кандидатуры, которые, на самом деле, подходили бы вам.
Вместо этого он призвал воспользоваться новым подходом, сочетая такие вещи, как неофициальные встречи и дискуссии людей, чей интерес и энтузиазм преобладал бы над опытом, который у них есть за плечами. Вместо традиционных собеседований лучше воспользоваться неформальным процессом поиска таких людей. Учитывая опыт работы со стартапами в сфере обработки данных, Блох имел хорошее понимание обсуждаемой проблемы.
Для наполнения своей команды по обработке данных, Блох выделил несколько ролей, включая инженеров, программистов, аналитиков, статистиков, рассказчиков и проводников перемен. Каждая роль не обязательно была привязана к одной должности. Например, аналитика и проводника перемен, или программиста и инженера можно было совместить в одном человеке.
В частности, инженер – это мастер автоматизации команды. Как кто-либо с опытом работы администратора баз данных или специалиста ETL. Это человек, создающий совместно с программистом потоки данных, которые своевременно обрабатываться. Во многих командах, эта работа будет называться «инженер по обработке данных». Программист – это разработчик, который работает с языками R или Python над созданием общей модели, не обязательно понимая научное обоснование, которое стоит за этой моделью. Последней идет работа статистика. Мыслителя, который владеет научными подходами для определения и утверждения моделей. Скорее всего это человек, у которого в визитке будет написано «специалист по обработке данных».
Еще нужен кто-то, кто будет экспертом основного вопроса и исследователем данных, т.е. аналитиком, который будет первопроходцем команды. Это человек, который свободно владеет SQL и будет больше походить на бизнес-аналитика. И наконец, остаются рассказчик, у которого есть творческая жилка (и вероятно, умение работать с такими инструментами визуализации, как Tableau) и проводник перемен. Человек, выполняющий роль проводника перемен, действует в качестве звена, которое составляет технико-экономическое обоснование, поддерживает связь с ответственными лицами, и следит за тем, чтобы модели соединяли бизнес-процессы и влияли на них. Согласно утверждениям Блоха, проводник перемен – это та должность, которой многие команды по обработке данных не придают значения.
Чтобы все это работало, нужен последовательный процесс, который на разных этапах требует вовлечения разных членов команды. Во-первых, необходимо сформулировать главную задачу бизнеса. Это работа, которая требует подключения проводника перемен и аналитика. Затем происходит изучение и осмысление, после чего формируется стратегия понимания. Здесь за дело принимаются аналитик и программист. Далее следует поиск данных, где в работу включаются инженер, аналитик и статистик. Теперь наступило время испытать и разработать собственно модель. Здесь сотрудничают статистик, аналитик и проводник изменений. Финишная прямая наступает во время рассказа, который включает (неудивительно) рассказчика и аналитика, и последующего воплощения результатов. И вот происходит сотрудничество проводника изменений и программиста, чтобы убедится, что результаты модели на самом деле воплощаются в жизнь и меняют бизнес.
Хоть в команде и много ролей, вам не хотелось бы делать ее слишком большой. Со времен участия в стартапах, Блох обнаружил, что дюжина людей в команде составляет практический верхний предел. И если его перешагнуть, попытки сотрудничества станут неуклюжими. Но при крайней необходимости эта модель будет работать с двумя-тремя сотрудниками. Применяя статистический подход, не увлекайтесь чтением квалификационных документов. Сообразительность и энтузиазм могут быть более эффективными характеристиками на рынке труда, где, возможно, придется импровизировать.