Какие компетенции потребуются для решения аналитических задач бизнеса
Анна Племяшова, Руководитель Департамента аналитики больших данных и искусственного интеллекта Beltel Datanomics.
Согласно исследованию 2020 Global State of Enterprise Analytics компании MicroStrategy, поставщика BI решений и облачных сервисов, 94% респондентов из различных отраслей называют данные и аналитику важными элементами для роста бизнеса и цифровой трансформации. Опрошенные специалисты указали отсутствие знаний и подготовленных кадров одной из главных проблем эффективного использования аналитики наравне c конфиденциальностью данных и обеспечением их доступности.
Какие экспертизы оставить внутри организации, а какие можно вынести на аутсорсинг, оптимизируя затраты на аналитику?
Агентство Gartner приводит график, демонстрирующий эволюцию аналитических возможностей по мере развития технологий и автоматизации производственных процессов (рис. 1).
Рис. 1. Стадии зрелости аналитики данных
Понятно, что чем сложнее аналитическое решение, тем затратнее ресурс, который это решение развивает и поддерживает. Если размер компании не предусматривает широкое масштабирование полученного результата, то целесообразно рассматривать готовые продукты, которые обойдутся дешевле, чем развитие собственных.
Предлагаем пройти по стадиям зрелости аналитики данных и определить, какими компетенциями стоит обладать специалистам на каждом уровне, а также базовые требования для запуска аналитических проектов.
С чего начать внедрение аналитики данных
Основное требование для аналитических решений – это наличие качественных данных за несколько повторяющихся циклов, например, сезонных или производственных.
Одна из стратегических задач, которая упоминается экспертами, как приоритетная – это управление данными (Data Governance).
Подробнее о Data Governance можно ознакомиться в нашей статье по ссылке.
В зависимости от масштаба компании ответственность за внедрение процессов управления данными может возлагаться на ИТ отдел или рабочую группу с ответственным за внедрение, в отдельных случаях вводится новая должность директора по данным (CDO, Chief Data Officer).
Наш опыт общения с заказчиками показывает, что, как правило, ответственными за управление данными являются ИТ-директора при поддержке руководителей от бизнес-подразделений.
Внедрение аналитики в компании происходит с BI решений, которые позволяют визуализировать данные и внедрять диагностическую аналитику. Самые популярные продукты на рынке BI систем – это Power BI, Tableau, Qlik Sense. Эти сервисы работают с разными источниками данных, многофункциональны и предоставляются по подписке, стоимость зависит от количества пользователей. Например, стоимость подписки Power BI составляет 750 руб./месяц (с НДС) на одного пользователя.
Для настройки дашбордов в зависимости от требований бизнес-подразделений в штате компании рекомендуется иметь BI-аналитика, т. к. запросы от бизнеса на формирование аналитических отчетов могут поступать регулярно.
Минимальные требования к таким специалистам:
- Уверенная работа c SQL
- Опыт работы с BI системами
- Хорошее знание Excel
- Знание математической статистики и теории вероятностей
В зависимости от уровня ответственности и автономности такие специалисты в среднем по рынку обойдутся работодателю от 70,000 до 150,000 рублей с учетом налогов и выплат по заработной плате (в пенсионный и прочие фонды).
Наличие BI-аналитика не отменяет необходимость обучение персонала отделов, где наиболее востребованы аналитические решения, навыкам пользования BI-сервисами – это ускоряет процесс построения несложных отчетов и повышает аналитическую культуру в компании.
Освоение продвинутой аналитики
Несколько лет назад стал доступен инструментарий продвинутой аналитики в том числе с использованием больших данных, позволяющий предоставлять бизнесу важную информацию и увеличивать эффективность производственного процесса. Такую аналитику еще называют предсказательной или предиктивной аналитикой (Predictive Analytics) и предписывающей аналитикой (Prescriptive Analytics). Продвинутая аналитика основана на построении математических моделей методами машинного обучения (Machine Learning, ML).
Примерами решений в области продвинутой аналитики и искусственного интеллекта можно назвать:
- различные задачи прогнозирования (спроса, закупок, сырья, смены персонала, оттока клиентов и пр.);
- рекомендательные сервисы;
- решения по оптимизации (цены, ассортимента, условий сделки, технологического процесса и пр.);
- предиктивное обслуживание оборудования как частная задача прогнозирования;
- решения с применением компьютерного зрения (распознавание товара, идентификация людей, присутствие/отсутствие персонала в контрольных зонах, наличие очередей и пр.);
- решения с применением методов обработки естественного языка (Natural Language Processing, NLP) (интеллектуальные чатботы, информационный поиск, машинный перевод и пр.)
Внедрение подобных аналитических решений требует расширенной экспертизы аналитиков, а также привлечения архитекторов и разработчиков, которые запустят модели в промышленную эксплуатацию.
Частое упоминание в СМИ профессии Data Scientist и перспектив дохода, которые открываются перед обладателями навыков, позволяющих претендовать на эту должность, вызвало невероятную популярность программ ВУЗов и курсов по этой специальности и перегрев рынка от зарплатных ожиданий соискателей. Рынок обработки данных развивается и постепенно конкретизируется по направлениям специалистов. Для бизнеса, если это не такие корпорации, как Google или Facebook, не так актуальны исследования и наука (Data Science в чистом виде), как прикладные решения и внедрения продуктов. Такие специалисты называются ML инженерами (ML Engineer) и инженерами по данным (Data Engineer).
Инженеры по данным – это специалисты, которые проектируют и организуют хранилища данных, поддерживают ETL – процессы. Отдельная штатная позиция инженера по данным актуальна, если есть необходимость собирать из различных источников большие данные. Вырастить инженера по данным, если потребуется, можно из существующей команды ИТ-отдела. Например, если выбрать для развертывания хранилища данных облако Microsoft Azure, можно пройти обучение, сдать экзамены по курсам внедрения и проектирования решений по обработке данных (DP-200 и DP-201) и получить сертификацию Azure Data Engineer Associate.
ML инженеры, или в некоторых компаниях должность носит общее название Аналитик данных (Data Analytics), больше про математику и разработку решений продвинутой аналитики.
При проведении интервью на вакансию аналитика в команду Datanomics половину времени мы отводим на тестирование и опрос по математике: начиная от школьной программы, например, умение находить минимумы и максимумы элементарных функций, задач на комбинаторику, до проверки знаний в линейной алгебре, теории вероятностей, статистике. Отдельно проверяем знания алгоритмов машинного обучения и опыт их применения.
Самый распространённый язык программирования, который используют аналитики данных (и мы тоже отдаем предпочтение специалистам со знанием этого языка) – это Python. Помимо этого необходимо владение, как минимум, следующими библиотеками: numpy, pandas, matplotlib, sklearn. Плюсом для нас является знание фрейворков Dash, Flask.
Специализация аналитиков в компьютерном зрении или NLP потребует дополнительных знаний библиотек и фреймворков, таких как Tensorflow, OpenCV, Keras, PyTorch, NLTK и пр.
В текущей практике построения архитектур программного обеспечения завоевывает популярность микросервисный подход, поэтому специалистам необходимо владеть еще и такими инструментами, как Docker и Kubernetes.
Читайте также: Как микросервисный подход к реализации аналитических решений влияет на бизнес?
Как видно из описания навыков и знаний, которые потребуются современным аналитикам, традиционной статистикой при внедрении продвинутых решений обработки данных не обойтись.
Для поддержки собственной экспертизы потребуется руководитель разработки и команда как минимум из двух аналитиков или ML инженеров. Стоимость таких специалистов зависит от объема задач – будет ли это решение предиктивной аналитики или потребуются применение технологий компьютерного зрения или NLP.
Целесообразность развития собственного отдела, как уже писали, зависит от возможности масштабирования. В некоторых случаях компании предпочитают создавать отдел инноваций или иметь выделенного координатора по интеграции, который находит интересные аналитические решения на рынке и встраивает их в существующие корпоративные платформы.
Для того, чтобы компании могли оценить свой оптимальный путь для внедрения аналитики в бизнес-процессы, необходимо составить таблицу альтернативных подходов, отметить их достоинства и недостатки, посчитать бюджеты и сроки реализации. Но для начала надо определиться со стратегическими целями внедрения аналитики и списком приоритетных задач.
Дополнительно
Больше статей о подходах к аналитическим решениям вы найдете в нашем блоге:
- На что обратить внимание, выбирая подрядчиков на аутсорсинг аналитики, читайте в этом материале
- Какие факты полезно учесть при запуске проектов аналитики данных?
- О преимуществе облачных хранилищ данных для задач искусственного интеллекта читайте здесь.