Какие компетенции потребуются для решения аналитических задач бизнеса

Анна Племяшова, Руководитель Департамента аналитики больших данных и искусственного интеллекта Beltel Datanomics.

Согласно исследованию 2020 Global State of Enterprise Analytics компании MicroStrategy, поставщика BI решений и облачных сервисов, 94% респондентов из различных отраслей называют данные и аналитику важными элементами для роста бизнеса и цифровой трансформации. Опрошенные специалисты указали отсутствие знаний и подготовленных кадров одной из главных проблем эффективного использования аналитики наравне c конфиденциальностью данных и обеспечением их доступности.

Какие экспертизы оставить внутри организации, а какие можно вынести на аутсорсинг, оптимизируя затраты на аналитику?

Агентство Gartner приводит график, демонстрирующий эволюцию аналитических возможностей по мере развития технологий и автоматизации производственных процессов (рис. 1).

Рис. 1. Стадии зрелости аналитики данных

Понятно, что чем сложнее аналитическое решение, тем затратнее ресурс, который это решение развивает и поддерживает. Если размер компании не предусматривает широкое масштабирование полученного результата, то целесообразно рассматривать готовые продукты, которые обойдутся дешевле, чем развитие собственных.

Предлагаем пройти по стадиям зрелости аналитики данных и определить, какими компетенциями стоит обладать специалистам на каждом уровне, а также базовые требования для запуска аналитических проектов.

С чего начать внедрение аналитики данных

Основное требование для аналитических решений – это наличие качественных данных за несколько повторяющихся циклов, например, сезонных или производственных.

Одна из стратегических задач, которая упоминается экспертами, как приоритетная – это управление данными (Data Governance).

Подробнее о Data Governance можно ознакомиться в нашей статье по ссылке.

В зависимости от масштаба компании ответственность за внедрение процессов управления данными может возлагаться на ИТ отдел или рабочую группу с ответственным за внедрение, в отдельных случаях вводится новая должность директора по данным (CDO, Chief Data Officer).

Наш опыт общения с заказчиками показывает, что, как правило, ответственными за управление данными являются ИТ-директора при поддержке руководителей от бизнес-подразделений.

Внедрение аналитики в компании происходит с BI решений, которые позволяют визуализировать данные и внедрять диагностическую аналитику. Самые популярные продукты на рынке BI систем – это Power BI, Tableau, Qlik Sense. Эти сервисы работают с разными источниками данных, многофункциональны и предоставляются по подписке, стоимость зависит от количества пользователей. Например, стоимость подписки Power BI составляет 750 руб./месяц (с НДС) на одного пользователя.

Для настройки дашбордов в зависимости от требований бизнес-подразделений в штате компании рекомендуется иметь BI-аналитика, т. к. запросы от бизнеса на формирование аналитических отчетов могут поступать регулярно.

Минимальные требования к таким специалистам:

  • Уверенная работа c SQL
  • Опыт работы с BI системами
  • Хорошее знание Excel
  • Знание математической статистики и теории вероятностей

В зависимости от уровня ответственности и автономности такие специалисты в среднем по рынку обойдутся работодателю от 70,000 до 150,000 рублей с учетом налогов и выплат по заработной плате (в пенсионный и прочие фонды).

Наличие BI-аналитика не отменяет необходимость обучение персонала отделов, где наиболее востребованы аналитические решения, навыкам пользования BI-сервисами – это ускоряет процесс построения несложных отчетов и повышает аналитическую культуру в компании.

Освоение продвинутой аналитики

Несколько лет назад стал доступен инструментарий продвинутой аналитики в том числе с использованием больших данных, позволяющий предоставлять бизнесу важную информацию и увеличивать эффективность производственного процесса. Такую аналитику еще называют предсказательной или предиктивной аналитикой (Predictive Analytics) и предписывающей аналитикой (Prescriptive Analytics). Продвинутая аналитика основана на построении математических моделей методами машинного обучения (Machine Learning, ML).

Примерами решений в области продвинутой аналитики и искусственного интеллекта можно назвать:

  • различные задачи прогнозирования (спроса, закупок, сырья, смены персонала, оттока клиентов и пр.);
  • рекомендательные сервисы;
  • решения по оптимизации (цены, ассортимента, условий сделки, технологического процесса и пр.);
  • предиктивное обслуживание оборудования как частная задача прогнозирования;
  • решения с применением компьютерного зрения (распознавание товара, идентификация людей, присутствие/отсутствие персонала в контрольных зонах, наличие очередей и пр.);
  • решения с применением методов обработки естественного языка (Natural Language Processing, NLP) (интеллектуальные чатботы, информационный поиск, машинный перевод и пр.)

Внедрение подобных аналитических решений требует расширенной экспертизы аналитиков, а также привлечения архитекторов и разработчиков, которые запустят модели в промышленную эксплуатацию.

Частое упоминание в СМИ профессии Data Scientist и перспектив дохода, которые открываются перед обладателями навыков, позволяющих претендовать на эту должность, вызвало невероятную популярность программ ВУЗов и курсов по этой специальности и перегрев рынка от зарплатных ожиданий соискателей. Рынок обработки данных развивается и постепенно конкретизируется по направлениям специалистов. Для бизнеса, если это не такие корпорации, как Google или Facebook, не так актуальны исследования и наука (Data Science в чистом виде), как прикладные решения и внедрения продуктов. Такие специалисты называются ML инженерами (ML Engineer) и инженерами по данным (Data Engineer).

Инженеры по данным – это специалисты, которые проектируют и организуют хранилища данных, поддерживают ETL – процессы. Отдельная штатная позиция инженера по данным актуальна, если есть необходимость собирать из различных источников большие данные. Вырастить инженера по данным, если потребуется, можно из существующей команды ИТ-отдела. Например, если выбрать для развертывания хранилища данных облако Microsoft Azure, можно пройти обучение, сдать экзамены по курсам внедрения и проектирования решений по обработке данных (DP-200 и DP-201) и получить сертификацию Azure Data Engineer Associate.

ML инженеры, или в некоторых компаниях должность носит общее название Аналитик данных (Data Analytics), больше про математику и разработку решений продвинутой аналитики.

При проведении интервью на вакансию аналитика в команду Datanomics половину времени мы отводим на тестирование и опрос по математике: начиная от школьной программы, например, умение находить минимумы и максимумы элементарных функций, задач на комбинаторику, до проверки знаний в линейной алгебре, теории вероятностей, статистике. Отдельно проверяем знания алгоритмов машинного обучения и опыт их применения.

Самый распространённый язык программирования, который используют аналитики данных (и мы тоже отдаем предпочтение специалистам со знанием этого языка) – это Python. Помимо этого необходимо владение, как минимум, следующими библиотеками: numpy, pandas, matplotlib, sklearn. Плюсом для нас является знание фрейворков Dash, Flask.

Специализация аналитиков в компьютерном зрении или NLP потребует дополнительных знаний библиотек и фреймворков, таких как Tensorflow, OpenCV, Keras, PyTorch, NLTK и пр.

В текущей практике построения архитектур программного обеспечения завоевывает популярность микросервисный подход, поэтому специалистам необходимо владеть еще и такими инструментами, как Docker и Kubernetes.

Читайте также: Как микросервисный подход к реализации аналитических решений влияет на бизнес?

Как видно из описания навыков и знаний, которые потребуются современным аналитикам, традиционной статистикой при внедрении продвинутых решений обработки данных не обойтись.

Для поддержки собственной экспертизы потребуется руководитель разработки и команда как минимум из двух аналитиков или ML инженеров. Стоимость таких специалистов зависит от объема задач – будет ли это решение предиктивной аналитики или потребуются применение технологий компьютерного зрения или NLP.

Целесообразность развития собственного отдела, как уже писали, зависит от возможности масштабирования. В некоторых случаях компании предпочитают создавать отдел инноваций или иметь выделенного координатора по интеграции, который находит интересные аналитические решения на рынке и встраивает их в существующие корпоративные платформы.

Для того, чтобы компании могли оценить свой оптимальный путь для внедрения аналитики в бизнес-процессы, необходимо составить таблицу альтернативных подходов, отметить их достоинства и недостатки, посчитать бюджеты и сроки реализации. Но для начала надо определиться со стратегическими целями внедрения аналитики и списком приоритетных задач.

Дополнительно

Больше статей о подходах к аналитическим решениям вы найдете в нашем блоге:

Оставьте заявку и получите бюджет и план внедрения наших решений в ваш бизнес

    Заполняя форму, Вы соглашаетесь с правилами обработки персональных данных.

    We use cookies and other technologies to make our Website and its services convenient for you. By continuing to visit or use our services, you are agreeing to the use of Cookies and similar technologies for the purposes we describe in the «Cookie Statement»