Лого SiteHere.ru

Профессия Data Scientist: зарплаты, навыки, трудоустройство

Профессия Data Scientist

Мир меняется очень быстро. Многие профессии становятся неактуальными. Но есть специалисты, на которых сейчас большой спрос и многие компании занимаются обучением in-house. Речь идет о профессии Data Scientist.

В этой статье вы узнаете, что это за люди, чем они занимаются, какие зарплаты у Data Scientist-ов, где можно обучиться этой профессии и насколько перспективная эта профессия.

Поехали!

Содержание

Data Scientist – кто это?

Data Scientist – кто это?

В переводе с английского Data Scientist — это ученый по данным. Но такое определение проливает свет на новую специальность только частично, ведь есть другие профессии, представители которых работают с большими данными. Самые близкие — это бизнес-аналитики, программисты и тренд-споттеры.

Отличают профессии следующие параметры:

  • объем исследуемых данных;
  • глубина анализа;
  • цель исследования;
  • используемые инструменты.

Data Scientist — это специалист, который работает с большими массивами данных, используя инструменты программирования, алгоритмы машинного обучения и нейросети. С помощью создания предиктивных моделей и поиска закономерностей в массивах профессионалы в этой области знаний прогнозируют будущие события или разрабатывают предложения для оптимизации бизнес-процессов.

Чтобы работать ученым по данным, необходимо хорошо знать математику, разбираться в методах статистического анализа, программирования, прогнозирования, а также иметь определенные знания в конкретной сфере бизнеса. Последний пункт считается не обязательным и профессия считается универсальной. Но специалист, который знает суть бизнес-процессов в конкретной сфере, будет более ценен для предприятия, так как способен сделать более вменяемые выводы из анализа.

Где обучаться Data Scientist?

Предоставляют гарантию трудоустройства

Предлагают стажировку и работу в крупных компаниях

Отличия от близких профессий:

  • бизнес-аналитик обычно не умеет работать с очень большими массивами данных, для этого нужны специальные программные инструменты;
  • программист не всегда способен разработать адекватную данным модель, а тем более увидеть полезные конкретному бизнесу закономерности.

Внимание! Профессия Data Scientist при поиске сотрудника разными компаниями может называться по-разному: ученый по данным, исследовать, аналитик-программист, статистик, математик-программист, аналитик данных, аналитик-исследователь, специалист по анализу данных, специалист по Big Data (больших данных).

Зарплата Data Scientist

Зарплата Data Scientist

Зарплата специалиста по данным на рынке труда зависит в первую очередь от опыта работы и уровня умений. Кроме этого на рост зарплат сказывается тот факт, что на рынке еще мало качественных кадров.

Так по статистическим данным сайта habr во втором полугодии 2019 в России (а точнее в Москве) максимальный заработок ученого по данным составил около 225 000 рублей в месяц. Подробнее в таблице.

Приблизительные размеры ЗП специалистов по данным во втором полугодии 2019:

Должность Минимальная ЗП, р. Максимальная ЗП, р. Диапазон средних ЗП, р. Медиана, р.
Ученый по данным 42 000 225 000 65 000 — 135 000 105 000
Аналитик по данным 145 000 170 000 60 000 — 140 000 100 000

На размер зарплаты Data Scientist влияет:

  • страна: в США зарплаты выше, чем в России, например; зарплаты специалистов Data Scientists доходят до 9 936 000 рублей (138 000$) в год или 828 000 рублей в месяц, а у программистов средняя зарплата 4 680 000 — 5 760 000 рублей (65 000 — 80 000$) в год, исследование проводила компания O’Reilly Media;
  • регион и город: в Москве заработок более привлекателен, чем на периферии РФ;
  • компания: самые высокие ЗП IT-специалистам сейчас предлагает Ozon;
  • способ предоставления услуг: на фрилансе зарплата может быть ниже.
  • дополнительные знания в этой области, например, знания методов статистического анализа данных или же построения математических моделей

Чем занимаются и что делают Data Scientist?

В список того, что входит в обязанности специалиста по большим данным в основном входит:

  1. Сбор данных. Специалист ищет каналы, где можно собрать необходимую информацию, и изучает возможности ее получения из найденных источников.
  2. Проверка. Данные валидируют, проверяют на наличие аномалий, и отсекают слишком неадекватные значения, которые могут сбить с толку при последующем анализе.
  3. Анализ. Поиск закономерностей, изучение их, подтверждение поставленных гипотез или их опровержение, выводы.
  4. Визуализация. Презентация результатов анализа в том виде, в котором ее с легкостью поймет обычный человек. Для этого используют графики и диаграммы, например.
  5. Действие. Использование результатов анализа и его выводов для оптимизации деятельности предприятия. Принятие решений о корректировке, например, маркетинговой или финансовой стратегии, увеличении размеров финансирования какого-либо бизнес-направления компании.

Для качественной работы нужно знать:

  • основы статистики и способы использования машинного обучения;
  • базы данных MySQL и Postgres;
  • Hadoop and MapReduce.
  • технологии визуализации данных и отчетности;
  • языки программирования SAS, Java (Hadoop), MapReduce, Python или R.

Интересно! Результаты работы специалиста по Data Science могут быть самыми разнообразными: от создания системы рекомендации товаров на основании поведения клиентов до системы самоуправления беспилотным автомобилем. Все это, конечно же, начинается с Data Mining или сбора данных.

Кем можно работать в аналитических проектах?

Присутствия специалиста по данным в аналитических проектах объясняется необходимостью организации массивов данных и их обработки. Поэтому нужных специалистов делят на две группы:

  • занимающиеся трансформацией данных;
  • обработчики данных.

На уровне трансформации статистической информации найдут свое место ETL-специалисты. Представители этой профессии занимаются преобразованием неструктурированных массивов данных в БД. Им предлагают следующие должности:

  • Data Engineer — гарантирует сохранность данных, их целостность, и оптимальность размещения;
  • разработчик баз данных — отвечает за поддержку работоспособности БД;
  • архитектор БД — проектирует структуру хранения данных.

Специалисты на уровне обработки отвечают за анализ аккумулированной на предыдущем этапе информации. Это делается с целью получить подтверждение или опровержение своих гипотез, найти закономерности и использовать в интересах компании. К этой группе относятся должности:

  • аналитик — занимается составлением прогнозов, анализом метрик, проведением экспериментов;
  • Data scientist — используя данные создает продукт, который будет полезен компании (это может быть рекомендательная система, например);
  • BI-специалист — визуализирует собранные массивы и аналитику, создает интерактивный dashboard;
  • ML Engineer — отвечает за разработку и развитие Data Driven продуктов.

Самым востребованным можно считать ML Engineer, так как у него больше всего вариантов трудоустройства. По сути, это специалист по разработке алгоритмов:

  • нейросети;
  • голосовые помощники;
  • Object detection;
  • GAN;
  • Black-box Al.

Человек такой профессии будет востребован в сферах безопасности, маркетинга (предсказание спроса), там, где важна предиктивная аналитика, распознавание объектов, текстовая аналитика и других.

Компании для трудоустройства на должность Data Scientist можно разделить на три группы:

  • большие интернет-компании;
  • стартапы по обработке данных;
  • исследовательские организации.

Какие знания и навыки нужны аналитику данных?

Особенность профессии в умении не только исследовать данные, но и способность сделать правильные выводы из анализа и уметь донести информацию топ-менеджерам.

Основные необходимые навыки и разделяют на две группы:

  • Hard skills;
  • Soft skills.

Идеально, когда специалист владеет и теми и другими. Если бизнес-проект предполагает несколько должностей аналитика, то навыки можно разделить по специальностям. Так умения первой группы обязательны собственно ученому по данным, а Soft-навыки нужны больше специалисту в конкретной сфере, который анализирует выводы первого.

Hard skills:

  • умение понять, что хочет заказчик;
  • знание разных видов отчетности и умение ее анализировать;
  • технические навыки сбора, очистки, трансформации и визуализации данных;
  • знание способов интерпретации данных и умение обосновать выводы;
  • навык разработки требований к инструментам аналитики и сопровождение их внедрения;
  • опыт проведения А/Б тестов и подготовки аналитики для принятия стратегических решений.

Soft skills:

  • знание основ математики и статистического анализа;
  • развитое абстрактное мышление;
  • умение создавать скетчи и прототипы;
  • талант видеть в цифрах и показателях физический смысл;
  • умение видеть причинно-следственные связи между событиями;
  • развитый эмоциональный интеллект;
  • коммуникационные способности и умение формировать и подавать топам рекомендации.

В зависимости от задач специальности аналитик должен освоить следующие технические инструменты:

  1. BI-аналитик:
    • инструменты майнинга и OLAP: SAS, Knime, R, RapidMiner, Weka, частично Python;
    • инструменты BI: Tableu или, например, Power BI.
  2. Аналитику данных и Data Scientist обязательны:
    • углубленное знание инструментов майнинга;
    • интерактивные оболочки Zeppelin, Jupiter;
    • аналитические инструменты и библиотеки визуализации внутри Python и R.
  3. Всем специалистам Data Science:
    • электронные таблицы;
    • инструменты обработки данных и доступа к ним: SQL, СУБД, ETL и хранилища данных;
  4. Data Scientist и аналитику данных:
    • инструменты автоматизации;
    • библиотеки визуализации Python и R;
    • инструмент анализа с помощью Python и R;
    • инструменты развертывания, например, Airflow или Docker.

Интервью с продуктовым аналитиком сервиса «Где мои дети» Борисом Голдбиным

Интервью Борис Голдбин

Борис Голдобин — продуктовый аналитик, Data Scientist сервиса “Где мои дети”, занимается исследованием пути пользователей. В своей работе использует распространенные методы машинного обучения, генерации признаков, алгоритмы кластеризации, классификации и многое другое.

Считает, что в России разницу между дата инженером, дата саентистом и аналитиком понимают очень слабо, поэтому приходится делать понемногу все и называться аналитиком.

Кратко о компании "Где мои дети":

«Где мои дети» — резидент Сколково, Технопарк Пермь, победитель Moscow Urban forum, ТОП-1 в категории Материнство и детство Google play, ТОП-5 категории образование Appstore.

  • Какова востребованность и конкуренция в СНГ и Европе/США?

    Сфера профиля достаточно широкая, но анализ данных при помощи методов машинного обучения в какой-то мере используют многие российские и зарубежные компании.

    С каждым годом бизнес как в России, так и за рубежом все больше понимает необходимость анализа данных и прямые выгоды, которые они могут получить. Потихоньку приходит понимание, что с данными работают не только аналитики.

  • Стоит ли идти гуманитарию?

    Деление на гуманитариев и математиков само по себе очень странное. Понятно, что профильные знания статистики и программирования сильно облегчат путь становления экспертом.

    Но сейчас есть множество курсов и, что более важно, чемпионатов, где можно проверить свои силы и понять, как из цифр рождаются выводы, инсайты и деньги.

  • Обязательно ли профильное образование для работы Data Scientist?

    Нет, но будет проще. Многие Data Scientist имеют образование, связанное с математикой, физикой, строительством или экономикой.

    Стоит понимать, что задачи решаются разные, и в тех, которые связаны с текстом, может помочь лингвистическое образование, которое на первый взгляд очень далеко от машинного обучения.

  • Лучше западные компании рассматривать или в России также есть спрос?

    В России тоже есть спрос. Думаю, надо сравнивать офферы и задачи перед дата саентистом, в меньшей степени компании.

    В теории надо понимать, насколько твои профессиональные умения совпадают с узкой сферой деятельности компании, какой уровень ответственности и свободы предполагается и, наконец, какую зарплату предлагают и какие по ней есть перспективы.

  • Можно ли работать удаленно Data Scientist?

    Однозначно да.

  • Самые популярные ошибки на собеседованиях Data Scientist?

    Почти все ученые очень увлечены процессом, техническими моментами и прочими узкоспециализированными нюансами. И любят рассказывать об этом. При этом они совершенно забывают, что познания менеджмента в этой области мягко говоря не сильны, и руководству важнее, чтобы соискатель понимал поставленные задачи с точки зрения зачем и почему, а не как.

    Для проверки технических скилов есть тестовые задания и портфолио. На собеседовании важнее представить свои софт скиллы и понимание процессов.

  • Что спрашивают на собеседовании и сложно ли устроиться?

    Обычно дается тестовое задание, приближенное к задаче, которой предстоит заниматься. Например, могут попросить найти фрод или посчитать кредитный скоринг на данных, которые предоставляет компания.

    На собеседовании уже пойдет обсуждение задания, использованной техники и других возможных вариантов решения задачи. Часто возникают дополнительные вопросы по портфолио, а также вопросы с подтекстом, чтобы выяснить правду о софт скиллах кандидата и понять, насколько он соответствует ценностям компании.

  • В каких сферах деятельности будет наиболее востребован Data Scientist в ближайшие 10 лет?

    • Финансовая сфера (торговые стратегии и их оптимизация);
    • Банковская сфера (кредитный скоринг, определение фрода и пр.);
    • Маркетинг (deepfake: создание реалистичных копий голоса и изображения по данным реальных людей и распознавание таких подделок; таргетированные рассылки и персонализированные предложения на основании данных о клиенте, а также оптимизация трафика);
    • Продуктовая аналитика (предсказание и изменение поведения пользователей и склонение их к покупкам).

Как стать Data Scientist: где учиться?

Как стать Data Scientist: где учиться?

Ученый по данным еще достаточно новая профессия и мало в каких вузах можно ее освоить. Data Science доступна:

  • в Высшей Школе Экономики на Факультете компьютерных наук;
  • в МФТИ на Факультете инноваций и высоких технологий;
  • Магистерские программы по большим данным на факультете ВМиК МГУ и в СПБГУ.

Существуют также разнообразные коммерческие и некоммерческие онлайн и оффлайн курсы:

  1. Курс от Skillbox.
  2. Курс от Нетологии.
  3. Курс от GeekBrains.
  4. Техносфера Mail.Ru и факультета ВМиК МГУ.
  5. Технопарк Mail.Ru и МГТУ им. Баумана.
  6. Программа Skillfactory.
  7. Школа Анализа Данных «Яндекса».
  8. Курсы анализа данных и машинного обучения на Coursera, Udacity, Stepic

Рассмотрим подробнее некоторые самые популярные онлайн-курсы.

Профессия «Data Scientist» от Skillbox

Профессия «Data Scientist» от Skillbox

Курс от Skillbox рассчитан на 18 месяцев и подходит как новичкам, так и имеющим опыт в программировании и аналитике. По сути, это 300 часов занятий онлайн, которые большинство студентов проходят в среднем за год. В результате вы имеете возможность стать специалистом по анализу данных, алгоритмам машинного обучения и нейросетям.

Вы будете проходить курс под руководством преподавателей из НИУ ВШЭ, работать с инженерами из NVIDIA.

Программа состоит из 8 курсов разных уровней сложности, которые можно приравнять к году практической работы:

  1. Анализ данных. Два курса: начальный уровень и средний.
  2. Математика для Data Science.
  3. Универсальные знания программиста.
  4. Статистика и теория вероятностей, математическая статистика и визуализация данных.
  5. Машинное обучение. Два курса и соответственно уровни: начальный и средний уровень.
  6. Английский для специалистов по интернет-технологиям.

В процессе вы освоите следующие инструменты: Jupyter; NumPy, R и Python; и SciPy и другие.

Обучение состоит из самостоятельной работы и общения с преподавателями. Процесс включает выполнение заданий, работу с наставником и в конце — защиту дипломной работы.

Выпускники получают одну из двух специализаций:

  • машинное обучение;
  • эксперт по анализу массивов данных.

Особенности программы:

  • возможность выбора одной из двух специализаций во время обучения;
  • практическая работа с реальными данными из различных сфер бизнеса;
  • участие в сообществе школы, помощь преподавателя и обратная связь;
  • учителя-практики.

Цена: 135000 р. (это 5900 р. в месяц или 3900 р. — со скидкой).

Гражданам РФ есть возможность оплатить курс частями с отсрочкой начала оплаты на 6 месяцев.

Компания гарантирует трудоустройство.

При трудоустройстве все же необходимо будет показать решения нестандартных и сложных задач на логику и ответить на необходимые вопросы.

Как правило, перед покупкой курса рекомендуем пройти консультацию у этой онлайн-школы и узнать подробно все условия.

Профессия «Data Scientist» от Нетологии

Профессия «Data Scientist» от Нетологии

Курс от Нетологии обещает научить участников строить и обучать предиктивные модели, используя алгоритмы машинного обучения и построение нейросетей. Программа подойдет:

  • аналитикам;
  • разработчикам;
  • топ-менеджерам в IT.

Обучение на Data Scientist с возможностью трудоустройства проходит в формате онлайн-вебинаров и очных лекций в Москве. По результатам выдается диплом о профессиональной переподготовке.

На курсе вас будут ждать преподаватели из NVIDIA, Google и Яндекс Метрики.

В программу включены следующие курсы:

  • Сбор и подготовка данных;
  • SQL и получение данных;
  • Python и математика для анализа данных;
  • Feature engineering и предобработка данных;
  • построение модели;
  • работа с заказчиком;
  • рекомендательные системы;
  • распознавание изображений, машинное зрение;
  • обработка естественного языка (NLP).
  • итоговый хакатон;
  • написание дипломной работы.

Внимание! Модуль по машинному обучению проходит очно в Кампусе в Москве.

Цена курса составляет 200000 р., при оплате частями 16667 р. в месяц.

В результате учащийся получает ряд ключевых умений:

  • собирать и готовить данные для обработки;
  • создавать нейросети;
  • генерировать тексты и изображения;
  • создавать рекомендательные системы;
  • выбирать, создавать и реализовывать алгоритмы под конкретные задачи и фичи для аналитических и предиктивных моделей.

Преимущества:

  1. По окончанию курса построены и созданы:
    • нейросеть;
    • классификатор изображений;
    • чат-бот для поиска авиабилетов;
    • рекомендательные системы для музыкального и киносайта;
    • готовый к внедрению ml-проект.
  2. Получение диплома о профессиональной переподготовке и удостоверения о повышении квалификации.
  3. Центр развития карьеры поможет с подготовкой и написанием резюме, подготовит с интервью и найдет подходящие вакансии.

Факультет «Искусственного интеллекта» в GeekBrains

Факультет «Искусственного интеллекта» в GeekBrains

Онлайн-университет от @mail.ru group обещает обучить профессии Data Science полностью с нуля: достаточно школьной подготовки. Всего за 18 месяцев студенты подружатся с технологиями машинного обучения и нейронными сетями, научатся решать реальные бизнес-задачи. Компания предоставляет все необходимые для работы и обучения ресурсы и инструменты, включая построенный на практических задачах курс по высшей математике.

Стоимость 12500 рублей в месяц. Возможна рассрочка.

Бонусы новым студентам:

  • доступ в базу обучающих воркшопов и мастер-классов — GeekClub;
  • специализированный курс английского языка для ИТ-специалистов.

После курса выпускник получает диплом о профессиональной подготовке и сертификат о прохождении курсов Data Science.

Доступными станут следующие профессии:

  • Машинное обучение;
  • Нейронные сети;
  • Анализ массивов данных;
  • Искусственный интеллект;
  • Data Science.

Все обучение будет проходить в формате видеолекций, вебинаров и воршкопов.

Обучение профессии Data Scientist с нуля от Skillfactory

Полный курс по Data Science от Skillfactory тоже подойдет для новичков. Обучить профессии с нуля здесь обещают за 12 месяцев.

Обучение доступно из любой точки мира в формате онлайн.

Программа включает курсы:

  • Основы программирования на Python и Python для анализа массива данных;
  • Math&Stat;
  • Практический Machine Learning;
  • Deep Learning и нейронные сети;
  • Менеджмент;
  • Data Engineering.

Стоимость: 10 тысяч р. в месяц (доступны различные скидки и акции).

Преимущества:

  • наличие курсов-тренажеров;
  • индивидуальная поддержка ментора;
  • 10 готовых проектов для профессионального портфолио;
  • помощь в трудоустройстве;
  • соревнования в Kaggle и хакатоны.

Где обучаться Data Scientist?

Предоставляют гарантию трудоустройства

Предлагают стажировку и работу в крупных компаниях

Выводы

Data Scientist — это специалист по трансформации и обработке больших массивов данных, что отличает его от смежных профессий. Кандидат на эту специальность должен знать математику, статистику и иметь аналитический склад ума. Хотя, чтобы освоить науку, иметь образование аналитика или программиста не обязательно: научиться можно с нуля.

Ученый по данным должен знать:

  • математику и статистику;
  • машинное обучение;
  • основы построения нейросетей;
  • инструменты программного анализа с помощью R, Python или другие.

Также рекомендуем книгу Петера Флаха «Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. Учебник» (на русском языке).

В обязанности такого аналитика входит трансформация и обработка данных. В рамках этого они проводят сбор, группировку, визуализацию данных и построение моделей для прогнозов и поиска закономерностей.

Data Scientist может работать в больших интернет-компаниях, стартапах, занимающихся анализом массивов информации или в исследовательских организациях.

Среди подходящие должностей в аналитических проектах:

  • архитектор БД;
  • ML-Engineer;
  • Data Scientist;
  • BI-специалист.

Профессия очень востребована и важна, что подтверждается и зарплатой. Ученому по данным в России можно заработать даже 225 000 в месяц. Хотя средний показатель ЗП ниже: от 60 000 до 140 000 р.

Несмотря на новизну профессии, обучиться ей уже можно и оффлайн и онлайн. В зависимости от конкретной специализации и предлагаемых к освоению компетенций длительность обучения составляет от полугода до 2 лет (это не говоря о магистерских специализациях в вузах).

Например, на таких популярных онлайн-платформах как Нетология, Skillfactory, Майл.ру и Skillbox обучение Data Scientist с 0 до Pro в можно закончить в среднем за год. При чем эти компании предлагают не просто теорию, а практическое обучение с добавлением сделанных проектов в портфолио.

Подытоживая, можно сказать, что профессия Data Scientist, очень востребована и хорошо оплачиваема, а освоить ее можно даже за год. И хотя за 12 месяцев профессионалом на ЗП в 225 000 рублей в месяц вы не станете, но в перспективе все возможно.

С Уважением, Юрий Немец и команда Exore!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Содержание