Лого SiteHere.ru

Профессия Data Scientist

Профессия Data Scientist

Мир меняется очень быстро. Многие профессии становятся неактуальными. Но есть специалисты, на которых сейчас большой спрос и многие компании занимаются обучением in-house. Речь идет о профессии Data Scientist.

В этой статье вы узнаете, что это за люди, чем они занимаются, какие зарплаты у Data Scientist-ов и где можно обучиться этой профессии.

Поехали!

Содержание

Data Scientist – кто это?

Data Scientist – кто это?

В переводе с английского Data Scientist — это ученый по данным. Но такое определение проливает свет на новую специальность только частично, ведь есть другие профессии, представители которых работают с данными. Самые близкие — это бизнес-аналитики, программисты и тренд-споттеры.

Отличают профессии следующие параметры:

  • объем исследуемых данных;
  • глубина анализа;
  • цель исследования;
  • используемые инструменты.

Data Scientist — это специалист, который работает с большими массивами данных, используя инструменты программирования, алгоритмы машинного обучения и нейросети. С помощью создания предиктивных моделей и поиска закономерностей в массивах профессионалы в этой области знаний прогнозируют будущие события или разрабатывают предложения для оптимизации бизнес-процессов.

Чтобы работать ученым по данным, необходимо хорошо знать математику, разбираться в методах статистического анализа, программирования, прогнозирования, а также иметь определенные знания в конкретной сфере бизнеса. Последний пункт считается не обязательным и профессия считается универсальной. Но специалист, который знает суть бизнес-процессов в конкретной сфере, будет более ценен для предприятия, так как способен сделать более вменяемые выводы из анализа.

Отличия от близких профессий:

  • бизнес-аналитик обычно не умеет работать с очень большими массивами данных, для этого нужны специальные программные инструменты;
  • программист не всегда способен разработать адекватную данным модель, а тем более увидеть полезные конкретному бизнесу закономерности.

Внимание! Профессия Data Scientist при поиске сотрудника разными компаниями может называться по-разному: ученый по данным, аналитик-программист, статистик, математик-программист, аналитик данных, аналитик-исследователь, специалист по анализу данных, специалист по Big Data.

Зарплата Data Scientist

Зарплата Data Scientist

Зарплата специалиста по данным зависит в первую очередь от опыта работы и уровня умений.

Так по статистическим данным сайта habr во втором полугодии 2019 в России максимальный заработок ученого по данным составил около 225 000 р. Подробнее в таблице.

Приблизительные размеры ЗП специалистов по данным во втором полугодии 2019:

Должность Минимальная ЗП, р. Максимальная ЗП, р. Диапазон средних ЗП, р. Медиана, р.
Ученый по данным 42 000 225 000 65 000 — 135 000 105 000
Аналитик по данным 145 000 170 000 60 000 — 140 000 100 000

На размер зарплаты Data Scientist влияет:

  • страна: в США зарплаты выше, чем в России, например;
  • регион и город: в Москве заработок более привлекателен, чем на периферии РФ;
  • компания: самые высокие ЗП IT-специалистам сейчас предлагает Ozon;
  • способ предоставления услуг: на фрилансе зарплата может быть ниже.

Чем занимаются и что делают Data Scientist?

В список того, что входит в обязанности специалиста по большим данным в основном входит:

  1. Сбор данных. Специалист ищет каналы, где можно собрать необходимую информацию, и изучает возможности ее получения из найденных источников.
  2. Проверка. Данные валидируют, проверяют на наличие аномалий, и отсекают слишком неадекватные значения, которые могут сбить с толку при последующем анализе.
  3. Анализ. Поиск закономерностей, изучение их, подтверждение поставленных гипотез или их опровержение, выводы.
  4. Визуализация. Презентация результатов анализа в том виде, в котором ее с легкостью поймет обычный человек. Для этого используют графики и диаграммы, например.
  5. Действие. Использование результатов анализа и его выводов для оптимизации деятельности предприятия. Принятие решений о корректировке, например, маркетинговой или финансовой стратегии, увеличении размеров финансирования какого-либо бизнес-направления компании.

Для качественной работы нужно знать:

  • основы статистики и способы использования машинного обучения;
  • базы данных MySQL и Postgres;
  • Hadoop and MapReduce.
  • технологии визуализации данных и отчетности;
  • языки программирования SAS, Python или R.

Интересно! Результаты работы специалиста по Data Science могут быть самыми разнообразными: от создания системы рекомендации товаров на основании поведения клиентов до системы самоуправления беспилотным автомобилем.

Кем можно работать в аналитических проектах?

Присутствия специалиста по данным в аналитических проектах объясняется необходимостью организации массивов данных и их обработки. Поэтому нужных специалистов делят на две группы:

  • занимающиеся трансформацией данных;
  • обработчики данных.

На уровне трансформации статистической информации найдут свое место ETL-специалисты. Представители этой профессии занимаются преобразованием неструктурированных массивов в БД. Им предлагают следующие должности:

  • Data Engineer — гарантирует сохранность данных, их целостность, и оптимальность размещения;
  • разработчик баз данных — отвечает за поддержку работоспособности БД;
  • архитектор БД — проектирует структуру хранения данных.

Специалисты на уровне обработки отвечают за анализ аккумулированной на предыдущем этапе информации. Это делается с целью получить подтверждение или опровержение своих гипотез, найти закономерности и использовать в интересах компании. К этой группе относятся должности:

  • аналитик — занимается составлением прогнозов, анализом метрик, проведением экспериментов;
  • Data scientist — используя данные создает продукт, который будет полезен компании (это может быть рекомендательная система, например);
  • BI-специалист — визуализирует собранные массивы и аналитику, создает интерактивный dashboard;
  • ML Engineer — отвечает за разработку и развитие Data Driven продуктов.

Самым востребованным можно считать ML Engineer, так как у него больше всего вариантов трудоустройства. По сути, это специалист по разработке алгоритмов:

  • нейросети;
  • голосовые помощники;
  • Object detection;
  • GAN;
  • Black-box Al.

Человек такой профессии будет востребован в сферах безопасности, маркетинга (предсказание спроса), там, где важна предиктивная аналитика, распознавание объектов и других.

Компании для трудоустройства на должность Data Scientist можно разделить на три группы:

  • большие интернет-компании;
  • стартапы по обработке данных;
  • исследовательские организации.

Какие знания и навыки нужны аналитику данных?

Особенность профессии в умении не только исследовать данные, но и способность сделать правильные выводы из анализа и уметь донести информацию топ-менеджерам.

Основные необходимые навыки и разделяют на две группы:

  • Hard skills;
  • Soft skills.

Идеально, когда специалист владеет и теми и другими. Если бизнес-проект предполагает несколько должностей аналитика, то навыки можно разделить по специальностям. Так умения первой группы обязательны собственно ученому по данным, а Soft-навыки нужны больше специалисту в конкретной сфере, который анализирует выводы первого.

Hard skills:

  • умение понять, что хочет заказчик;
  • знание разных видов отчетности и умение ее анализировать;
  • технические навыки сбора, очистки, трансформации и визуализации данных;
  • знание способов интерпретации данных и умение обосновать выводы;
  • навык разработки требований к инструментам аналитики и сопровождение их внедрения;
  • опыт проведения А/Б тестов и подготовки аналитики для принятия стратегических решений.

Soft skills:

  • знание основ математики и статистического анализа;
  • развитое абстрактное мышление;
  • умение создавать скетчи и прототипы;
  • талант видеть в цифрах и показателях физический смысл;
  • умение видеть причинно-следственные связи между событиями;
  • развитый эмоциональный интеллект;
  • коммуникационные способности и умение формировать и подавать топам рекомендации.

В зависимости от задач специальности аналитик должен освоить следующие технические инструменты:

  1. BI-аналитик:
    • инструменты майнинга и OLAP: SAS, Knime, R, RapidMiner, Weka, частично Python;
    • инструменты BI: Tableu или, например, Power BI.
  2. Аналитику данных и Data Scientist обязательны:
    • углубленное знание инструментов майнинга;
    • интерактивные оболочки Zeppelin, Jupiter;
    • аналитические инструменты и библиотеки визуализации внутри Python и R.
  3. Всем специалистам Data Science:
    • электронные таблицы;
    • инструменты обработки данных и доступа к ним: SQL, СУБД, ETL и хранилища данных;
  4. Data Scientist и аналитику данных:
    • инструменты автоматизации;
    • библиотеки визуализации Python и R;
    • инструмент анализа с помощью Python и R;
    • инструменты развертывания, например, Airflow или Docker.

Как стать Data Scientist: где учиться?

Как стать Data Scientist: где учиться?

Ученый по данным еще достаточно новая профессия и мало в каких вузах можно ее освоить. Data Science доступна:

  • в Высшей Школе Экономики на Факультете компьютерных наук;
  • в МФТИ на Факультете инноваций и высоких технологий;
  • Магистерские программы по большим данным на факультете ВМиК МГУ и в СПБГУ.

Существуют также разнообразные коммерческие и некоммерческие онлайн и оффлайн курсы:

  1. Курс от Skillbox.
  2. Курс от Нетологии.
  3. Курс от GeekBrains.
  4. Техносфера Mail.Ru и факультета ВМиК МГУ.
  5. Технопарк Mail.Ru и МГТУ им. Баумана.
  6. Программа Skillfactory.
  7. Школа Анализа Данных «Яндекса».
  8. Курсы анализа данных и машинного обучения на Coursera, Udacity, Stepic

Рассмотрим подробнее некоторые самые популярные онлайн-курсы.

Профессия «Data Scientist» от Skillbox

Профессия «Data Scientist» от Skillbox

Курс от Skillbox рассчитан на 18 месяцев и подходит как новичкам, так и имеющим опыт в программировании и аналитике. По сути, это 300 часов занятий онлайн, которые большинство студентов проходят в среднем за год. В результате вы имеете возможность стать специалистом по анализу данных, алгоритмам машинного обучения и нейросетям.

Программа состоит из 8 курсов разных уровней сложности, которые можно приравнять к году практической работы:

  1. Анализ данных. Два курса: начальный и средний.
  2. Математика для Data Science.
  3. Универсальные знания программиста.
  4. Статистика и теория вероятностей.
  5. Машинное обучение. Два курса и соответственно уровни: начальный и средний.
  6. Английский для специалистов по интернет-технологиям.

В процессе вы освоите следующие инструменты: Jupyter; NumPy, R и Python; и SciPy и другие.

Обучение состоит из самостоятельной работы и общения с преподавателями. Процесс включает выполнение заданий, работу с наставником и в конце — защиту дипломной работы.

Выпускники получают одну из двух специализаций:

  • машинное обучение;
  • эксперт по анализу массивов данных.

Особенности программы:

  • возможность выбора одной из двух специализаций во время обучения;
  • практическая работа с реальными данными из различных сфер бизнеса;
  • участие в сообществе школы, помощь преподавателя и обратная связь;
  • учителя-практики.

Стоимость: 135000 р. (это 5900 р. в месяц или 3900 р. — со скидкой).

Гражданам РФ есть возможность оплатить курс частями с отсрочкой начала оплаты на 6 месяцев.

Компания гарантирует трудоустройство.

Профессия «Data Scientist» от Нетологии

Профессия «Data Scientist» от Нетологии

Курс от Нетологии обещает научить участников строить и обучать предиктивные модели, используя алгоритмы машинного обучения и построение нейросетей. Программа подойдет:

  • аналитикам;
  • разработчикам;
  • топ-менеджерам в IT.

Обучение на Data Scientist с возможностью трудоустройства проходит в формате онлайн-вебинаров и очных лекций в Москве. По результатам выдается диплом о профессиональной переподготовке.

В программу включены следующие курсы:

  • SQL и получение данных;
  • Python и математика для анализа данных;
  • Feature engineering и предобработка данных;
  • построение модели;
  • работа с заказчиком;
  • рекомендательные системы;
  • распознавание изображений, машинное зрение;
  • обработка естественного языка (NLP).
  • итоговый хакатон;
  • написание дипломной работы.

Внимание! Модуль по машинному обучению проходит очно в Кампусе в Москве.

Стоимость курса составляет 200000 р., при оплате частями 16667 р. в месяц.

В результате учащийся получает ряд ключевых умений:

  • собирать и готовить данные для обработки;
  • создавать нейросети;
  • генерировать тексты и изображения;
  • создавать рекомендательные системы;
  • выбирать, создавать и реализовывать алгоритмы под конкретные задачи и фичи для аналитических и предиктивных моделей.

Преимущества:

  1. По окончанию курса построены и созданы:
    • нейросеть,
    • классификатор изображений;
    • чат-бот для поиска авиабилетов;
    • рекомендательные системы для музыкального и киносайта;
    • готовый к внедрению ml-проект.
  2. Получение диплома о профессиональной переподготовке и удостоверения о повышении квалификации.
  3. Центр развития карьеры поможет с подготовкой и написанием резюме, подготовит с интервью и найдет подходящие вакансии.

Факультет «Искусственного интеллекта» в GeekBrains

Факультет «Искусственного интеллекта» в GeekBrains

Онлайн-университет от @mail.ru group обещает обучить профессии Data Science полностью с нуля: достаточно школьной подготовки. Всего за 18 месяцев студенты подружатся с технологиями машинного обучения и нейронными сетями, научатся решать реальные бизнес-задачи. Компания предоставляет все необходимые для работы и обучения ресурсы и инструменты, включая построенный на практических задачах курс по высшей математике.

Стоимость 12500 р. в месяц. Возможна рассрочка.

Бонусы новым студентам:

  • доступ в базу обучающих воркшопов и мастер-классов — GeekClub;
  • специализированный курс английского языка для ИТ-специалистов.

После курса выпускник получает диплом о профессиональной подготовке и сертификат о прохождении курсов Data Science.

Доступными станут следующие профессии:

  • Машинное обучение;
  • Нейронные сети;
  • Анализ данных;
  • Искусственный интеллект;
  • Data Science.

Обучение профессии Data Scientist с нуля от Skillfactory

Полный курс по Data Science от Skillfactory тоже подойдет для новичков. Обучить профессии с нуля здесь обещают за 12 месяцев.

Обучение доступно из любой точки мира в формате онлайн.

Программа включает курсы:

  • Основы программирования на Python и Python для анализа данных;
  • Math&Stat;
  • Практический Machine Learning;
  • Deep Learning и нейронные сети;
  • Менеджмент;
  • Data Engineering.

Стоимость: 10000 р. в месяц (доступны различные скидки и акции).

Преимущества:

  • наличие курсов-тренажеров;
  • индивидуальная поддержка ментора;
  • 10 готовых проектов для профессионального портфолио;
  • помощь в трудоустройстве;
  • соревнования и хакатоны.

Выводы

Data Scientist — это специалист по трансформации и обработке больших массивов данных, что отличает его от смежных профессий. Кандидат на эту специальность должен знать математику, статистику и иметь аналитический склад ума. Хотя, чтобы освоить науку, иметь образование аналитика или программиста не обязательно: научиться можно с нуля.

Ученый по данным должен знать:

  • математику и статистику;
  • машинное обучение;
  • основы построения нейросетей;
  • инструменты программного анализа с помощью R, Python или другие.

В обязанности такого аналитика входит трансформация и обработка данных. В рамках этого они проводят сбор, группировку, визуализацию данных и построение моделей для прогнозов и поиска закономерностей.

Data Scientist может работать в больших интернет-компаниях, стартапах, занимающихся анализом массивов информации или в исследовательских организациях.

Среди подходящие должностей в аналитических проектах:

  • архитектор БД;
  • ML-Engineer;
  • Data Scientist;
  • BI-специалист.

Профессия очень востребована и важна, что подтверждается и зарплатой. Ученому по данным в России можно заработать даже 225 000 в месяц. Хотя средний показатель ЗП ниже: от 60 000 до 140 000 р.

Несмотря на новизну профессии, обучиться ей уже можно и оффлайн и онлайн. В зависимости от конкретной специализации и предлагаемых к освоению компетенций длительность обучения составляет от полугода до 2 лет (это не говоря о магистерских специализациях в вузах).

Например, на таких популярных онлайн-платформах как Нетология, Skillfactory, Майл.ру и Skillbox обучение Data Scientist с 0 до Pro в можно закончить в среднем за год. При чем эти компании предлагают не просто теорию, а практическое обучение с добавлением сделанных проектов в портфолио.

Подытоживая, можно сказать, что профессия Data Scientist, очень востребована и хорошо оплачиваема, а освоить ее можно даже за год. И хотя за 12 месяцев профессионалом на ЗП в 225000 вы не станете, но в перспективе все возможно.

С Уважением, Юрий Немец и команда Exore!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *