Интервью с Senior Data Scientist из «Лаборатории Касперского» Яниной Баландюк-Опалинской
ПОЧЕМУ ВЫ РЕШИЛИ СТАТЬ DATA SCIENTIST-СПЕЦИАЛИСТОМ?
Я с детства хотела стать программистом, который решает интересные задачи. Эта мечта зародилась, когда в начальной школе мне купили первый компьютер и друг моих родителей, программист, пришел его настраивать. Меня впечатлило, как много он знает и как легко обращается с машиной.
В итоге я пошла учиться в школу с технологическим уклоном и потом поступила на факультет ВМК МГУ. Во время учебы в университете выбрала направление, связанное с компьютерной лингвистикой, по этому направлению потом нашла и работу. И отсюда уже пришла в Data Science, т.к. многие задачи обработки текста решаются с помощью машинного обучения. Считаю, что мечта исполнилась – задачи интересные, а программирование тоже является неотъемлемой частью профессии.
ЧЕМ ЗАНИМАЕТСЯ DATA SCIENTIST?
На самом деле каждый работодатель может вкладывать в это понятие свои представления. Где-то это по сути роль аналитика, где-то – человека, который только обучает модели. В других компаниях, как, например, в «Лаборатории Касперского», это скорее fullstack-специалист.
Если кратко, Data Scientist старается помогать бизнесу решать определенные задачи с помощью методов машинного обучения, статистики и других доступных ему инструментов. Задачи могут быть разные – от автоматизации рутинных процессов до поиска аномалий, группировки данных по каким-то признакам для анализа.
В ЧЕМ ОТЛИЧИЕ РАБОТЫ СИСТЕМНОГО АНАЛИТИКА И DATA SCIENTIST-СПЕЦИАЛИСТА?
Работа системного аналитика связана в основном со сбором требований, связи между собой заказчиков, разработчиков и пользователей. В Data Science мы тоже часто этим занимаемся, но все же это не основная деятельность. Больше времени Data Scientist занимается анализом данных, обучением, оценкой, развитием моделей машинного обучения, анализом ошибок, а также разработкой программ, использующих модели.
С КАКИМИ ТРУДНОСТЯМИ ЧАЩЕ ВСЕГО СТАЛКИВАЮТСЯ СПЕЦИАЛИСТЫ DATA SCIENTIST, В ТОМ ЧИСЛЕ ВЫПУСКНИКИ?
Во-первых, это может быть отрыв от реальных задач. Людей в вузах и на курсах обычно учат решать определенную задачу на конкретных данных, а в жизни это все еще нужно сначала самостоятельно сформулировать и собрать. Часто идеальных данных нет, зато есть дополнительные требования – по быстродействию, критичности ошибки и т.п.
Порой трудности могут возникать в рамках общения. Часто его бывает много: с заказчиками, руководителями, разработчиками, аналитиками. Иными словами, важно уметь общаться, формулировать задачи и возвращаться с обратной связью, человек должен быть готов прокачивать soft skills.
КАКИЕ ЛОЖНЫЕ СТЕРЕОТИПЫ СЛОЖИЛИСЬ ВОКРУГ ЭТОЙ ПРОФЕССИИ?
Наверное, из самых распространенных – это стереотипы о зарплате. На мой взгляд, зарплата в этой сфере хорошая, но, чтобы она росла, нужен прежде всего опыт и знания. Обычно условия обсуждаются с каждым кандидатом индивидуально.
Другой стереотип может быть чуть менее очевидным, речь о связи с наукой. Несмотря на название профессии, содержащее слово Scientist, очень немногие специалисты напрямую занимаются наукой, так как большинство задач хорошо решается проверенными методами.
КАК ВЫГЛЯДИТ РАБОЧИЙ ДЕНЬ DATA SCIENTIST-СПЕЦИАЛИСТА?
Рабочий день начинается у всех в разное время, в этом плане у IT-специалистов может быть достаточно гибкий график. Я начинаю рабочий день после того, как утром отвожу детей в сад. Наливаю кофе, проверяю почту, а затем приступаю к задачам - они могут быть разными, например: проверить, обучилась ли модель на распределенном кластере, подготовить код для запуска эксперимента, а также описание гипотезы по улучшению качества модели, обернуть готовую модель в сервис, добавить функционал в сервис.
СКОЛЬКО В СРЕДНЕМ ЗАРАБАТЫВАЕТ DATA SCIENTIST: junior, middle, senior?
Зарплата разнится, зависит от того, где вы работаете, например, в стартапе или большой компании, а также от требований к кандидатам и региона, где находится компания, и не только.
ЧЕГО В ПРОФЕССИИ ВЫ БОИТЕСЬ БОЛЬШЕ ВСЕГО?
У нас был опрос, в ходе которого почти половина респондентов в России признались, что верят в реальность восстания машин. Сразу скажу, я этого не боюсь. Впечатляющие результаты, которые показывают сейчас ML-модели – это все равно повторение того, на чем модель обучалась, это не «интеллект».
Лично у меня бывают периоды, когда интерес к обучению, узнаванию чего-то нового рассеивается, это огорчает. Обычно это происходит из-за усталости, ведь помимо работы есть другие дела и заботы. Сейчас я уже знаю, что это дело периодическое, так что в такие моменты стараюсь больше себе позволять отдыхать и заниматься другой различной деятельностью – спортом, творчеством, чтением художественной литературы, играми.
ОТ ЧЕГО ЗАВИСИТ УСПЕХ В ВАШЕЙ ПРОФЕССИИ?
От желания докопаться до сути задачи и решить ее, а не применить конкретный метод. Требуется широкий взгляд на задачу. От желания узнавать новое и быть в курсе новостей в области. Нужно знание английского – все новые статьи, документация выходят на английском языке. А еще – умение быстро разбираться в новой среде – как в новых методах и моделях, так и в предметных областях, если вы занимаетесь широким кругом задач в Data Science.
Новости
- Инвестиции в кадры: вызовы и стратегии российских IT-компаний Подробнее
- Зайти в айти: нужно ли образование для работы в инфотехе Подробнее
- Интервью с Senior Data Scientist из «Лаборатории Касперского» Яниной Баландюк-Опалинской Подробнее
- Зимняя встреча Kaspersky Academy Expert Community Подробнее
- Треть специалистов по кибербезопасности считают полученное ими высшее образование недостаточным для текущей работы Подробнее
- «Лаборатория Касперского» подвела итоги международного студенческого конкурса Secur'IT Cup 2023 Подробнее
- «Лаборатория Касперского» и ПГУТИ заключили соглашение Подробнее
- Онлайн-курс «Кибербезопасность для топ-менеджеров» Подробнее
- В ОГУ открыли научно-образовательный центр при участии «Лаборатории Касперского» и «АСУ ПРО» Подробнее
- «Лаборатория Касперского» провела региональные этапы международного конкурса Secur`IT Cup в России и СНГ, а также в странах Ближнего Востока, Турции и Африки (регион META) и странах Азиатско-Тихоокеанского региона (регион APAC) Подробнее