Интервью с Senior Data Scientist из «Лаборатории Касперского» Яниной Баландюк-Опалинской

ПОЧЕМУ ВЫ РЕШИЛИ СТАТЬ DATA SCIENTIST-СПЕЦИАЛИСТОМ?  


Я с детства хотела стать программистом, который решает интересные задачи. Эта мечта зародилась, когда в начальной школе мне купили первый компьютер и друг моих родителей, программист, пришел его настраивать. Меня впечатлило, как много он знает и как легко обращается с машиной. 

В итоге я пошла учиться в школу с технологическим уклоном и потом поступила на факультет ВМК МГУ. Во время учебы в университете выбрала направление, связанное с компьютерной лингвистикой, по этому направлению потом нашла и работу. И отсюда уже пришла в Data Science, т.к. многие задачи обработки текста решаются с помощью машинного обучения. Считаю, что мечта исполнилась – задачи интересные, а программирование тоже является неотъемлемой частью профессии.


ЧЕМ ЗАНИМАЕТСЯ DATA SCIENTIST?


На самом деле каждый работодатель может вкладывать в это понятие свои представления. Где-то это по сути роль аналитика, где-то – человека, который только обучает модели. В других компаниях, как, например, в «Лаборатории Касперского», это скорее fullstack-специалист.

Если кратко, Data Scientist старается помогать бизнесу решать определенные задачи с помощью методов машинного обучения, статистики и других доступных ему инструментов. Задачи могут быть разные – от автоматизации рутинных процессов до поиска аномалий, группировки данных по каким-то признакам для анализа.  


В ЧЕМ ОТЛИЧИЕ РАБОТЫ СИСТЕМНОГО АНАЛИТИКА И DATA SCIENTIST-СПЕЦИАЛИСТА?


Работа системного аналитика связана в основном со сбором требований, связи между собой заказчиков, разработчиков и пользователей. В Data Science мы тоже часто этим занимаемся, но все же это не основная деятельность. Больше времени Data Scientist занимается анализом данных, обучением, оценкой, развитием моделей машинного обучения, анализом ошибок, а также разработкой программ, использующих модели.


С КАКИМИ ТРУДНОСТЯМИ ЧАЩЕ ВСЕГО СТАЛКИВАЮТСЯ СПЕЦИАЛИСТЫ DATA SCIENTIST, В ТОМ ЧИСЛЕ ВЫПУСКНИКИ? 


Во-первых, это может быть отрыв от реальных задач. Людей в вузах и на курсах обычно учат решать определенную задачу на конкретных данных, а в жизни это все еще нужно сначала самостоятельно сформулировать и собрать. Часто идеальных данных нет, зато есть дополнительные требования – по быстродействию, критичности ошибки и т.п.

Порой трудности могут возникать в рамках общения. Часто его бывает много: с заказчиками, руководителями, разработчиками, аналитиками. Иными словами, важно уметь общаться, формулировать задачи и возвращаться с обратной связью, человек должен быть готов прокачивать soft skills.


КАКИЕ ЛОЖНЫЕ СТЕРЕОТИПЫ СЛОЖИЛИСЬ ВОКРУГ ЭТОЙ ПРОФЕССИИ?


Наверное, из самых распространенных – это стереотипы о зарплате. На мой взгляд, зарплата в этой сфере хорошая, но, чтобы она росла, нужен прежде всего опыт и знания. Обычно условия обсуждаются с каждым кандидатом индивидуально.

Другой стереотип может быть чуть менее очевидным, речь о связи с наукой. Несмотря на название профессии, содержащее слово Scientist, очень немногие специалисты напрямую занимаются наукой, так как большинство задач хорошо решается проверенными методами.


КАК ВЫГЛЯДИТ РАБОЧИЙ ДЕНЬ DATA SCIENTIST-СПЕЦИАЛИСТА? 


Рабочий день начинается у всех в разное время, в этом плане у IT-специалистов может быть достаточно гибкий график. Я начинаю рабочий день после того, как утром отвожу детей в сад. Наливаю кофе, проверяю почту, а затем приступаю к задачам - они могут быть разными, например: проверить, обучилась ли модель на распределенном кластере, подготовить код для запуска эксперимента, а также описание гипотезы по улучшению качества модели, обернуть готовую модель в сервис, добавить функционал в сервис.

 

СКОЛЬКО В СРЕДНЕМ ЗАРАБАТЫВАЕТ DATA SCIENTIST: junior, middle, senior?


Зарплата разнится, зависит от того, где вы работаете, например, в стартапе или большой компании, а также от требований к кандидатам и региона, где находится компания, и не только.


ЧЕГО В ПРОФЕССИИ ВЫ БОИТЕСЬ БОЛЬШЕ ВСЕГО? 


У нас был опрос, в ходе которого почти половина респондентов в России признались, что верят в реальность восстания машин. Сразу скажу, я этого не боюсь. Впечатляющие результаты, которые показывают сейчас ML-модели – это все равно повторение того, на чем модель обучалась, это не «интеллект».

Лично у меня бывают периоды, когда интерес к обучению, узнаванию чего-то нового рассеивается, это огорчает. Обычно это происходит из-за усталости, ведь помимо работы есть другие дела и заботы. Сейчас я уже знаю, что это дело периодическое, так что в такие моменты стараюсь больше себе позволять отдыхать и заниматься другой различной деятельностью – спортом, творчеством, чтением художественной литературы, играми.


ОТ ЧЕГО ЗАВИСИТ УСПЕХ В ВАШЕЙ ПРОФЕССИИ?


От желания докопаться до сути задачи и решить ее, а не применить конкретный метод. Требуется широкий взгляд на задачу. От желания узнавать новое и быть в курсе новостей в области. Нужно знание английского – все новые статьи, документация выходят на английском языке. А еще – умение быстро разбираться в новой среде – как в новых методах и моделях, так и в предметных областях, если вы занимаетесь широким кругом задач в Data Science.

#cybersecurity

Новости

#cybersecurity