58.84 € 69.30

Интервью с Data Scientist: «Я вижу, как моя работа влияет на жизнь людей»

Интервью с Data Scientist: «Я вижу, как моя работа влияет на жизнь людей»

Профессия Data Scientist, специалиста по работе с данными, – одна из самых высокооплачиваемых и востребованных в мире. Практика показывает, что успехов на этом непростом рынке добиваются не только мужчины, но и женщины: о математике, искусственном интеллекте и будущем данных в интервью iot.ru рассказала Анна Румянцева, Data Scientist компании Hitachi Vantara, которая недавно оказалась в шорт-листе премии "Women in IT Excellence Awards" в номинации "Rising Star Award".


anya_rumyantseva_office.jpg- Как написал несколько лет назад журнал Harvard Business Review: «Data Scientist — самая модная профессия XXI века». Как думаете, почему возникло такое мнение о вашей профессии?

- На мой взгляд, потому, что спектр применения науки о данных в наше время очень широк. Многие компании сделали ставку на таких специалистов и предложили им довольно высокую зарплату и интересные задачи. Думаю, моду на Data Scientist можно объяснить простой формулой: возможности, плюс востребованность, плюс зарплата.

- Возможно, сегодня любой программист мечтает переквалифицироваться в «ученого в области данных». Как вы стали Data Scientist?

- Я получила физическое и математическое образование в МГУ – оно стало фундаментом для хороших математических знаний. Методы, применяемые в Data Science, сегодня развиваются очень активно, и нужна хорошая математическая база, чтобы быстро схватывать новые тенденции и брать их в оборот. После этого я окончила аспирантуру, где работала над анализом сенсорных данных в морских роботизированных системах. Именно в аспирантуре у меня появилась возможность изучить методы анализа данных, языки программирования, которые применяют в Data Science. После аспирантуры я совершенствовала свои навыки в машинном обучении, проходила разные курсы, делала проекты, читала как можно больше о своей профессии. Все эти знания пригодились: я смогла найти подходящую работу буквально за месяц. Кстати, важным фактором при прохождении собеседования на должность Data Scientist, помимо технических навыков, было наличие опыта участия в конференциях и хороших коммуникативных способностей. Мне часто приходится встречаться с заказчиками и работать с коллегами из других стран Европы и Азии, так что уметь выстраивать отношения с людьми и вести продуктивное сотрудничество специалисту моей профессии тоже необходимо.

- Образ Data Scientist стереотипно ассоциируется с мужчиной, а не с женщиной. Почему вы решили выбрать эту профессию? Как молодая женщина конкурирует на этом рынке с мужчинами-математиками?

- Даже если в этой профессии и существует мужское доминирование, это точно не должно отпугивать женщин. Если у женщины есть подходящие навыки и хорошая математическая база – пасовать и бояться не стоит. Я бы не сказала, что профессия Data Scientist так уж подвержена гендерной дискриминации: есть некоторые опасения по поводу женщин в ИТ в целом (в отдельных сферах и вправду работает мало женщин), однако в Data Science все немного по-другому.

- Люди вашей профессии осознают ценность технологий машинного обучения и искусственного интеллекта как никто другой. Расскажите, какое развитие эти технологии получат в ближайшее время и чем будут полезны для бизнеса?

- В ближайшее время я вижу развитие в двух направлениях. Во-первых, сама система организации бизнеса будет меняться и адаптироваться к работе с Data Scientists. Часто люди, которые занимаются данными, изолированы от внутренних аналитиков компании, и модели, разработанные Data Scientists, по многим причинам не находят у них понимания. Для того, чтобы возможности, которые открывают перед бизнесом данные, совпадали с его техническими задачами, предприятию и специалистам по большим данным необходимо более широкое пространство для диалога и команда, ориентированная на взаимопомощь.

Во-вторых, не стоят на месте методы машинного обучения и аналитики. После оглушительного успеха машинного обучения и результатов, которые продемонстрировали эти технологии, многие передовые архитекторы всерьез занялись разработкой новых методов Machine Learning и улучшением старых. Сейчас мы видим, как тренд меняется в сторону Deep Learning (глубокого обучения) и применения нейросетей. Мне кажется, со временем эти методы будут только усложняться.

Очень часто меня спрашивают, чем машинное обучение отличается от искусственного интеллекта. ИИ – это очень широкий термин. Сейчас термин «искусственный интеллект», на мой взгляд, более применим к робототехнике, когнитивному моделированию, самоуправляемым автомобилям и другим подобным вещам. Машинное обучение можно рассматривать как подкласс ИИ, тогда как непосредственно к искусственному интеллекту можно отнести ряд других методов, которые традиционно не считаются машинным обучением: теорию принятия решений, генетические алгоритмы и так далее.

- В последнее время в СМИ было много шума о том, что развитие искусственного интеллекта необходимо ограничивать – иначе компьютеры станут умнее людей и поработят человечество. Насколько это реально и к какому уровню развития придет искусственный интеллект через 50 или 100 лет?

- Я думаю, такие опасения немного футуристичны. На месте журналистов я бы привлекала внимание к другим проблемам развития искусственного интеллекта и машинного обучения. Так, Европейский парламент сейчас активно рассматривает связь искусственного интеллекта и дискриминации: они собираются ввести определенный спектр ограничений (GDPR, General Data Protection Regulation) в том, какие данные могут применяться в машинном обучении, а какие – нет. Tакие факторы, как возраст, расовая принадлежность или пол не могут употребляться в методах машинного обучения, связанных, например, с выдачей кредита. Это говорит о том, что искусственный интеллект и машинное обучение сами по себе могли бы стать катализаторами роста проблем с дискриминацией, однако аналитики вовремя это заметили и предприняли попытку это предотвратить. Такого рода вопросы куда более актуальны, чем теории о том, как машины порабощают людей.

- Есть ли у вас представления о «проекте мечты»: идеальной работе, которую вы могли бы выполнить?

- То, чем я сейчас занимаюсь, очень близко и интересно мне. У меня много задач, связанных с железнодорожной индустрией: например, наша компания участвует в проекте Hitachi Rail Europe по модернизации железнодорожного полотна Великобритании с использованием IoT-аналитики. Этот проект наглядно показывает, как с помощью данных можно предотвратить поломку поезда, не выводя его из эксплуатации, не мешая перевозки пассажиров и при этом позволяя нашему заказчику экономить до £20 млн в год. Я вижу, как моя работа может повлиять на людей в городе и их жизнь – поэтому мне и нравятся мои проекты. Я знаю, что делаю что-то полезное.

- Какие высокотехнологичные компании вас вдохновляют? И есть ли кто-то среди лидеров мнений в ИТ-индустрии, с кого вы можете брать пример?

- Я бы хотела выделить несколько персоналий. Я слежу за публикациями Григория Пятецкого-Шапиро – одного из пионеров Data Science. Его работы дают актуальную оценку многим важным вопросам в этой области. Также я слежу за работой научной группы Фей-Фей Ли (Fei-Fei Li) и Андрея Карпатого (Andrej Karpathy) в Стэндфордском университете. Хочется отметить вклад Эндрю Энга (Andrew Ng ), исследователя робототехники и машинного обучения и одного из основателей проекта Coursera. Сейчас этот проект помогает людям со всего мира получать доступ к курсам преподавателей ведущих мировых университетов и улучшить свои профессиональные навыки.   

В области науки о данных сейчас работает много умных и талантливых людей, об их проектах можно говорить бесконечно. Но мне хотелось бы обратить внимание на проект DataKind – он позволяет профессиональным Data Scientists помогать социальным организациям анализировать данные и заниматься научными исследованиями, необходимыми для решения проблем, связанных с образованием, бедностью, здравоохранением, правами человека, окружающей средой и городами.

Подписаться на новости

Назад

Комментарии

Текст сообщения*
Защита от автоматических сообщений