Как стать DS’ом за пять минут?

Обилие курсов по машинному обучению в последнее время поражает. Разве что на заборах не пишут “стань ML экспертом за пять минут” . Есть реклама на Хабр, таргетированная реклама вконтакте. Крупные институты создают открытые курсы. Число online платных и бесплатных лекций зашкаливает. Но есть ли смысл в этом всем? Имеет ли смысл идти на эти курсы? Может ли информация которую там рассказывают принести пользу?

Мне кажется что смысл в этом всем почти нулевой:
1) Основное отличие DS’а от программиста – любопытство и желание закопаться. Программисту сейчас редко писать какой-то сложный алгоритм, который надо долго-долго тестировать, отлаживать, анализировать. Бывает, но обычно это делают программисты топ-уровня. DS должен уметь перекапывать десятки статей, быстро в них разбираться, уметь прикрутить и протестировать. И тут хопа, когнитивный диссонанс. На курсах всё в блюдечке, с каёмочкой. Вот так сделай – будет хорошо. Нет, не будет. Одно решение, работающее в A – вряд ли будет работать в Б. Похожие задачи, разные. Нужна любознательность, начитанность, и.т.д. Это воспитывается в Pet-проектах, в kaggle (господи, прости за пошлось), в курсовых и дипломных работах. Заботать десяток паттернов – это очень плохой DS.

2) Большая часть известных курсов – теоретическая. Там нет моста к практике. Этот мост очень хрупкий и меняется каждые пол года. Caffe|Theano уже умерло, MXNet уже не в тренде, и.т.д. Практическая реализация задач может меняться за пол года. Вы уверены что ваш курс Up-to-date? Лучше походите на семинары, почитайте Slack ODS’а, или посмотрите свежий kaggle.

3) Как вы думаете, какая сейчас зарплата хорошего и успешного DS-а? Ну, вот из свежего с Хабра:

Это, достаточно крупная. Крупнее в России не видел даже, наверное, только за бугром. Но 200-350 много видел предложений и людей которые получают. Как вы думаете, сколько могут позволить себе платить курсы преподавателям?
Ко мне регулярно приходят с просьбой что-то почитать. Я отказываюсь. Но иногда соглашаюсь поконсультировать и прорецензировать за денюжку.  Только вот что-то ставку, которую я называю – вызывает у организаторов ужас. Хотя она весьма небольшая для таких вещей (3000-6000 в час, обычно, это примерно как хороший репититор для ребёнка, или как часовая ставка хорошего фрилансера).
Как вы думаете, каких преподавателей такие курсы набирают? Тех кто успешно работает, или тех кто не может найти себе практического применения?
Я, конечно, знаю пару человек которые на энтузиазме ведут курсы. Даже я до сих пор на родной кафедре могу взять 1-2 студентов как научный руководитель, или прочесть пару лекций. Ничего за это не получаю.
Но, ребят. оценивайте уровень курсов. Люди которые реально хорошо разбираются в живую не ведут.

Короче, рекомендация одна. Она была выше. Только любознательность, упёртость и интерес. Делать то что интересно. Как можно больше.

6 thoughts on “Как стать DS’ом за пять минут?”

  1. Курсы полезны для новичков (как я, например) – они помогают создать в голове каркас, на который потом вешается практика. Даже чтобы эффективно гуглить в ML нужны хоть какие-то знания 🙂 Да, многие курсы – отстой. Но есть и более менее норм, которые чуть чуть позволяют почувствовать «запах крови».

    1. Штука в том, что это не поможет:) Скелет формируется только на практике. А всё остальное – это размусоливание мыслей.
      Вот ongoing конкурс на kaggle – https://www.kaggle.com/c/tgs-salt-identification-challenge из текущего. Там в комментариях идёт жизнь. Например тут – https://www.kaggle.com/c/tgs-salt-identification-challenge/discussion/61949
      Уверен, что в ODS есть канал на эту тему.
      Участие в таком конкурсе в течении 2х месяцев каждый день по часу даст вам на порядок больше опыта чем любые курсы)
      Лучше всего в 2-3 конкурса вписаться, если время есть. И через пол года можно разбираться на достаточном уровне чтобы быть полезным в реальных проектах.

  2. А подскажите, пожалуйста, ответ вот на какой вопрос. Вполне серъёзно. Я НЕ Data Scientist, я самый обычный программист. Но на работе у нас есть порядочно Data Scientist-ов. Так вот, все они говорят, что они анализируют большие данные и предсказывают их поведение в будущем.
    Отсюда законный вопрос возникает. Курсы валют — это данные. В теории, они могут анализировать курсы валют, предсказывать их графики, а затем просто навариваться на покупке и продаже валюты. Но почему вместо этого они каждый день ходят на работу, где им платят фиксированную (пусть даже довольно большую) зарплату, ведь анализируя курсы валют, покупая и продавая их в нужный момент, они могли бы зарабатывать гораздо больше. Их доход вообще ничем не был бы ограничен. Скорее всего, я что-то не понимаю, но когда я предложил этот вариант своим коллегам Data Scientist-ам, то они не смогли объяснить, почему они этого не делают. Может быть, вы подскажете?

    1. Курс валют является примером белого шума, поведение которого нельзя предсказать только исходя из прошлого состояния курса/других курсов. Для его анализа нужно анализировать миллионы данных внешнего мира, которые зачастую не структурированы и не оцифрованы.

    2. На это есть другой, не менее занятный ответ. Почему учителя такие бедные, если так здорово учат? Почему бизнес-консультанты или тренеры не создают свои компании, хотя учат как их создавать. Потому что они умеют учить/видеть со стороны/искать чужие проблемы/анализировать чужие деньги/валюты и пр. Они умеют и делают то, что умеют/хотят/любят. Все любят критиковать начальников, но лишь до тех пор, пока сами не стали начальниками 😉

      Тоже самое с курсами валют, акций, фьючерсов и пр. Если бы такие инструменты были, то мир давно бы рухнул – все бы были богаты, чего быть не может.

Comments are closed.