Про конференции в ML

Этой осенью попал на две разные конференции по машинному обучению и его применению. Одну организовывал Роман (UseData – она была акцентирована скорее на разработчиков/тимлидов), вторая AiStories – она была скорее для бизнеса, о том как и куда внедрять.

Это не первые конференции на которых я был. Бывал и на более научных, и на более практических (хакатонах, семинарах). Но в глаза бросается сразу несколько вещей:

Наука
Науки на конференциях в России нет и быть по сути не может. Наука есть на нескольких крупных мировых конференциях, таких как CVPR. При этом наука там, в 95% случаев – максимально отстранённая от практики. Подготовка статьи на такую конференцию может занимать по пол года. Попадает одна из двадцати. Полезность? Дай бог у одного процента того что попало на конференцию. Всё остальное – шлак который в реальном продакшне не применить. А критерии попадания на конференцию – научная новизна. Но, конечно, такие конференции интересны дял обогащения знаниями и идеями.

Есть конференции, которые пытаются в себе содержать науку. Например тот же DataFest. Но, эта часть, на мой взгляд, не выходит: вся наука сводится к прочтению статей которые были выпущены в последние пол года. Организаторы позиционируют это: “Зато можно задать вопросы авторам”. Но понятно, что это можно с большей эффективностью по электронной почте сделать/через issue на гитхабе.

Есть более приватные мероприятия. В районе нового года Лимпицкий что-то организует. Ещё помню какие-то были. Но тут, скорее, для тех кто пробует заниматься именно наукой. Не разу не видел полезной продуктовой движухи. Но со стороны науки – можно завести несколько полезных контактов, вписаться в какое-то исследование.

Продакшн
Продуктовые конференции. В первую очередь это аналоги UseData . В том числе бывшая SmartData, частично DataFest. Наверное ещё Machines Can See можно отнести. Тут рассказывают как смогли дотащить что-то из “науки” в реальный “продакшн”. В целом доклады градуируются так:

1) На каждой конференции есть пара отличных докладов. Зачастую они не самые распиаренные, зачастую нельзя сходу понять хороший доклад или плохой.

2) Кроме пару хороших 60% – это проходняк.

3) Ещё ~10-20% откровенно вредительские. На них люди порют чушь, рассказывают то что очевидно не работает, рассказывают про свою текущую работу не понимая что оно не взлетит. Обычно, большинству это и так понятно. Но, к сожалению, не всем.

Проблема тут в чём… Не понятно кто кому и что рассказывает. Под “Data Scientists” – можно понимать очень-очень многое. Начиная от студента который только-только начал использовать TensorFlow и открывает для себя магию файнтьюнинга, заканчивая продактом, который понимает что цель машинного обучения – лишь оптимизация какого-то процесса, и который мыслит в этих категориях. И докладчики – соответствующие. Кто-то докладывает про весьма простые вещи, кто-то затирает про то что всё происходящее мало осмысленно.

Я сейчас не говорю о том, что машинное обучение сейчас очень дифференцировалось. И людей которые понимают всё – сейчас почти нет. Кто-то больше специализируется на продуктизации моделей. Кто-то на потоках данных, кто-то в NLP. Лично я – в ComputerVision.Как результат – для многих будет 2-3 доклада которые они полностью поймут. Для остальных это будет максимум заметка на будущее, которую они скорее всего забудут.
В результате такие конференции не имеют явной целевой аудитории, большая часть знакомых отказывается от похода на них.

Есть тема с нэтворкингом. Но реально, когда на конференции 80% – это разработчики – нэтворкинг работает достаточно плохо.

Бизнесовые
Бизнесовые конференции для меня, пожалуй, самые интересные. Но и самые болезненные. Хороших докладов там 30%. Ещё 30% – это реклама. Зачастую не по теме конференции даже – и это ужасно. А ещё 30% – это неадекваты. Например на Ai Stories был доклад “Ростелекома”. Там барышня утверждала что по лицам можно распознать всю страну… Поразительное незнание матчасти. Или доклад ДИТа. Там не такая жесть, но трешовенько было.
Но те которые стоящие – они стоят того. Зачастую люди рассказывают как реально внедряли ML в бизнес/где срезали косты/какие сложности возникли. И это бесценный опыт. Но разбавленный рекламой/недоговорками.
Зато на бизнесовых интересный нетворкинг.

К чему это всё было
Конференции и смысл. Что я для себя понял. Если вы идёте на конференцию в России за наукой – это фэйл. Если вы идёте за тем чтобы научиться новым фичам и технам – это может сработать, но надо грамотно выбирать доклады и конференцию. И не всегда можно угадать. Но если не ограничены по средствам/времени – вай нот. Кому-то подойдёт UseData, кому-то Ai Stories. Нетворкинг – это реально единственный смысл который более-менее всегда более-менее работает. Но нетворкинг в России – это сложно. У нас сложный менталитет, не все хотят общаться, мы плохо умеем:) Зачастую придёшь на конференцию – а смысла ноль:(