Описание: | Обязанности:- Выполнение всего цикла работ по созданию предиктивной модели
- Интерпретация, обработка, трансформация данных для последующего анализа и машинного обучения
- Построение графиков в процессе анализа данных (data storytelling)
- Feature engineering
- Выбор подходящего алгоритма машинного обучения
- Определение стратегии валидации
- Тюнинг выбранной модели
- Создание пайплайна автоматической трансформации новых данных (test set) и предсказания на них моделью
Требования:- Опыт работы в должности Data Scientist, либо успешное участие в соревнованиях/хакатонах по Data Science / Machine Learning
- Python: обязательно
- Docker: желательно (1 год)
- Опыт работы с командной строкой (bash)
- Знание и успешное применение основных библиотек, используемых для машинного обучения: numpy, pandas, sklearn, lightgbm, xgboost, tensorflow, torch, matploblib & seaborn
- Гитхаб профиль, где можно посмотреть на код.
Понимание выполнения следующих задач: - Классификация
- Регрессия
- Кластеризация
- Anomaly Detection
- Rule-based модели
- Работа с временными рядами, дисбалансом целевой переменной
- Выбор оптимальной валидационной метрики
Понимание того, как должен выглядеть production-ready code: - Отсутствие нечитабельных функций/классов по 100+ строк
- Документация
- Юнит-тесты
Soft-skills: - Навыки понятным языком объяснять технические концепции нетехнической аудитории
- Пунктуальность - выполнение задач в согласованный срок либо объективное объяснение почему данная конкретная задача выходит за рамки установленных сроков
- Желание и умение работать в понятном и прозрачном ритме, не распыляясь на всё подряд, а в рамках текущей задачи (Scrum)
Этапы отбора: скрининг резюме, интервью с ИТ специалистами Условия: - Удаленный формат работы с 09.00 до 18.00 по мск;
- Сильная команда, в которой есть возможность для реализации творческих идей и профессионального роста.
|