Riwo
Антон М.Data Science разработчикData ScientistSenior
Нанять через Riwo
Фото кандидата
Специалист свободен

Антон М.

Data Science разработчикData ScientistSenior
от 1 600 ₽/ч
Стаж 7 лет
4.2
Навыки подтверждены
нашим экспертом

Основное

  • Возраст:31 год
  • Опыт на зарубежных проектах:Не было
  • Уровень английского:B2

Образование

Хард скиллы

  • Python7/10
  • Other9/10

Проекты

  • Jan 2024 - н. в.
    2 г., 3 мес.

    Decart IT

    Проект Крупного ритейла
    Реализовано
    через RIWO
    • Стек проекта
      SQL, Python, pyTorch, DeepPavlov, Catboost, statmodels, Yandex Cloud, S3, MLFlow, Terraform, Kafka, Airflow/MLFlow/Docker, SparkML
    • Задачи
      Разработка моделей в рамках маркетинговых оптимизаций: модели NPD, элементы рекомендательной системы, векторное представление клиентов на основе чеков. Разработка витрины с более чем 200+ различными признаками и 4 различными модальностями, разработка дорожной карты развития ML решений. Разработка автоматизированной системы оценки А/В тестов с ratio/non-ratio метриками. Менторинг младших коллег. Планирование спринта, оценка нагрузки на команду, помощь в разработки критериев отбора кандидатов. Работа в клиентских стримах ВИП, трафик, отток
    • Результат
      Модель NPD: используется для запусков маркетинговых кампаний для определения склонности к посещению в период следующих 7 дней. Витрина признаков: снижение временных затрат на сбор данных для команды ML разработчиков. Система оценки А/В тестов: снижение временных затрат на анализ рекламных кампаний, появилась возможность декомпозиции бизнес метрик + появилось более детальное понимание влияния на поведение клиента. Векторное представление: позволило оптимизировать этап деления клиентских выборок для запуска А/В теста, дополнительные признаки для любых моделей отклика.
    • Состав команды
      Ведущий Data Scientist — ответственный за разработку моделей, архитектуру решений и менторинг младших коллег. Data Scientist — участвующий в создании моделей, анализе данных и разработке витрины признаков. Инженер по данным (Data Engineer) — обеспечивающий сбор, обработку и хранение данных (использование SQL, S3, Kafka, SparkML). DevOps-инженер — занимающийся настройкой инфраструктуры и автоматизацией процессов (Terraform, Docker, MLFlow, Yandex Cloud). Специалист по тестированию и аналитике A/B тестов — разрабатывающий автоматизированные системы оценки и анализ эффективности кампаний. Менеджер проекта — планирующий спринты, оценивающий нагрузку и координирующий работу команды. Ментор — поддерживающий развитие младших специалистов и обеспечивающий качество решений.
  • Apr 2023 - Jan 2024
    9 мес.

    Сбер

    Массовая персонализация В2С
    Реализовано
    через RIWO
    • Стек проекта
      SQL, pySpark, pytorch, catboost, shap, SparkML
    • Задачи
      Сбор и подготовка данных: сбор данных о клиентах из различных источников (CRM-системы, транзакционные данные, данные о взаимодействии с продуктами и услугами). Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления ключевых факторов, влияющих на поведение клиентов. Использование визуализаций для представления результатов анализа и выявления сегментов клиентов. Сегментация клиентов: применение методов кластеризации (например, K-means или DBSCAN) для группировки клиентов по схожим характеристикам и поведению.
    • Результат
      Текущая модель наилучшего времени коммуникации в канале телефон + робот получила 11% прироста CR. Прогноз трат на школьника: модель являлась составляющей масштабного проекта “Ромашка” по предсказанию жизненных ситуаций клиента, наличие данной модели позволило приблизить проект к завершению еще на один шаг.
    • Состав команды
      Data Scientist — ведущий аналитик, ответственный за разработку моделей, проведение анализа данных, сегментацию клиентов и создание систем рекомендаций. Data Engineer — специалист по обработке и подготовке данных, реализующий сбор данных из различных источников (CRM, транзакции), а также их очистку и предобработку с использованием SQL, pySpark. Модельер/ML-инженер — занимается разработкой и внедрением моделей машинного обучения (PyTorch, CatBoost), а также их оптимизацией и мониторингом. Специалист по визуализации данных — создает визуальные отчеты и презентации для анализа результатов (например, с помощью SHAP). Инженер по автоматизации и DevOps — обеспечивает автоматизацию процессов обучения моделей, интеграцию решений в системы маркетинга и внедрение CI/CD (использование SparkML, Docker). Специалист по балансировке данных — применяет методы балансировки выборок (SMOTE, oversampling/undersampling) для работы с несбалансированными данными. Бизнес-аналитик/продуктовый менеджер — формулирует требования к моделям, участвует в оценке эффективности и внедрении решений. Менеджер проекта — планирует работу команды, оценивает нагрузку, координирует взаимодействие между участниками. Обучающий/тренер — проводит семинары или тренинги для команды по использованию новых инструментов и моделей.
  • Aug 2020 - Jun 2021
    9 мес.

    Газпромбанк, ОАО

    Построение моделей для банковских продуктов
    Реализовано
    через RIWO
    • Стек проекта
      SQL, pySpark, Catboost, shap, sklearn, matplotlib, SparkML
    • Задачи
      Сбор и подготовка данных: сбор данных из различных источников, включая CRM-системы, транзакционные данные, данные о клиентах и их взаимодействии с продуктами банка. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении клиентов и факторов, влияющих на принятие решений.
    • Результат
      Модели отклика: сокращение финансовых затрат на маркетинговые кампании в заведомо дорогом канале связи СМС. Система мониторинга: сокращение трудовых затрат сотрудников на отслеживание качества моделей находящихся в проде
    • Состав команды
      Data Scientist — ведущий аналитик, ответственный за разработку моделей кредитного скоринга, систем рекомендаций, обнаружения мошенничества и оценки эффективности моделей. Использует инструменты CatBoost, sklearn, SHAP, matplotlib. Data Engineer — специалист по сбору и подготовке данных из различных источников (CRM, транзакции, взаимодействия). Работает с SQL, pySpark для обработки больших объемов данных и автоматизации процессов. ML-инженер / Разработчик моделей — занимается построением и внедрением предсказательных моделей (логистическая регрессия, градиентный бустинг, деревья решений), а также оптимизацией и мониторингом их работы в продакшене (SparkML). Специалист по балансировке данных — применяет методы SMOTE, oversampling/undersampling и модифицированные loss-функции для работы с несбалансированными выборками. Бизнес-аналитик / Продуктовый менеджер — формулирует требования к моделям, оценивает бизнес-эффективность решений, участвует в подготовке отчетов и рекомендаций по внедрению. Инженер по автоматизации и DevOps — обеспечивает автоматизацию процессов обучения моделей, интеграцию решений в системы банка, настройку CI/CD (использование Docker, SparkML). Специалист по визуализации данных — создает отчеты и визуализации для анализа результатов (Matplotlib), помогает выявлять ключевые сегменты клиентов и факторы влияния.
  • Apr 2020 - Jul 2020
    2 мес.

    Social Discovery Ventures

    Оптимизация рекламных кампаний
    • Стек проекта
      CatBoost, sklearn, keras, spaCy, MS SQL
    • Задачи
      Сбор и подготовка данных: сбор данных из различных источников, включая платформы цифровой рекламы, веб-аналитику, CRM-системы и базы данных пользователей. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток или категорий). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении пользователей и факторов, влияющих на конверсию.
    • Результат
      Увеличение конверсии: Повышение вероятности выполнения целевых действий пользователями (например, регистрации, покупок) через более точное таргетирование. Оптимизация бюджета: Эффективное распределение рекламного бюджета между различными каналами и кампаниями для максимизации ROI. Персонализация рекламы: Создание персонализированных рекламных предложений на основе анализа поведения пользователей.
    • Состав команды
      Data Scientist — ведущий аналитик, ответственный за разработку моделей предсказания конверсии, сегментацию аудитории, анализ факторов влияния и оценку эффективности рекламных стратегий. Использует инструменты CatBoost, sklearn, keras, spaCy. Data Engineer — специалист по сбору и подготовке данных из различных источников (платформы цифровой рекламы, веб-аналитика, CRM-системы, базы данных). Работает с MS SQL и pySpark для обработки больших объемов данных и автоматизации процессов. ML-инженер / Разработчик моделей — занимается построением и внедрением моделей машинного обучения (логистическая регрессия, деревья решений), а также их оптимизацией и мониторингом в продакшене. Специалист по кластеризации и сегментации — применяет методы кластеризации (K-means, DBSCAN) для группировки пользователей по схожим характеристикам и поведению, помогает определить целевые сегменты. Специалист по визуализации данных — создает отчеты и визуализации для анализа результатов (например, с помощью Matplotlib), помогает выявлять ключевые сегменты аудитории и факторы влияния. Бизнес-аналитик / Маркетолог — формулирует требования к моделям и аналитике, участвует в интерпретации результатов A/B-тестов, разрабатывает рекомендации по оптимизации рекламных кампаний.
  • Mar 2019 - Apr 2020
    1 г., 1 мес.

    Центр развития экономики, ОАО

    Разработка элементов рекомендательной системы
    • Стек проекта
      pandas, numpy, scikit-learn, catboost, keras, sql
    • Задачи
      Сбор и подготовка данных: сбор данных о пользователях, их взаимодействии с продуктами (например, покупки, просмотры) и демографической информации. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток). Анализ данных: проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении пользователей.
    • Результат
      Элементы рекомендательной системы: расширение набора признаков для фундаментальной модели, что в свою очередь привело к увеличению точности наших рекомендаций. Анализ подозрительного поведения на площадке: проект позволил выявить признаки, которые в дальнейшем использовались службой безопасности для определения мошенничества. Предиктивная аналитика: модель отклика на маркетинговое предложение, позволила сохранить лояльность клиентов и сократить бюджет на рекламу.
    • Состав команды
      Data Scientist / Аналитик данных — ведущий специалист, ответственный за проведение разведывательного анализа (EDA), разработку моделей рекомендаций (коллаборативная фильтрация, контентная фильтрация, гибридные подходы), оценку их качества (RMSE, Precision@K, Recall@K) и анализ подозрительного поведения. Использует pandas, numpy, scikit-learn, catboost, keras. Data Engineer — специалист по сбору и подготовке данных из различных источников (базы данных, платформы). Работает с SQL для извлечения данных, занимается обработкой пропусков, нормализацией признаков и созданием новых переменных. ML-инженер / Разработчик моделей — занимается построением и оптимизацией рекомендательных алгоритмов, внедрением моделей в бизнес-процессы. Использует catboost, keras для разработки гибридных моделей. Специалист по кластеризации — применяет методы K-means или иерархической кластеризации для сегментации пользователей по поведению и характеристикам, помогает определить целевые группы. Специалист по визуализации данных — создает отчеты и графики для представления результатов анализа и оценки эффективности рекомендаций.
  • Oct 2018 - Mar 2019
    4 мес.

    ООО Claire&Clarté

    Макет аналитической системы для прогноза выхода промышленного оборудования из строя
    • Стек проекта
      Ctaboost, Jupyter Notebook, shap
    • Задачи
      Сбор и подготовка данных: сбор данных о работе оборудования, включая параметры работы (температура, давление, вибрация), историю ремонтов, технические характеристики и условия эксплуатации. Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток или агрегированных показателей).
    • Результат
      Автоматизированная система для заданного набора признаков различных типов (категориальные, непрерывные), которая позволяла для заранее сформированного целевого значения обучать модель отклика. На выходе получался pickle файл с моделью + jupyter ноутбук с графиками, набором метрик, описанием предиктивной силы признаков по shap
    • Состав команды
      Data Scientist / Аналитик данных — главный специалист, ответственный за проведение разведывательного анализа (EDA), разработку и обучение моделей машинного обучения (логистическая регрессия, деревья решений, случайный лес), интерпретацию важности признаков (использование SHAP), подготовку отчетов и визуализаций. Использует Jupyter Notebook, shap, scikit-learn, catboost. Data Engineer / Инженер по данным — занимается сбором данных о работе оборудования, ремонтах, технических характеристиках и условиях эксплуатации. Обрабатывает пропуски, нормализует признаки, создает новые переменные и обеспечивает подготовку данных для моделей. Машинный инженер / Разработчик моделей — специализируется на построении и оптимизации моделей прогнозирования с использованием CatBoost и других алгоритмов. Обеспечивает сохранение обученных моделей в pickle-файлы для дальнейшего внедрения. Инженер по временным рядам — занимается анализом изменений в показателях работы оборудования с течением времени, применением методов временных рядов для повышения точности прогнозов. Специалист по визуализации и отчетности — создает графики, отчеты и презентации результатов анализа и оценки модели для внутреннего использования и принятия решений.

Запись видео интервью

Похожие специалисты

Аутстаффинг
теперь
в прошлом

Усилить команду крутыми специалистами можно быстрее, дешевле, проще — с RIWO

  • 01

    Зарегистрируйтесь на платформе

  • 02

    Разместите свой запрос на специалиста(ов) абсолютно бесплатно в AI-поиске RIWO

  • 03

    Получите 7+ откликов от наиболее подходящих под ваш запрос специалистов за первые 48 часов

  • 04

    Контрактуйтесь внутри личного кабинета, согласовывайте и подписывайте документы, платите по факту выполненных работ!