Riwo
Ольга Н.СпециалистData ScientistSenior
Нанять через Riwo
Фото кандидата
Специалист свободен

Ольга Н.

СпециалистData ScientistSenior
от 1 600 ₽/ч
Стаж 6 лет
4.6
Навыки подтверждены
нашим экспертом

Основное

  • Возраст:32 года
  • Гражданство:Россия
  • Опыт на зарубежных проектах:Не было
  • Уровень английского:C1

Образование

О себе

Я опытный Data Scientist с более чем четырьмя годами практического опыта в области анализа данных, моделирования и машинного обучения, особенно в финансовом секторе и финтехе. Выпускница AI Masters Московского государственного университета, обладаю глубокими знаниями в области теории машинного обучения, статистики и анализа данных. За время своей карьеры я успешно реализовала проекты по созданию моделей оценки кредитных рисков, антифрода и оценки клиентского поведения. В частности, я разрабатывала системы обнаружения мошенничества с использованием OCR, классификаторов и моделей градиентного бустинга (CatBoost, LightGBM). Работала с большими объёмами данных, использовала технологии Hadoop, PySpark, Hive для обработки и анализа данных из сложных источников. Кроме того, у меня есть опыт в NLP и Computer Vision — создавал системы мониторинга соцсетей, выделял именованные сущности, строил текстовые классификаторы и системы анализа мнений. Для этого использовал библиотеки, такие как nltk, natasha, PyTorch, OpenCV, а также облачные сервисы Yandex Cloud. Обладаю навыками работы с SQL, Docker, Git и другими инструментами DevOps и обучения. Владею английским языком на уровне C1, что позволяет работать с международными командами и источниками данных. Я заинтересована в участии в проектах, связанных с CV, NLP и Audio/Signal Processing, где могу применить свои знания нейросетей и аналитики для решения сложных задач и развития новых технологий.

Хард скиллы

  • Other10/10
  • Python6/10
  • SQL9/10
  • Docker7/10
  • PostgreSQL9/10

Проекты

  • Sep 2025 - н. в.
    7 мес.

    Decart IT

    Финансы
    Построение моделей Antifraud
    Реализовано
    через RIWO
    • Стек проекта
      PostgreSQL, Hadoop, Hive, CatBoost, LightGBM, sklearn, XGBoost, Python, Pandas, NumPy, SHAP, feature importance, Tesseract OCR, OpenCV, Yandex Cloud, NLTK, spaCy, Natasha, PySpark, Docker
    • Задачи
      Анализ и сбор данных, разработка и обучение моделей машинного обучения для выявления мошеннических операций, оптимизация моделей по метрикам precision, recall, F1-score и AUC, построение пайплайнов обработки данных и автоматизация процесса обучения, оценка эффективности моделей, внедрение систем мониторинга и обратной связи, взаимодействие с командой разработки для интеграции моделей в production-окружение, документирование решений, подготовка отчётов и презентаций для стейкхолдеров, курирование этапов сбора и предварительной обработки данных, проектирование архитектуры моделей и эксперименты с различными алгоритмами (CatBoost, LightGBM, XGBoost), участие в оптимизации скорости обучения и производительности моделей, проведение анализа важности признаков (shap, feature importance), внедрение инструментов автоматического тестирования и мониторинга моделей, обучение команды и подготовка рекомендаций по улучшению системы anti-fraud.
    • Результат
      Разработана модель, повысившая точность обнаружения мошенничества на 15%, что привело к снижению финансовых потерь. Внедрена автоматизированная система сбора и предобработки данных, сократившая время подготовки данных на 40%. Реализованы механизмы мониторинга моделей, снизившие уровень ложных срабатываний и повысившие доверие к системе. Создана документация и рекомендации по более эффективной интеграции моделей в бизнес-процессы.
    • Состав команды
      Старший Data Scientist (ведущий проект), Data Scientist, Инженер данных, Разработчик DevOps / ML Ops, Аналитик/Бизнес-аналитик
  • Dec 2024 - Sep 2025
    9 мес.

    Сбер

    Финансы
    Реализовано
    через RIWO
    • Стек проекта
      Hadoop, PySpark, Hive, CatBoost, LightGBM, Python, Oracle, PostgreSQL, Pandas, NumPy, scikit-learn, Yandex Cloud
    • Задачи
      Координация исследований и анализ внутренних источников данных, тестирование и интеграция внешних источников данных, разработка и оптимизация моделей оценки рисков и поведения клиентов, создание инфраструктуры для обработки больших объёмов данных, анализ эффективности моделей, ведение командной работы, наставничество младших специалистов, взаимодействие с бизнес-подразделениями для внедрения решений, документирование решений и подготовка отчётов, построение конвейеров обработки данных, эксперименты с алгоритмами (CatBoost, LightGBM), анализ значимости признаков, объяснимость моделей, проведение совместных исследований по внедрению внешних данных в рабочие модели, участие в подготовке презентаций для руководства и бизнес-стейкхолдеров, обучение команды и делиться лучшими практиками.
    • Результат
      Разработала и внедрила модели оценки кредитного риска, повысившие точность прогнозирования на 12%, что снизило уровень дефолтов. Интегрированы новые внешние источники данных, что увеличило покрытие и точность моделей. Создана автоматизированная инфраструктура обработки данных и обучения моделей, что уменьшило время подготовки данных на 30%. Проведён анализ важности признаков, выработаны рекомендации по улучшению качества данных и моделей. Внедрён механизм регулярного мониторинга эффективности моделей в рабочей среде.
    • Состав команды
      Старший Data Scientist (ведущий проекта), Data Scientist, Инженер данных, Бизнес-аналитик, DevOps / ML Ops специалист
  • Jan 2022 - Dec 2024
    2 г., 11 мес.

    Eqvanta

    Финансы
    • Стек проекта
      CatBoost, LightGBM, shap, PostgreSQL, MS SQL, TesseractOCR, OpenCV, Python, Pandas, NumPy, Docker, Airflow
    • Задачи
      Анализ и подготовка данных, построение, обучение и tuning моделей оценки кредитного риска, внедрение методов объяснимости моделей, разработка и внедрение OCR-решений для автоматической обработки документов, создание классификаторов для выявления мошеннических операций, оптимизация моделей и автоматизация пайплайнов обработки данных, анализ результатов, подготовка отчётов и презентаций, анализ эффективности моделей, подбор гиперпараметров, эксперименты с различными алгоритмами, построение автоматизированных систем тестирования и внедрения, улучшение качества OCR и предварительной обработки документов.
    • Результат
      Разработана и внедрена модель оценки кредитных рисков для двух рынков, что повысило точность прогнозов и снизило уровень просрочек. Внедрена система автоматической обработки документов с использованием OCR, что сократило ручной труд и ускорило проверку заявлений. Построены классификаторы AntiFraud, ставшие частью системы мониторинга транзакций, что повысило обнаружение мошенничества на 20%. Создана система объяснений моделей, обеспечивающая прозрачность решений для бизнес-пользователей. Автоматизирован пайплайны обработки изображений и данных, что снизило время доставки решений в production на 35%.
    • Состав команды
      Data Scientist, Инженер данных, Разработчики OCR и Computer Vision специалистов, Бизнес-аналитик, Руководитель проекта / менеджер
  • Dec 2020 - Feb 2022
    1 г., 2 мес.

    АСАП

    Технологии
    • Стек проекта
      nltk, spacy, natasha, PyTorch, word2vec, fastText, Yandex Cloud, Python, PostgreSQL, NoSQL базы, Airflow, Docker, CI/CD
    • Задачи
      Разработка и внедрение методов выделения именованных сущностей, построение текстовых классификаторов, адаптация и настройка инструментов для работы с большими объёмами текстовых данных, применение современных архитектур на базе PyTorch и обучающих моделей, использование инструментов NLP для предобработки текстов, разработка систем автоматической обработки и интеграции данных в облаке, оптимизация моделей и автоматизация пайплайнов анализа текста.
    • Результат
      Разработана система автоматического выделения именованных сущностей, которая увеличила скорость анализа текстов на 40%. Созданы классификаторы настроений, успешно определяющие мнение по текстам с точностью свыше 85%. Интегрированы облачные решения на базе Yandex Cloud, обеспечивающие масштабируемость и отказоустойчивость системы. Оптимизированы модели для работы с большими потоками данных, что позволило обрабатывать тысячи сообщений в минуту. Разработана архитектура, позволяющая регулярно обновлять модели и повышать их качество без ручного вмешательства.
    • Состав команды
      NLP Engineer / Data Scientist, Data Engineer, Data Analyst / Бизнес-аналитик, DevOps специалист

Запись видео интервью

Похожие специалисты

Аутстаффинг
теперь
в прошлом

Усилить команду крутыми специалистами можно быстрее, дешевле, проще — с RIWO

  • 01

    Зарегистрируйтесь на платформе

  • 02

    Разместите свой запрос на специалиста(ов) абсолютно бесплатно в AI-поиске RIWO

  • 03

    Получите 7+ откликов от наиболее подходящих под ваш запрос специалистов за первые 48 часов

  • 04

    Контрактуйтесь внутри личного кабинета, согласовывайте и подписывайте документы, платите по факту выполненных работ!