Навыки и технологии: интеллектуальная обработка документов, нейронные сети, анализ данных, доразметка, Python.
Проекты и достижения: Кандидат провел исследование методов интеллектуальной обработки коммерческих документов, включая анализ существующих решений и выбор архитектур нейронных сетей для распознавания сущностей. В ходе проекта были написаны вспомогательные скрипты для разметки данных и расширен набор данных с добавлением новых типов документов и сущности «заголовок документа». Кандидат успешно дообучил выбранные модели, среди которых была выбрана наиболее перспективная – LayoutXLM, и провел оценку ее способности находить сущности в ранее невидимых документах.
Достижения и признание: Кандидат составил требования к модели на основе анализа литературы, что позволило выбрать несколько архитектур-кандидатов для дальнейшего тестирования и оценки.
* создается нейросетью на основе портфолио, информации указанной пользователем о себе и отзывам от других пользователей