Ищу OCR-инженера для проекта по распознаванию старославянского печатного текста (Kraken / Calamari).
Стоимость:
6 000 рублей
Срок выполнения:
2 дня
Варианты оплаты:
По договоренности
Дата публикации:
2025-12-12 02:17
Обновлено:
2025-12-12 02:18
Был(а) на сайте:
2025-12-12 03:05
Реклама
Ищу OCR-инженера для проекта по распознаванию старославянского печатного текста (Kraken / Calamari).
Задача
Работаю над созданием кастомной OCR-модели под старославянский текст XVI–XVII вв.
Есть проблема, которую стандартные движки не решают:
– 10–15 типов надстрочных знаков,
– нестандартная раскладка,
– редкие кириллические и греческие символы,
– проблема сегментации (диакритика «уезжает» в отдельную строку).
Нужен специалист, который понимает как решать и имеет практический опыт работы с задачами:
1. Разметка строк вручную/полуавтоматически.
2. Создание датасета пар «скан текст».
3. Тестирование Kraken (обязательно)/Calamari(по возможности):
– line segmentation,
– training alphabets,
– ground truth mapping.
4. Построение минимального прототипа пайплайна: папка A (исходные сканы) + CLI-скрипт -> папка B (текстовый результат в правильной раскладке).
5. Создание краткого аргументированного отчёта о том, какой путь обучения модели реалистичен и оптимален для решения поставленной задачи.
На первом этапе — пилот за начальную сумму
Это R&D-этап.
Если подходим друг другу — продолжение про...
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Здравствуйте! Мне нужен OCR-инженер для разработки кастомной модели распознавания старославянского текста XVI–XVII веков. Основные задачи включают разметку строк, создание датасета, тестирование Kraken и Calamari, а также создание прототипа пайплайна для преобразования сканов в текст. Важно иметь опыт работы с нестандартными алфавитами и понимание сегментации строк. На первом этапе предлагаю пилотный проект с возможностью дальнейшего сотрудничества. Пожалуйста, поделитесь своим опытом работы с OCR-движками и примерами похожих проектов.
Для реализации этого задания потребуются следующие навыки: опыт работы с OCR и машинным обучением, знание инструментов Kraken и Calamari, навыки в разметке данных и создании датасетов, понимание сегментации строк и работы с нестандартными алфавитами, а также умение разрабатывать и тестировать прототипы пайплайнов.
Оставлять заявки могут только авторизованные пользователи.
Ищу OCR-инженера для проекта по распознаванию старославянского печатного текста (Kraken / Calamari).
Реклама
Ищу OCR-инженера для проекта по распознаванию старославянского печатного текста (Kraken / Calamari).
Работаю над созданием кастомной OCR-модели под старославянский текст XVI–XVII вв.
Есть проблема, которую стандартные движки не решают:
– 10–15 типов надстрочных знаков,
– нестандартная раскладка,
– редкие кириллические и греческие символы,
– проблема сегментации (диакритика «уезжает» в отдельную строку).
Нужен специалист, который понимает как решать и имеет практический опыт работы с задачами:
1. Разметка строк вручную/полуавтоматически.
2. Создание датасета пар «скан текст».
3. Тестирование Kraken (обязательно)/Calamari(по возможности):
– line segmentation,
– training alphabets,
– ground truth mapping.
4. Построение минимального прототипа пайплайна: папка A (исходные сканы) + CLI-скрипт -> папка B (текстовый результат в правильной раскладке).
5. Создание краткого аргументированного отчёта о том, какой путь обучения модели реалистичен и оптимален для решения поставленной задачи.
На первом этапе — пилот за начальную сумму
Это R&D-этап.
Если подходим друг другу — продолжение про...