Расчет "удельного веса" слов в поисковых запросах 

  • 1
  • Опубликовано: 2023-12-05
Утилита для определения удельного веса слов в поисковых запросах к сайтам.
На основании excel таблицы с поисковыми запросами и характеристиками слов в поисковых фразах - приведение всех морфем к первоначальной форме (именительный падеж, единственное число), расчет удельного веса данных слов в поисковых фразах при совместном использовании этих слов с указанными пользователями словами (например в запросах: шампунь мягкий, шампунь SVOBODA, сто мягких шампуней, магазин шампуней, шампуни SVOBODA - указывает какие слова и с какой частотой используются в сочетании со словом SVOBODA).
Результат обработки данных - сохраняется в excel-файл для последующей работы пользователя.
Первичные формы слов определяются как на основании готовых словарей Института русского языка из 4 миллионов морфем, так и на основании морфологического анализа (не выше 40% погрешности) словоформ.
Скорость работы программы: порядка 10 тысяч строк с поисковыми запросами в секунду.
Комментариев нет
оставить комментарий могут только авторизованные пользователи
Другие работы автора:

Серверные части сетевых проектов Написание клиент-серверных приложений, для работы по протоколам HTTP, FTP и т.д. для задач, где установка полнофункционального вэб-сервера не желательна (все запросы типовые и автоматизированные, например получение данных с устройств GPS и сохранение…

Telegram-бот для рассылки уведомлений из парсера

Telegram-бот для рассылки уведомлений из парсера Телеграм бот, рассылающий уведомления заранее определенным сотрудникам о появлении новых предложений на торговой площадке. - непрерывная работа бота без "сбоев", "падений", "зависаний" и других подобных ошибок; - асинхро…

Парсеры "сложных" сайтов

Парсеры "сложных" сайтов Парсеры сайтов со сложной структурой информации, с подгрузкой страниц, генерируемых java скриптами и т.д. Результаты работы парсеров: - автоматический импорт в CMS (Wordpress, Joomla, другие); - автоматический импорт в CMS с возможностью предварител…

Приложение для рабочего стола, API

Приложение для рабочего стола, API Приложение для рабочего стола с синхронизацией по API: Утилита для создания комфортного рабочего места оператора, заблаговременном уведомлении оператора о скорой необходимости произвести необходимые ручные действия (контроль автоматизированных процес…

Мониторинг лог-файлов в реальном времени

Мониторинг лог-файлов в реальном времени Чтение лог-файлов приложения (изначально - игрового приложения) в реальном времени, построчный парсинг сообщений и выполнение различных алгоритмов: - проигрывание mp3-файлов; - установка таймеров(будильников) для проигрывания mp3-файлов; - формирован…

Парсер статей с добавлением в CMS

Парсер статей с добавлением в CMS Парсер, настраиваемый на заранее определенные источники, для копирования статей с автоматическим созданием черновиков статей в CMS, включая изображения. Используется для регулярного копирования и перевода иностранных статей/новостей, с предварительно…

Плагин для работы с CDN

Плагин для работы с CDN Разработка плагина, генерирующего и добавляющего "временные ключи" к ссылкам: - на изображения, размещенные на CDN; - в видеоплеере, при просмотре видео с CDN; - на странице загрузок видеофайлов. Плагин реализован в соответствии с кодексом…

Система контроля изменения файлов

Система контроля изменения файлов Серверное приложение, предназначенное для регулярного отслеживания изменения файлов, уведомления с отчетом о модифицированных/новых/удаленных файлах как отправляется на эл.почту, так и доступно через вэб-интерфейс с различными отчетами: - последние и…