Текстовый анализатор (SEO)
- 39
- 0
- Опубликовано: 2016-11-19
Вводные данные представляют собой файл Excel следующего вида:
1. Слева указаны исследуемые фразы
2. Справа указаны исследуемые страницы
Принцип работы
Анализирование использования указанных фразы на указанных страницах и вывод медианы.
Фразы могут состоять как из 1 слова, так и из 7 слов, то есть порог размера фразы составляет от 1 до 7 слов включительно.
Разложении фраз на составляющие и на возможные вариации.
Анализ:
- точных совпадений, как есть
- неточных совпадений (обозначим в квадратных скобках)
- обратных совпадений
- каждой из указанных совпадений через слово (обозначим звездочкой)
- каждой возможной комбинации слов и частей фраз, включая отдельные фразы
 
Вычитание фраз
При исследовании фразы раскладываются на отдельные слова, опускаются предлоги.
При исследовании учитывается, что одна фраза может быть составной частью другой фразы.
Анализ нескольких текстов по одинаковым фразам
Производится анализ нескольких страниц, исследование всех частей интернет-документа.
При анализе нескольких документов и перед выводом результатов, считается медиана.
Программа исследует:
1. Количество слов в документе
2. Вхождения в тег Title
3. Вхождения в тег Description
4. Вхождения в тег <h1>
5. Вхождения в теги <h2-h6>
6. Вхождение в основной текст документа
7. Вхождения в анкоры
8. Вхождения в теги <b>,i,strong,em
9. Вхождения в текстовые фрагменты на странице
10. Прочие вхождения внутри тега <body>