Разметка запросов по словарям

Позволяет разметить запросы по словарям для дальнейшей чистки или кластеризации ядра.

Стоп-слова:
Словари:

Инструмент позволяет разметить группу запросов по тематическим словарям. Может быть полезен при кластеризации или чистке семантического ядра. Обладает достаточно богатым набором словарей, применимым в большинстве случаев.

Интерфейс сервиса

Интерфейс сервиса состоит из:

  1. Поля для ввода запросов.
  2. Возможности выбрать необходимые словари или разметку стоп-слов.
  3. И запроса результата разметки.

Пример использования

Возьмем фрагмент нашего условного семантического ядра и загрузим в систему:

Сразу видно, что во фрагменте ядра встречаются вопросительные запросы, запросы по городам, банкам, страховым компаниям и прочее. Попробуем провести проверку по всем словарям, а также используем стоп-слова.

В результате получаем для скачивания .csv файл с размеченной таблицей. Посмотрим на результат:

В первом столбце — список исходных ключевых слов.

В последующих столбцах — выбранные словари с заполнением соответствующим результатом.

К примеру, в строке 6 и 7 нашлись запросы по городам РФ, поэтому в соответствующем столбце размечены найденные города:

А столбец 15 содержит как название банка, так и коммерческий запрос акции, поэтому заполнены сразу 2 поля:

Почему это удобно

Благодаря сервису можно быстро почистить ядро от стоп слов, удалить коммерческие запросы из информационного ядра или информационные из коммерческого.

Не менее полезно использовать сервис при кластеризации.

  1. Вынести региональные запросы в отдельный раздел.
  2. Отделить запросы из Украины.
  3. Отдельно собрать запросы, содержащие вопрос, и так далее.

Как посмотреть перечень слов для разметки

Около каждого словаря есть кнопка “Смотреть”, позволяющая открыть полный перечень слов, по которым происходит проверка:


Оставьте комментарий

Комментариев пока нет, будьте первым.