Определение интервала частот ключевых слов

Введение

Многие начинающие оптимизаторы задаются вопросами, касающимися частот запросов. Что такое НЧ, СЧ и ВЧ? Как определить, является ли запрос высокочастотным или низкочастотным? Влияет ли тематика сайта на отнесение запроса к одному из интервалов? И так далее. Постараемся ответить на все эти вопросы, а также раскрыть более подробно некоторые моменты в вопросах частот.

Определения

Отметим, что не стоит путать термины "частота" и "частотность"! Частота - это характеристика периодического процесса, измеряемая в количестве единиц за определенный промежуток времени. Частотность является характеристикой встречаемости заданного объекта (слова) среди определенного набора и измеряется в процентах. Грубо говоря, для нашего случая, частота запроса - это сколько раз в месяц искали заданную ключевую фразу в поисковой системе, а частотность запроса (допустим на странице) - это процент содержания запроса (слова) на рассматриваемой странице. В данной статье будет рассматриваться только понятие частоты поиска определенной ключевой фразы.

ВЧ (высокочастотные) запросы - наиболее запрашиваемое слово (слова, фразы) в вашей тематике (самые популярные запросы).
НЧ (низкочастотные) запросы - слова и фразы, которые запрашиваются с малой частотой в поисковых системах и относятся к вашей тематике.
СЧ (среднечастотный) запрос - что-то среднее между НЧ и ВЧ (далее будет точное количественное определение).

Конкурентный запрос - это запрос, по которому сложно вылезти в топ серпа (первые результаты выдачи в поисковой системе) из-за конкуренции сайтов, релевантных данному запросу.
Высококонкурентный запрос - запрос, при котором в серпе присутствует очень много конкурентов для данной ключевой фразы.
Низкоконкурентный запрос - запрос, при котором внутренних факторов оптимизации достаточно для того, чтобы сайт находился на первой странице серпа по данной ключевой фразе (слову).

Значимость запроса - понятие субъективное и определяется вебмастером (оптимизатором, владельцем сайта) самостоятельно в зависимости от тематики и целей сайта (более подробно о значимости см. тут Что такое "минимальная значимая частота" выборки запросов). Частота, ниже которой запросы не попадают в выборку значимых и не просматриваются для анализа, называется минимальной значимой частотой выборки.

Как определить ВЧ запросы для вашего сайта

Для определения частот поиска запросов в поисковых системах существуют сервисы, предоставляющие данную информацию. Например, для поиска частот русскоязычных слов можно воспользоваться сервисом, предоставляемым ПС Яндекс - статистика запросов. Для поиска же статистики по англоязычным словам можно использовать сервис KeywordDiscovery.

Допустим, что у вас есть сайт по производству воздуховодов (тем, кто не знаком с понятием воздуховодов, можно почитать тут: о воздуховодах). Вводим фразу "воздуховод" в wordstat и получаем список из релевантных запросов, где "воздуховод" на первом месте с 16949 показов в месяц. Но в правой колонке мы можем видеть и слово "вентиляторы", которое ищут намного чаще (75485 в месяц), однако вентиляторы могут не относится к вашей тематике и, поэтому, рассматривать слово "вентилятор" в вашей тематике как высокочастотный запрос будет неверным. То есть, из всего набора запросов вам необходимо сделать выборку наиболее значимых (вплоть до слов с минимальной значимой частотой, которая определяется вебмастером или оптимизатором). И уже эту выборку разграничивать на ВЧ и НЧ. Осуществление выборки значимых запросов суть определение семантического ядра (это и есть то, что подразумевают оптимизаторы, когда говорят, что "тематика сайта влияет на то, считать ли запрос ВЧ, СЧ или НЧ").

Точное определение границ между ВЧ, СЧ и НЧ

Итак, у вас есть выборка. Теперь необходимо вспомнить теорию вероятностей и функцию распределения. Еще раз отметим, хотя это интуитивно понятно, что СЧ - это среднее значение частоты между ВЧ и НЧ. Однако бывает сложно определить это среднее. Например, ВЧ "воздуховод" - 16949 и НЧ "продажа производство воздуховодов" - 6 запросов/месяц. Что тогда будет СЧ?

Если брать среднее арифметическое, тогда получится, что среди выборки мы не имеем СЧ вообще. Для этого рассмотрим зависимость выборки на графике (рисунок 1.1). Из графика видно, что зависимость является логарифмической, так как, если ось абсцисс (номер запроса) и ось ординат (частота запроса) взять в логарифмическом масштабе, то с некоторой погрешностью мы получим линейную гистограмму частот запросов. Это означает, что СЧ будет находится посредине этой линейной регрессии.

график распределения поисковых запросов по частотам

Рисунок 1.1 - График распределения поисковых запросов по частотам (оси взяты в логарифмическом масштабе).

Введём обозначения,
Хвч - максимальное значение частоты ВЧ запроса
Хнч - минимальное значение частоты (минимальная значимая частота) запроса

Тогда, можно утверждать, что

Хсч = \/(Хвч - Хнч) (корень квадратный из разницы максимальной и минимальной частоты).

Вышеприведенная зависимость исходит из свойства логарифма log(x)/2 = log(x^0.5) = log(\/x).

Зачастую Хнч намного меньше Хвч и, поэтому им можно пренебречь, получим:

Хсч = \/Хвч

Теперь проверим эти значения на примере "воздуховодов":

Хвч = 16949, Хнч = 6
Хсч = \/(16949-6) = \/16943 ≈ 130

Значение 130 будет являтся среднечастотным значением. Теперь необходимо определить интервал, в котором частота будет считаться средней. Для этого разобъем линейный интервал на 3-и равные части, таким образом, в каждой части будет свой диапазон частот (см. рисунок 1.2). Значение отклонения от абсолютно средней частоты будет приблизительно равно 33%.

диапазоны частот
Рисунок 1.2 - Схематическое отображение диапазонов частот.


Ширина средних частот:

D = log(Хвч)/3 = 3\/log(Xвч) = 1.41;

Значит интервал от 10log(Хсч) - D/2 до 10log(Хсч) + D/2 будет считатся интервалом средних частот. В нашем случае это

[102.11 - 0.7, 102.11 + 0.7] => [26, 646]

В этот интервал входят такие ключевые слова, как (информация на 6 марта 2008 г. 00:00 мск. вр.): очистка воздуховодов, воздуховоды прайс, воздуховоды пвх, цена воздуховоды, и др. Всё, что стоит выше отметки 646 будет ВЧ, а ниже 26-ти - НЧ. Все запросы, частота поиска которых находится в интервале от 26 до 646 в праве называться среднечастотными запросами.

Заключение

Основным соотношениям для определения интервала средних частот является следующее:

Xсч.min = 10log(Хсч) - D/2, Xсч.max = 10log(Хсч) + D/2

Хсч = \/Хвч, D = log(Хвч)/3

Заметим, что при определении интервала СЧ следует учитывать индивидуальную выборку для своего сайта и она не всегда может иметь логарифмическую зависимость. Однако приведенные выше формулы подходят для большинства случаев ключевых слов (проверено на нескольких десятках тематик). При другой характеристике поведения частоты поиска ключевых фраз необходимо искать функцию, описывающую распределение частот.

 

Сергей Кокшаров.
© OptSiteTM

Любые комментарии можно оставлять на блоге автора: что такое СЧ, НЧ и ВЧ?

 

Хостинг от uCoz