Шингл: его роль в продвижении сайтов

Материал из Самая полная в Рунете энциклопедия интернет-маркетинга
Перейти к: навигация, поиск

Понятие и методика введены в оборот в 1997 году с подачи эксперта компании Yahoo! Андрея Бродера (Andrei Broder).

Значение и этимология слова «шингл»

Шинглами называют фрагменты текста, группы из нескольких слов (обычно от 3 до 10), по которым происходит лингвистический анализ при проверке уникальности статьи, заметки, информации, описания. Слово родом из английского языка, в переводе на русский «shingle» означает тонкую строительную доску или гравийный камень, булыжник — отдельный элемент, из множества которых выстраивается некий объект.

Роль шинглов в процессе продвижения сайтов

Программы проверки уникальности (Advego Plagiatus) делят текст на кусочки (шинглы) и, сопоставляя их с результатами работы поисковых систем, определяют оригинальность содержания. Вероятность совпадения порядка слов в отдельных последовательных группах и формирует основу для вывода об уникальности текста. Например, словосочетание «большой ассортимент продукции» вероятнее всего снизит процент уникальности текста, так как является широкоприменимым в самых разных тематиках и значит, окажется в числе наиболее частых совпадений.

Алгоритм проверки уникальности контента с помощью шингловых параллелей

Для отделения скопированных текстов от добросовестно написанных программы – помощницы SEO-специалиста действуют по определенному сценарию.

1. Деление текста на шинглы (фрагменты). Длину шингла можно задать вручную. Считается, что самой строгой будет проверка на уникальность при длине шингла в 3 слова. Увеличение количества слов в сопоставляемых фразах более чем до 10 вряд ли принесет эффективный результат — барьер для фильтрования синонимов и копий становится слишком «дырявым». В практике копирайтеров общеприняты настройки на 4-хсловные шинглы. Такая основа дает наиболее результативный анализ с минимальной погрешностью.

2. Составление комбинаций. Деление происходит внахлёст — каждый последующий шингл захватывает одно – два слова из предыдущего. Как только весь текст поделён на фрагменты заданной величины, стартует основной этап проверки.

3. Непосредственный анализ. Программа исследует контент других сайтов на предмет совпадения порядка и семантики слов в проверяемом тексте и других документах. Проверка занимает секунды или минуты, в зависимости от того, сколько удается найти неуникальных фраз (шинглов).

Итогом сканирования становится числовое выражение степени оригинальности текста, выраженное в процентах. Хороший контент имеет уникальность 97 – 100%.

Эффективность шингловых алгоритмов, перспективы развития практических методик

Методика такого сканирования признана самой эффективной на сегодняшний день для определения уникальности текстов. Проверка по шинглам дает высокоэффективные результаты. Обмануть программу крайне трудно, почти невозможно — проведенная синонимизация, структурирование с заменой и перестановкой отдельных слов не приводит к желаемому результату. Лучший способ получить 100%-но уникальный текст — добросовестно написать его по имеющемуся материалу.

В 2015 году в России прошла крупнейшая конференция по SEO «Optimization 2015», где уникальность контента интернет-ресурсов была признана одним из 7 важных факторов максимизации так называемого краулингового бюджета. Чтобы побудить поисковых роботов уделить внимание конкретному сайту и индексировать его страницы, важны смысловое содержание и уникальность контента. Шинглы, уникальные в масштабах всего набора страниц, попадают в индекс гораздо чаще.

Сегодня не все программы проверки уникальности текстов используют шингловые методы. Среди последователей технологии Advego Plagiatus. Text.ru, Etxt, Сontent-watch.ru изменили алгоритмы и теперь не используют сравнение шинглов в своей работе.

Полезные ссылки