Дублираното съдържание в един сайт може да се окаже доста сериозен проблем. Дори и да пишем уникални и полезни статии, това не е гаранция, че даденият материал ще се позиционира добре. Има ред причини, при това чисто технически, които до голяма степен вредят на сайта.
Повечето уебмастъри предпочитат да използват готови CMS-и като WordPress, Joomla! и Drupal. Има и много други разбира се, но тези са най-популярните.
Всеки един CMS има както големи преимущества, така и недостатъци. Недостатъците са главно от това, че се получава дублирано съдържание. Това дублирано съдържание се корени главно в това, че се генерират други допълнителни страници, които имат ако не същото, то почти същото съдържание като целевите страници.
Кои са целевите страници в един сайт?
В WordPress това са главно публикациите и страниците. В Joomla! например има само страници (articles).
Важно е да се знае, че потребителя в крайна сметка се опитва да стигне до дадена целева страница, такава която дава отговори на негови въпроси – цена на дадена стока, конктакти на дадена фирма и т.н.
Кои са преходните страници на един сайт?
Тук ще говоря основно за WordPress, тъй като имам най-голям опит с него, а и е най-използвания CMS сред уебмастърите.
В WordPress преходни страници са:
- Таговете (Tags).
- Категориите (Categories).
- Архивите по дата (Date archives).
- Архивите по автор (Author archives).
- Страниците от търсене (Blog search pages).
- Страници от коментари (Comment subpages).
- Страницирането (Pagination).
Тези страници до голяма степен вредят на вашият сайт, тъй като те показват почти същото съдържание като целевите ви страници – публикациите. По този начин се получава канибализация. Канибализацията грубо означава самоизяждане на ключовата дума.
Малко повече за канибализацията: Основното правило към което трябва да се стремим е за всяка отделна ключова дума да създаваме една отделна страница. Ако имаме две или повече страници, които са оптимизирани за една ключова дума, Google няма да знае коя от тези страници е по-релевантна на ключовата дума и няма да позиционира нито една от страниците – или поне не на хубава позиция.
Какво трябва да направим за да се оттървем от дублираното съдържание?
Има един отговор на този въпрос и той е пълна забрана за индексиране на преходните страници. В този случай, Google ще вижда само началната страница от сайта ни + основните (целеви) страници (публикациите и страниците). По този начин ще постигнем три неща:
- Ще премахнем цялото дублирано съдържание в сайта си.
- Ще се оформи по-точно семантично ядро.
- Преходните страници ще продължат да съществуват, но само за потребителя. Той ще може да навигира чрез тях и да намира по-бързо целевите страници до които иска да стигне.
Как да забраним индексацията на преходните страници?
Достатъчно е да поставите следният код в <head> частта от кода на страниците, които желаете да не се индексират:
<meta name="robots" content="noindex,follow" />
Лесно може да направите това и с плъгини, като например SEO Ultimate или SEO by Yoast.
И двата плъгина са достатъчно мощни и гъвкави и дават възможност за избор кое в сайта да се индексира и кое не.

Кое да се индексира и кое не в SEO Ultimate
Всички преходни страници ли в WordPress трябва да са noindex?
Отговорът е не. Това кое да се индексира и кое не зависи много от вида на сайта.
Няколко примера:
Пример в който категориите и таговете се индексират: Ако имате сайт, който обхваща различни теми – женски теми, красота, мода, изкуство, клюки и т.н. Ако в такъв тип сайт имате написани 5 или 10 публикации за певицата Преслава, Google не може с точност да прецени коя от всичките публикации трябва да е по-напред в резултатите. Затова можете да обедините всички теми под един общ таг. Така при търсене е логично да се позиционира тага. Това не е спам, напротив – излиза ви обединена страница, която съдържа всичко необходимо по темата. Аналогично е и за категориите.
В някои случаи е добре или само категориите или само таговете да се индексират, но както вече казах – всичко зависи от тематиката на сайта ви.
Пример в който категориите и таговете да не се индексират: Ако имате сайт, който е на една основна тематика. Обикновенно това се отнася за малки или фирмени сайтове насочени към дейстостта която извършват. В този случай всяка една публикация или страница трябва да се явява отделна ключова дума. Тук категории и тагове не са нужни или ако са нужни е добре да са noindex, follow.
Задължителни страници, които да забраните от индексация:
- На първо място страницирането – тези страници нямат никаква стойност за търсачката. Те са полезни единствено за по-добра навигация на потребителя.
- Архивите по дата
- Архивите по автор (може да се остави да се индексира единствено при положение, че в блогът ви пишат много автори)
- Страници от коментари (например: http://w1ck3dgam3.com/2013/02/copyrighting.html#comment-85)
Чрез методите по-горе дадох съвети, които чисто технически премахват дублираното съдържание в сайта ви. Смятам, че дадох добри примери които да ви подскажат при какви сайтове да оставяте за индексиране категориите и таговете и кога не. И все пак имайте предвид, че ако публикациите ви са с ниско качество – спиннато, уникализирано, кратко и т.н. то по-горните съвете няма да имат никакво значение за сайта ви 🙂