Duplicate content – kompleksowy poradnik o zewnętrznej duplikacji treści

Aktualizacja 25.01.2024 | czas czytania: 5 min | SEO
zewnętrzna duplikacja treści

Google ocenia jakość treści opublikowanych na stronach internetowych, analizując ich oryginalność. Jeśli algorytmy wyszukiwarki (a w szczególności algorytm Panda) wykryją takie same teksty zamieszczone na kilku witrynach, samodzielnie podejmują decyzję, kto jest ich autorem. Nie robią tego w sposób obiektywny – mocniejsze domeny zostają uznane za właściciela contentu, osiągając wyższe pozycje w wynikach wyszukiwania. A co się dzieje z witrynami uznanymi za plagiatorów? Spadają lub nawet znikają z rankingu Google. Konsekwencje duplicate content mogą być bardzo dotkliwe, dlatego aby nie narazić się na spadek widoczności, polecamy zapoznać się z naszym kompleksowym poradnikiem o zewnętrznej duplikacji treści.

Na czym polega duplikacja treści?

Zacznijmy od definicji. Duplikacja treści to występowanie powielonych tekstów na różnych stronach. Np. w przypadku external duplicate content, czyli zewnętrznej duplikacji, kopie naszego contentu znajdują się na konkurencyjnych, partnerskich czy informacyjnych serwisach. Z punktu widzenia wyszukiwarki posiadanie identycznych opisów jest równoznaczne z niską jakością treści, a nawet jej kradzieżą. To wszystko prowadzi do osiągania zdecydowanie niższej pozycji w wynikach wyszukiwania, niż byśmy sobie tego życzyli.

Gdy wyszukiwarka wykryje zduplikowany content, w sposób obiektywny nie potrafi ocenić, kto jest jego twórcą. Proces indeksowania odbywa się na bieżąco, a w indeksie nie ma dat indeksacji treści. Nie wiadomo więc, która ze stron jako pierwsza opublikowała dany tekst. W związku z tym autorstwo Google przypisuje mocniejszej domenie, mimo że to właśnie ona mogła dokonać duplikacji.

Wyróżniamy także drugi rodzaj duplikacji treści – internal duplicate content. To sytuacja polegająca na powielaniu takich samych tekstów na różnych podstronach naszego serwisu. Takie kopie również mogą powodować wiele problemów, a dogłębnie z tematem zapoznasz się w osobnym artykule na blogu:

Wewnętrzna duplikacja treści – 9 metod na eliminację internal duplicate content.

Jak duplikacja treści, to algorytm Panda

Za ocenę jakości treści odpowiada specjalny algorytm wyszukiwarki Google o uroczej nazwie Panda. Od 2011 r. mechanizm nakłada kary na serwisy lub obniża ich pozycję w przypadku wykrycia duplikacji contentu. Celem takiego działania jest dostarczenie użytkownikowi witryn o jak największej wartości merytorycznej. Według googlarzy powielone treści nie przekazują internautom istotnych informacji i nie zaspakajają potrzeb informacyjnych. Ponadto skopiowane teksty nierzadko traktuje się jako kradzież własności intelektualnej oraz próbę manipulacji algorytmów Google.

O duplikacji treści poczytasz też w supporcie Google: https://support.google.com/webmasters/answer/66359?hl=pl

Najczęstsze powody zewnętrznej duplikacji contentu

Właściciele serwisów często nie zdają sobie sprawy, że posiadają szkodliwe duplikaty treści na poszczególnych podstronach. Nieświadome kopiowanie tekstów, a także niewiedza dotycząca sposobu rankingowania domen przez wyszukiwarkę doprowadza do powstawania zduplikowanego contentu. Do zewnętrznego powielania tekstów prowadzi także:

Umieszczanie identycznej informacji o firmie w katalogach, social media, stronach partnerskich

Napisanie ciekawego tekstu „o nas” zwykle wymaga więcej czasu i zachodu. To, jak się przedstawimy, kształtuje nasz wizerunek w sieci. Pamiętajmy jednak, aby nie kopiować naszego super biogramu i nie wklejać go na inne strony, za pośrednictwem których chcemy się zaprezentować. Najlepiej mieć w zanadrzu 2 pakiety treści – jeden na naszą stronę www, a drugi do pozostałych mediów.

Uwaga! Google coraz lepiej radzi sobie z indeksowaniem treści publikowanej na portalach społecznościowych. Z tego względu unikaj kopiowania tekstów ze swojego serwisu do wpisów w social media.

Wykorzystywanie opisów produktów na Ceneo, Allegro, OLX

Nieumyślna duplikacja treści powstaje także wtedy, gdy wymuskane i przygotowane z myślą o SEO opisy produktów lądują na zewnętrznych serwisach sprzedażowych. Prowadząc sprzedaż za pomocą innych, internetowych kanałów dystrybucji (np. Allegro, Ceneo, OLX itp.), nie należy kopiować swoich treści, by następnie wrzucić je do opisu aukcji. Znane portale aukcyjne oraz agregatory ofert zwykle są oceniane wysoko przez Google, cieszą się dobrą reputacją, więc autorstwo Twoich tekstów zostanie przypisane im, a nie Tobie.

Korzystanie z treści udostępnianych przez producentów, dystrybutorów, partnerów

Nawet jeśli Twój partner, producent, dystrybutor udostępnia opisy produktów i oficjalne materiały marketingowe, nie korzystaj z nich na swojej stronie www. Teksty koniecznie zredaguj, zanim opublikujesz je w swoim sklepie internetowym.

Przesyłanie informacji prasowych, artykułów sponsorowanych już opublikowanych na naszej stronie

Tworząc artykuł sponsorowany, notkę prasową lub komunikat o najistotniejszych zmianach w firmie, który będziesz wysyłać do wydawców, partnerów, agencji prasowych, pod żadnym względem nie zamieszczaj tej treści na swojej witrynie. Pamiętaj, że wysyłka tekstów na zewnątrz rodzi ryzyko duplicate content.

Niewłaściwa redakcja tekstów powstających na podstawie źródeł zewnętrznych

Przygotowując teksty na strony internetowe na podstawie zewnętrznych źródeł, np. posiłkując się definicyjnymi informacjami, danymi, raportami, możemy niechcący doprowadzić do powielenia treści. Staraj się pisać własnymi słowami i nie zapominaj o dodaniu dodatkowych wniosków, konkluzji, spostrzeżeń wzbogacających opracowanie.

Podpięcie strony do mikrobloga lub innego serwisu agregującego treść

W internecie można spotkać się z serwisami, które agregują treści z innych stron internetowych. Ich celem jest dostarczenie określonej grupie docelowej tekstów z danej tematyki. Podpięcie bloga do takiego agregatora zwykle pozwala na zwiększenie ruchu, pozyskanie nowych użytkowników, ale powoduje też powielanie tekstów, niekorzystnie wpływając na ocenę naszego serwisu przez algorytmy Google.

Inwestowanie w teksty w synonimach

Teksty synonimiczne to echo dawnych metod pozycjonowania stron. Pozwalały niskim kosztem nasycić stronę treścią o przeciętnej, a nawet bardzo słabej jakości. Obecnie odchodzi się od tworzenia i publikowania artykułów w synonimach, ponieważ często doprowadzają do double content.

Formułki prawne, treść polityki cookies, regulaminy

Do duplikacji treści doprowadzają także powtarzające się sformułowania prawne, które muszą stosować np. wszyscy właściciele e-sklepów lub strony internetowe działające w danej branży. Należy do nich m.in. treść polityki cookies, regulaminy, dokumenty objaśniające RODO, polityka zwrotów, reklamacji itd. Wszystkie tego typu dokumenty nie są istotne z punktu widzenia SEO, więc najlepiej zablokować takie strony przed indeksacją. Z kolei tekst o cookies przygotuj w formie żartobliwego hasła, stawiając na unikalność tego zapisu.

Proceder kradzieży treści

Najgorsze, co można zrobić, prowadząc własny serwis, to dokonanie kradzieży treści z innych stron internetowych (konkurencji!). W ten sposób naruszamy prawa autorskie, co może na nas sprowadzić negatywne konsekwencje prawne, oraz duplikujemy teksty, narażając witrynę na kary ze strony wyszukiwarki Google. Nigdy nie kopiuj opisów produktów, kategorii, artykułów blogowych i zainwestuj w swój własny, oryginalny content!

Konsekwencje powielania treści

Co czeka właściciela serwisu, jeśli algorytmy Google wykryją zduplikowany content? Konsekwencje są naprawdę nieprzyjemne, ponieważ odbijają się na efektach procesu pozycjonowania, a co gorsza rodzą możliwość nałożenia na witrynę kary ręcznej albo algorytmicznej. W supporcie Google czytamy:

Google duplikacja treści support

Źródło: https://support.google.com/webmasters/answer/66359?hl=pl

Najgorszym skutkiem występowania duplicate content jest usunięcie strony z indeksu Google, a tym samym z organicznych wyników wyszukiwania. To może dotknąć całą domenę albo tylko poszczególne podstrony, na których algorytm Panda wykrył powieloną treść. Z taką konsekwencją spotykamy się stosunkowo rzadko, jednak wyindeksowanie serwisu stanowi realne zagrożenie.

Najczęściej zewnętrze duplikaty prowadzą do:

  • Obniżenia pozycji witryny w rankingu Google,
  • Zmniejszenia widoczności brandu w organicznych wynikach wyszukiwania,
  • Spadku ruchu w serwisie,
  • Mniejszej szansy na konwersje.

Zduplikowany content bardzo często odpowiada za wahania pozycji serwisu na wybrane frazy. To z kolei stwarza ryzyko niedotarcia do potencjalnego klienta akurat wtedy, kiedy poszukuje produktów i usług, które my jesteśmy mu w stanie dostarczyć.

Duplicate content – jak sprawdzić, czy nie mamy powielonych treści w serwisie?

Rekomendowanym rozwiązaniem jest regularne sprawdzanie unikalności treści w serwisie. Trudno zablokować tekst opublikowany na stronie przed kopiowaniem (o czym piszemy nieco niżej), więc w każdym momencie może dojść do naruszenia naszej własności intelektualnej. A jeśli plagiatu dokona silniejsza domena, prawdopodobnie to my niestety oberwiemy za powielanie treści. Duplikaty contentu wykryjemy w bardzo prosty sposób za pomocą dedykowanych narzędzi (tzw. duplicate content checker) albo za pomocą wyszukiwarki Google.

Jak sprawdzić duplikat treści bezpośrednio w wyszukiwarce Google?

Wyszukiwarka Google to najpewniejsze źródło informacji o duplicate content. Bezpłatnie możemy zweryfikować, czy fragmenty treści na naszej stronie znajdują się także na innych serwisach.

  1. Skopiuj do 32 słów tekstu ze swojej strony.
  2. Otwórz w przeglądarce wyszukiwarkę Google.
  3. W pasku wyszukiwania w cudzysłowie wklej skopiowany fragment.
  4. Google sprawdzi, czy w swoim indeksie posiada dokładne dopasowanie do Twojego tekstu.
  5. Duplikaty pojawią się w wynikach wyszukiwania, a dokładne dopasowanie treści zostanie pogrubione w Description.
  6. Jeśli Google znajdzie bardzo dużo stron z takim samym contentem, schowa wyniki pod przyciskiem:

Aby pokazać najbardziej trafne wyniki, pominęliśmy kilka pozycji bardzo podobnych do 10 już wyświetlonych. Jeśli chcesz, możesz powtórzyć wyszukiwanie z uwzględnieniem pominiętych wyników.

Przeprowadzając dokładną analizę duplikacji, warto kliknąć link, aby sprawdzić pełną listę domen.

jak sprawdzić duplikację treści w google

Sprawdzanie unikalności treści za pomocą Google ma jeden podstawowy mankament – na raz można sprawdzić jedynie krótki fragment treści. Jeśli chcielibyśmy zweryfikować duplikację całego naszego contentu tym sposobem, z pewnością zajęłoby to nam bardzo dużo czasu.

Copyscape – jeden z najlepszych duplicate content checker

Jednym z lepszych i dokładniejszych programów do wykrywania duplikacji zewnętrznej jest Copyscape. Program można przetestować w bardzo ograniczonej wersji bezpłatnej, by przekonać się o jego możliwościach. Wykupienie subskrypcji pozwala m.in. na masowe sprawdzenie wielu adresów URL, a informacja o wyniku unikalności treści pojawia się w łatwym do pobrania raporcie. Ponadto Copyscape przydaje się także do zweryfikowania oryginalności treści podsyłanych przez copywriterów.

Darmowe programy do sprawdzania duplikacji treści – czy warto ich używać?

W sieci znajdziemy też liczną grupę zupełnie bezpłatnych narzędzi do identyfikowania zduplikowanego contentu. Niestety, większość z nich nie oferuje zbyt wysokiej dokładności sprawdzania kopii – aplikacje nie wykrywają większości serwisów, które znajdziemy za pomocą wyszukiwarki Google.

Eliminacja zduplikowanego contentu w serwisie

Znaleźliśmy zewnętrzne kopie treści i co teraz? Rozwiązań mamy kilka, a zgodnie z rekomendacją z suportu Google należy po prostu napisać tekst od nowa.

Źródło: https://support.google.com/webmasters/answer/66359?hl=pl

Eliminacja nieunikalnych treści polega na:

  • Przeredagowaniu powielonych tekstów lub ich fragmentów,
  • Wykluczeniu z indeksacji stron z kopiami, na których nam nie zależy i które w zasadzie nie powinny pojawiać się w wynikach wyszukiwania (regulamin, polityka cookies itp.),
  • Dopisaniu jak największej ilości unikalnego contentu do duplikacji, którą niestety musimy zostawić na stronie (np. wynika to z przepisów prawa). Google ocenia stosunek treści oryginalnej do skopiowanej, więc im więcej niepowtarzalnych opisów znajdzie się na danej podstronie, tym lepiej.
external duplicate content

Źródło: https://support.google.com/webmasters/answer/66359?hl=pl

Jak radzi Google, jeśli ktoś dokonał plagiatu naszej treści, możemy się z nim skontaktować i poprosić o jej usunięcie. W najgorszym przypadku pozostaje dochodzenie praw na drodze sądowej. To rozwiązanie nie jest jednak polecane z punktu widzenia pozycjonowania – wyszukiwarka nie wie, co się dzieje poza sferą online, dlatego wykrywając duplikację, od razu najlepiej dokonać jej redakcji.

Niepolecanym rozwiązaniem, które czasami stosują niektórzy właściciele stron, jest zamieszczenie treści na grafice. Na razie Google nie potrafi sczytać tekstu z obrazka, więc w ten sposób unikniemy duplikacji. Nie wiemy jednak, co się zdarzy w przyszłości i jak rozwiną się mechanizmy wyszukiwarki. Za rok albo za dwa może okazać się, że litery osadzone w pliku graficznym będą czytane przez roboty jak zwykły, HTML-owy tekst.

Zabezpieczenie treści przed kradzieżą

Niestety nie ma skutecznego sposobu na zabezpieczenie strony przed kopiowaniem treści. Można jedynie utrudnić powielanie treści złodziejaszkom nieposiadającym zaawansowanych umiejętności programistycznych.

Do najpowszechniejszych technicznych metod utrudniających kopiowanie contentu należą:

  • Blokowanie prawego przycisku myszy na stronie,
  • Zablokowanie zaznaczania oraz kopiowania tekstu,
  • Dodawanie linku do strony do skopiowanego tekstu,
  • Zablokowanie hotlinkowania grafiki,
  • Podmiana pliku graficznego podczas pobierania ze strony internetowej.

Polecamy przeczytanie całego artykułu o ochronie tekstów na stronie internetowej.

Zewnętrzna duplikacja treści – podsumowanie

Unikalność treści to jeden z ważniejszych czynników mających wpływ na ocenę serwisu przez algorytmy wyszukiwarki Google. Pisanie własnych tekstów to inwestycja, która opłaci się w postaci wzrostu widoczności strony w organicznych wynikach wyszukiwania. Pamiętajmy też o regularnym monitorowaniu zewnętrznych kopii treści – nieświadomi użytkownicy z łatwością mogą dokonać duplikacji contentu, który niestety odbije się na efektach pozycjonowania.