Duplicate content my ass

Początek będzie jak u Hitchcocka, chociaż zupełnie nie odkrywczo.

Nie ma żadnych kar za duplicate content.

Uff.
Udało się to napisać.
Ciekawe po jakim czasie od indeksacji tego przez Google zostanę zbanowany za szerzenie herezji… a nie, zaraz.. nie zostanę.
Ktoś spyta dlaczego? Tak, bo Google samo o tym pisze.

Tu powinienem zakończyć wpis i zająć się czymś konstruktywnym, ale że mam masochistyczne zapędy, to rozwinę trochę temat.

but first…

Nie ma żadnych kar za duplicate content.

Czy to znaczy, że Google nic nie robi z DC? Nie, to znaczy, że nie ma żadnych kar za duplicate content. Są za to filtry.

Jeśli piszesz artykuł na swoją stronie i używasz CMS’a który automagicznie tworzy podstrony z tagami i kategoriami na których wyświetla się ponownie tekst i pojawiają się duplikaty, to Twoja strona nie dostanie bana. Po prostu Google określi sobie, która strona z tych wymienionych wyżej jest najważniejsza i wyświetli ją w wynikach na odpowiednią frazę.

Możesz też pomóc Google w określeniu  która strona jest najważniejsza używając specjalnego tagu – rel=”canonical”.

Możesz też zaoszczędzić na transferze i nie wpuszczać botów na określone podstrony (tagi, kategorie, archiwa, różne wersje strony głównej).

Powyżej w zasadzie omówiłem kwestie duplikacji treści w obrębie jednej domeny. Jak to wygląda w przypadku identycznych tekstów na różnych domenach?

O tak.

Pytania?

Świetnie.

Jakbym nie był złośliwy (a jestem) to nie napisałbym (a napiszę) o popularnym nie tylko w pl spinningu artykułów dodawanych do pressel pages (tych prawdziwych, z wartościa) i precli (tych polskich).

Nie wiadomo w sumie kto to wymyślił, ale w tym momencie żadna dodawarka nie może obejść się bez tzw skryptu mieszającego tekst (czyli spinnera). Tworzy się piękne teksty, wstawia synonimy i skrypt w pocie czoła wymyśla setki wersji jednego artykułu, który w większości wypadków wychodzi całkowicie bezsensownie (ale co za różnica, przecież to głupia wyszukiwarka, więc nie zauważa, że to ten sam artykuł – szkoda, że nikt nie pomyślał, że tak naprawdę fakt czy jest taki sam czy nie, nie ma znaczenia).

Dlaczego nie ma znaczenia?

Tutaj mamy sedno sprawy – artykuł, nieważne jak bardzo nieunikalny, czy też przespinnowany nie do poznania – nie pojawi się w wynikach wyszukiwania. Nie pojawi się w nich, bo strona (czytaj precel) nie posiada autorytetu, linków przychodzących, w zasadzie żadnej mocy, a autor artykułu nie pokusi się nawet o podlinkowanie wpisu.

Teraz wnioski większości dodających są zaprawdę na poziomie polskiego seło: jeśli artykuł był kopią – stwierdza się, że to przez duplicate content. Jeśli  jednak artykuł był spinnem,  to dlatego, że jakość tekstu jest jest za mało unikalna (i ten, to przez DC!) i trzeba zrobić kolejny bardziej unikalny.

No więc nie.

To dlatego, że dana Strona Nie Posiada Autorytetu.

Teraz – jeśli chcecie potwierdzenia – zajrzyjcie na jakieś forum us i poszukajcie oferty dodania jednego artykułu do sieci 100 blogów. Zapewniam, że efekty będą takie same, jakbyście dodali 100 przespinnowanych szitów. Dlaczego piszę o blogach zagranicznych? (specjalnie pomijam fakt, że tam wiedzą po co robi się sieci blogów i że się o nie dba – bo ludzie płacą za dodanie i przy braku efektów więcej płacić nie będą)

To kolejna zaleta mieszkania w tym kraju. Ktoś gdzieś napisał, że artykuły mają być unikalne (przypominam o tym ). Od tej pory każdy posiadający precla, bierze sobie za cel życiowy moderację artykułów i kasowanie nieunikalnych wpisów (jakby nie mógł sobie wziąć za cel życiowy linkowania tegoż precla i nie wstawiania 17 systemów wymiany linków czy też nie porzucania go po roku jak domena się skończy). Sam nie wie po co to robi i jakie to ma znaczenie, wie tylko, że trzeba je kasować bo przyjdzie wielki Google i będzie karać za Duplicate Content (koniecznie trzeba to napisać wielkimi literami).

Nie myli się co do jednego – wielki Google przyjdzie, popatrzy na stan strony, zobaczy syf, 17 systemów wymiany w stopce, śmieciowe linki przychodzące i wyzeruje domenę i cała moc (nikłą) która mogłaby przekazać. „Ale przecież nie miałem Duplicate Content!!!” zakrzyczy potem w rozpaczy właściciel precla na PiO i przestanie się już profesjonalnie zajmować seo, a swoich licznych klientów pozostawi z przekonaniem, że ci od seo to jakieś nieprofesjonalne gnojki które tylko obiecują efekty, biorą kasę i nic nie robią.

Tak więc, nawet jeśli przeczytałeś powyższy akapit i nie chcesz już spinnować artykułów, (bo wiesz już, że to bezsensu) to przy dodawaniu tekstów do ogólnodostępnych precli, moderowanych przez ludzi opisanych powyżej, i tak będziesz musiał to robić. Tak jak i ja robię. Absurd?  So what, to norma w tym kraju.

To teraz ktoś powie – ale  jak dodam 100 takich samych artykułów z moim linkiem i Google to odkryje  to na pewno dostanę jakąś karę.

Nie, nie dostaniesz.

Ale możesz poeksperymentować – dodaj 100 takich samych artykułów z linkiem do mnie. Będę naprawdę wdzięczny.

I ja wiem, że ten artykuł nic nie da i na PiO codziennie będą pojawiać sie pytania o DC, a każdy artykuł na preclu będzie musiał być unikalny.

and the beat goes on da da dum da dum da da.

http://www.google.com/search?q=W+trakcie+ofensywy+si%C5%82+koalicyjnych+przeciw+talibom+w+prowincji+Helmand%2C+na+po%C5%82udniu+Afganistanu%2C+dwa+%C5%BAle+wycelowane+pociski+rakietowe+zabi%C5%82y+12+cywil%C3%B3w+-+poinformowa%C5%82y+dowodzone+przez+NATO+Mi%C4%99dzynarodowe+Si%C5%82y+Wsparcia+Bezpiecze%C5%84stwa+%28ISAF%29.&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:pl:official&client=firefox-a
  • Łukasz

    Ojej, ojej – to straszne :D

    Pytanie, czy opłaca się robić zrobić case (np. na podstawie tekstu z wiki). Nie to, że szerzę defetyzm, ale po co uświadamiać ludzi jesli nie chcą być uświadamiani i nie ma to wpływu na ich zdrowie …

    • Wychodzę z tego samego założenia – zresztą nie chcemy przecież niszczyć rynku ;-)

  • Miodny tekst =).

  • Według mnie sam DC wziął się trochę z innego powodu, tzw. kiedyś ludzie kopiowali tekst z różnych źródeł typu Wikipedia, allegro, popularne niegdyś liczne wyszukiwarki itd. DC miał też znaczenie przenośnie "nie kopiuj, bo zaszkodzi" – "nie kopiuj, bo tak nie ładnie".
    Jednak to czy strona jest unikalna z pewnością ma wpływ na jej pozycje jak i wartość linków z niej wychodzących. Wracając do swli, dodać należy iż precele mają też ogromną ilość "wychodzących",

    • Tak, ale zadajmy sobie pytanie (i odpowiedzmy na nie) co jest ważniejsze w tym przypadku. Bo dla mnie stawianie na unikalność (i bezsensowność) tekstu, kiedy gołym okiem widać jak bardzo niską jakość mają strony preclowe jest bezcelowe.

      A ciągłe pytania o DC i czy te tagi na preclu aby nie zaszkodzą (mimo że sprawa dotyczy stronki o zerowej wartości dla wyszukiwarki) mnie doprawadzają do furii.

  • Unikalny tekst to zawsze plusy, ale jego kopiowanie też nie zaszkodzi. Najlepszym przykładem jest artelis.pl , który świetnie się trzyma, pomimo że teksty tam zawarte można legalnie skopiować. Z takich właśnie kopi mam parę setek wejść. Więc zamiast tworzyć kolejne bezsensowne precle, lepiej było by się zająć tworzeniem systemów przedruku treści.

  • Ostatnim czasem na PiO pojawiła się ciekawa opinia dotycząca unikalność tekstu, postaram się ją przytoczyć: "Jeśli pozycjonujesz stronę na słowo gry to nie musisz stworzyć unikalnego tekstu na zaplecze, a równie dobrze możesz wykreować coś ala Gry to gry, a przede wszystkim gry!" Wartość tekstu nie ma znaczenia, a jedynie wartość linku. Sam w ostatnim czasie tego doświadczyłem (30 katalogów niskiej wartości, skok o 1 pozycje, 5 o wysokiej wartości skok o 10 pozycji). Należałby się ukierunkować w stworzenie wartościowych zaplecz/stron na które będziemy wstawiać własne linki. Tutaj odniesienie do mojej wcześniejszej idei -wymiany artykułów sponsorowanych.

  • Yeden

    Duplicate content zachodzi w zasadzie w dwóch przypadkach. Pierwszy przypadek to ta sama podstrona pod kilkoma adresami w obrębie domeny. Tak się czasem zdarza, i miałem takie przypadki w jednym z portali. Zaznaczam, że nie chodzi o tę sama treść na stronie tylko kopię 1:1. Sprawdzałem co jest wysoko na frazę i linkowałem to, natomiast w górę leciało co innego, a moja podstrona out z serpów (ale nie z indeksu). No to zmieniam, a za dwa tygodnie na odwrót. (Trochę to frustrujące, jak google gra na nosie). Ustało, kiedy admin porobił 301 i polikwidował co trzeba. Canonical jeszcze wtedy nie było. Drugi przypadek to skopiowanie strony w całości (1:1). W tym przypadku też nie było żadnego wyindeksowania, tylko podmiana wynikach wyszukiwania. Jak kopia zniknęła, wszystko wróciło do normy. Może to taki nietypowe DC, bo nie było wyrzucenia podstron, czy całej strony z indeksu, ale to jedyne przejawy duplicatu, z jakimi się spotkałem.

  • Wojtek

    To po co w takim razie kupować od dzieciaków te artykuły na allegro. Może dlatego nie dotknął nas jakoś szczególnie kryzys ;) teraz popyt spadnie i dopiero będzie :)

    • Artykuły i tak będą kupowane, nie mam co do tego żadnych wątpliwości.

      • Oczywiście że będą.
        Bo przecież inaczej moderowane precle nie wpuszczą naszych artykułów.
        I tak w kółko ;-)

  • W końcu, w końcu, w końcu, w końcu, w końcu ktoś mówi prawdę – jak niby google miałoby określać Duplicate Content ? zacznijmy od tego, że to by im serwer wyrżnęło po kolei. Powiedzmy kopiuję definicję słowa z wipedii – powiedzmy "PHP", na tysiącach stron jest ta sama definicja, i co – g*wno ! nic bo google i tak w wynikach wyszukiwania pokaże najbardziej wiarygodny wynik – WIKIPEDIĘ.
    Dziękuję, dobranoc.

  • Świetny tekst. Wcześniej rozmyślałem już na jakich zasadach Google miałoby oznaczać duplikate content, czy to po datach gdy zaindeksuje daną treść, czy też kto ma więcej podejrzanej treści u siebie? Zakręcone to by było, poza tym zasobożerne aby teraz porównywać miliony milionów podstron.
    Bardzo ładnie to opisałeś, i do tego tak z przytupem ;-D

  • fajny tekścik

  • Dobrze że zadałeś sobie trud :) heheheheh :)naprawde niezłe

  • Nareszcie ktoś ogarnął ten temat. Tu gdzie wszyscy wolą przyjąć (mylne) opinie zamiast sprawdzić ocb z tym dc. Zadziwiające jest to że ludzie zadają sobie sporo trudu żeby udawać unikalną treść, nie wiedząc że google to lotto :)

  • warqula

    Panowie i Panie flaszka dla autora, nie ma wątpliwości możemy działać

  • qlwik

    Zapominasz o jednej sprawie, wielokrotnie powielany tekst bardzo słabo się indeksuje, a jeżeli nawet, to szybko z indeksu wylatuje. I nie zmyślam tutaj bajek tylko stwierdzam to na podstawie testów. Zmiksowany art da ci więcej BL niż art niezmiksowany.

  • zdarza sie , ze ktos cos nieswiadomie napisze cos nie bedac swiadom. Mysle , ze Google nie banuje w takich przypadkach . Chyba , ze ktos to robi nagminnie i celowo :)

  • Trochę masło maślane – "nie ma akr, są za to filtry". A filtr to czasem nie kara?

  • kredyty

    Ciekawy tekst. Blog również. Częst tu wracam.

  • czarekK

    dawno większych głupot nie czytałem.

  • dobrze piszesz!
    pozdrawiam autora i zachęcam do pisana, bo od prawie roku nic się tutaj nie dzieje

  • Pawle, wróć do nas! :)

  • Mateusz

    Mnie zadziwiają te całe komentarze a'propos słabej indeksacji i wywalania z indeksu. Gdyby tak było, to 90% sklepów w ogóle nie pokazywałoby się nam w Google ;]

    Tyle ode mnie.

    PS. Mi się wszystko pięknie ładnie indeksuje i w indeksie zostaje. Musicie coś chyba źle robić, skoro Wam nie…

  • A ja może odniosę się do kwestii DC w sklepie internetowym. Na własnym przykładzie z całą pewnością mogę stwierdzić, że G nie może ukarać sklepu za powielanie treści wewnątrz, bo np mamy taką sytuację w której sklep oferuje wydania prasy i każdy jej nr nie rożni się niczym od poprzedniego. W sumie jedyną różnicą jest tylko nr takiej gazety. A tak poza tym, to świetny wpis. Niby wiadome rzeczy, a od lat tworzy się atmosfera tajemniczości wokół całego tego DC. Szalejesz ;)

  • Zgadzam się z treścią, od dłuższego czasu zauważyłem, że najważniejsze są podstawy:
    metatagi, linowanie wewnętrzne i linkowanie zewnętrzne.
    Jak to jest dobrze ogarnięte to można wypromować kolejną wiki :D

  • Coraz większe znaczenie ma unikalność tekstów na stronie.

    • Heh to już raczej od dawna;)

    • Paweł Zinkiewicz

      Napisz unikalny tekst zamieść go u siebie, po czym ja go skopiuje na swoja 10 letnią domenę i zobaczymy czy liczy się unikalność, czy raczej siła domeny :)

      • SeoKonsultant

        DC występuje tylko w obrębie jednej domeny! Nie dotyczy tekstu, a identycznych stron lub bardzo zbliżonych – powiedzmy, że dwa identyczne listingi tylko z różnym tytułem. Przytoczyłbym tu też zasadę „de minimis non curat lex” (łac. prawo nie troszczy się o drobiazgi) – nie ma potrzeby dla Google’i filtrowania artykułów zaindeksowanych raz na ruski rok, nie podlinkowanych i nie walczących o wysokie pozycje na trudne frazy. Co do tego czy liczy się siła domeny to też bym się kłócił. Po pierwsze Google premiuje świeżą treść dlatego unikalny tekst na stronie aktualizowanej często będzie miał większą siłę niż nieunikalny na równie często aktualizowanym generatorze spamu z RSSów. Po drugie liczy się do której strony/artykułu wcześniej Google wykryło prowadzący wartościowy link. Tak też liczy się wiek domeny w Google’u – czas życia domeny (zakładając, że jest przedłużana, a nie spadła i zmieniła nie tylko właściciela ale i tematykę serwisu) jest liczony od momentu zaindeksowania pierwszego linka prowadzącego do tej domeny.

        Pozdrawiam

      • Paweł Zinkiewicz

        „DC występuje tylko w obrębie jednej domeny! ”
        Google zdaje się pisać jednak co innego :) http://www.google.com/support/webmasters/bin/answer.py?hl=pl&answer=66359

        Co do tego czy lepszy jest unikalny artykuł czy kopia w autorssie, to sprawa jest jasna. Jeśli jednak zamieścisz unikalny artykuł na świeżej domenie, a ja go skopiuje i wrzucę na główną onetu, to będziesz miał problem z rankowaniem wyżej niż ja.

        Niestety z moich obserwacji wynika jasno, że liczy się bruteforce i prawo dżungli. Kto jest silniejszy = ma mocniejszą domenę – wygrywa.

      • SeoKonsultant

        W obrebie kilku domen nie może to być jeden artykuł/jedna podstrona bo żadnego filtra nie będzie. Jeśli stworzysz dwie identyczne wersje strony pod dwiema domenami bo są tacy magicy czasem to faktycznie będzie DC, ale rozmawialiśmy raczej o kopiowaniu artykułów a nie totalnie bezsensownym i bezmyślnym skopiowaniu strony. Jeśli onet zacytuje tekst ze świeżej domeny to wybicie się na wyższą pozycję jest oczywiste i nie podlega dyskusji bo domena onetu jest 1000 razy silniejsza ale to nie ma najmniejszego związku z DC! jeśli dobrze podlinkuje swój artykuł i moja podstrona z artykułem będzie dobrze zoptymalizowana pod SEO to pewnie wygram z onetem na konkretną frazę bo tylko o jakiejś konkretnej frazie może być mowa. Piszesz bardzo ogólnikowo, to że wrzucisz artykuł na GŁÓWNĄ onetu oznacza tylko tyle, że ją cholernie mocny linkiem potratkowałeś i tyle więc wszystko rozbija się o pozycjonowanie tego artykułu tak jak każdej innej strony na konkretne frazy. Dochodzi też aspekt premiowania świeżej treści i onet jako serwis z najswiezszymi wiadomosciami z 15 letnim stazem w sieci musi byc mocno premiowany. Ale wezmy inny przyklad, skopiuj artykuł ze słabszej domeny na mocniejsza ale zakladajac ze slabsza jest czesto aktualizowana nowa, unikalna trescia a ta mocniejsza jest statyczna strona firmowa ale dobrze podlinkowana i z wieloletnim stazem – kto wygra ?

      • Paweł Zinkiewicz

        Twoje pierwsze zdanie potwierdza tezy z tego postu, czyż nie? :)
        Co do linkowania wewnętrznego do artykułów ze strony, czy mocnej czy nie, to wiemy, że jest to ważne. Tak samo Twój artykuł ze słabszej strony będzie podlinkowany ze strony głównej, więc wszystko jak zwykle sprowadza się do siły domeny.
        Co do wygranej z onetem na konkretną fraze – jeśli ja dobrze podlinkuje mój artykuł na onecie, to siła domeny (nie mówię o linku z głównej) sprawi że Twój wpis poleci niżej.. :)

        Pytanie które zadałeś na końcu.. szczerze nie wiem jak zachowałoby się Google w takim przypadku, nie miałem takiej sytuacji, a staram się jak najmniej teoretyzować. Logika mówi, że siła domeny się liczy, ale zapewne fresh content zrobi swoje? Myślę, że warto sprawdzić taką sytuację, w warunkach laboratoryjnych.

  • Mateusz

    a jeżeli mam darmową podstawową domenę hostingu – a wskazuje na domene com to jak mam usunąć z indexu te domenę daną od hostingu? bo do usunięcia przez GWT się nie nadaje… niestety – dodanie noindex wyindeksuje mi też główną domenę, a to raczej nie jest wykonalne, ewentualnie jak zrobić mądre przekierowanie

  • Rob

    Myślę, że po ostatnich "rewelacjach" ze zmianą algorytmu google ten tekst trochę stracił na wartości. Teraz nikt nie może powiedzieć, że DC nie ma znaczenia.

  • No kar to może nie ma. Ale korzyści też żadnych.

  • ja tak trochę nie na temat, ale przykład powiązania duplicate ze zdjęciem sióstr olsen jest genialny moim zdaniem, gratuluje świetnego pomysłu. A co do tematu kopii to jestem w fazie testów jak to dokładnie jest z tymi kopiami, bo temat kopii zaczyna się robić z serii "dużo się o tym mówi ale nikt tego nie widział" dlatego zrobiłem sobie stronę testową i zobaczymy jaki będzie efekt.

  • Własny test to chyba najlepsze rozwiązanie :) Po co wierzyć komuś na słowo ? Ja jednak myślę, że duplicate content wciąż jest rzeczą, której wszyscy pozycjonerzy powinni unikać.

  • święta racja. lepiej się dc nie imać, bo się potem można zdziwić. ja też wolę polegać na własnych testach.

  • Przepisy kulinarna

    Fajny blog, szkoda że już umarł:(

  • Widocznie autor tekstu nie miał po prostu nigdy złych doświadczeń z DC ja jednak jestem zwolennikiem oryginalnej treści w SEO.

  • Dzięki, Twój blog pomaga mi w optymalizacji wordpresa. Zachęcam do reaktywowania bloga ;)

  • Ja tam uważam że nie ma to jak unikalny tekst a nie powielany,lepiej raz się przyłożyć i napisać coś nowego nie będzie przynajmniej tych samych tekstów na wielu stronach.

  • Pingback: Po co Ci katalog stron? - Bynajmniej.pl - SEO, Wordpress, pozycjonowanie, optymalizacja, web 2.0()

  • Tomekwer

    Jak sam napisałeś strona za DC nie dostaje kary, ale też nie ma z DC żadnych profitów, z czego wynika, że warto pisać unikalne treści.

    • Dlaczego to z tego wynika? I od razu, jakie są profity z pisania unikalnej treści?

  • Hoarder

    Przynajmniej etycznie czuję się spełniony, że nie robię śmietnika w internecie wrzucajac wszedzie to samo.

  • Po pierwsze…
    Przytoczony artykuł i stanowisko G jest z 2008 roku.

    Dwa…
    Nie należy wierzyć zapewnieniom giganta.

    Trzy…
    Nie ma pewnych dowodów na to, że DC szkodzi, ale to nie oznacza, iż duża akumulacja nieunikalnych treści na stronie nie ma wpływu na witrynę i rankingi.

    Cztery… (najważniejsza przesłanka do tego, aby jednak zadbać przynajmniej w stopniu min. o unikalność tekstu)
    Wiemy powszechnie, że Google wprowadza rocznie tysiące modyfikacji do algorytmu. Jaką mamy pewność, że nie zostanie wprowadzony ścisły element kwalifikujący wpisy jako DC i obniżający ranking witryny? Żadnych pewności nie ma, dziś jest ok, a jutro może dojść do dewaluacji wartość.

    W SEO trzeba myśleć perspektywicznie a nie trzymać się zasad obowiązujących tu i teraz.

    Pozdrawiam!

  • Podzielam tą opnie że DC to fake.