Eine Seite wurde aufgrund von DMCA von Google entfernt. Sind die eingehenden Links noch wertvoll?

9

Ok, hier ist, was ich für eine knifflige Frage halte:

Sie haben also eine Website, auf der eine DMCA-Entfernung für einen Beitrag vorgenommen wurde, der eine enorme Menge an Verkehr erhalten hat. Die DMCA-Entfernung war möglicherweise korrekt oder nicht korrekt, aber ich habe im Moment weder die Zeit noch die Ressourcen, um sie zu bekämpfen.

Meine Frage, die Seite, die mit der DMCA-Entfernung herausgegeben wurde, wurde seitdem vor dem SERPS ausgeblendet, ABER der Beitrag bleibt immer noch in meinem Blog - weil er so viel Verkehr erhalten hat, dass er eine beträchtliche Menge hochwertiger Backlinks generiert hat. .. also was passiert mit diesen Backlinks, die Seite befindet sich noch auf der Website, wurde aber in der Google-Datenbank entfernt (versteckt). Haben die Backlinks immer noch Gewicht ...?

BEARBEITEN 1: Wenn Sie eine Google-Suche nach dem Link durchführen, wird Folgendes angezeigt:

Als Antwort auf eine Beschwerde, die wir gemäß dem US Digital Millennium Copyright Act erhalten haben, haben wir 1 Ergebnis von dieser Seite entfernt. Wenn Sie möchten, können Sie die DMCA-Beschwerde lesen, die die Entfernung (en) bei LumenDatabase.org verursacht hat.

BEARBEITEN 2 Die alte Site, von der der Beitrag stammt, hatte monatelang und weist immer noch rel canonicalauf den Blog-Post auf meiner Site hin, der jetzt mit DMCA herausgegeben wurde. Dieser rel canonicalwurde jedoch seit der Veröffentlichung mit DMCA ignoriert, obwohl die rel canonicalÜberreste auf meine Site gerichtet sind ... für was das wert ist

Timothy Coetzee
quelle
Ihre zweite Bearbeitung bringt mich zum Nachdenken (ich hasse das). Bist du der ursprüngliche Autor des Beitrags? Wenn dies der Fall ist, wie behauptet dann die andere Website, Sie hätten ihren Inhalt gestohlen? Etwas zu beachten.
Closetnoc
@closetnoc Ich habe den Beitrag geschrieben, es war ein Geschäft, bei dem mein (vorheriger) Partner und ich eine Website hatten, wir haben uns darauf geeinigt, uns zu trennen, und ich habe meinen Beitrag auf meine neue Website gebracht. Er hat zugestimmt, eine rel canonicalauf meine neue Website für die Website zu stellen Post, den ich geschrieben habe ... Kurz gesagt, ein paar Dinge passierten auf der ganzen Linie - er bemerkte, dass der Post, den ich schrieb (ursprünglich auf unserer gemeinsamen Domain gepostet), anfing, eine RIESIGE Menge an Verkehr zu generieren, sauer wurde und eine DMCA einreichte gegen die Post, (Die Post hat über 100.000 soziale Anteile erhalten und wurde in einigen wichtigen Veröffentlichungen erwähnt) Sie denken, es ist Plagiat ... basierend auf der obigen Erklärung?
Timothy Coetzee
Plagiat ist nicht das richtige Wort. Wenn jedoch eine falsche DMCA-Beschwerde eingereicht wurde, würde ich sie ohne zu zögern bekämpfen. Dies ist "falsches Fluchen" nach dem Gesetz. Es ist ein Verbrechen. Erklären Sie ihnen, was Sie uns erklärt haben. Ich würde empfehlen, einen Anwalt für Urheberrecht zu beauftragen, ein oder zwei Briefe zu schreiben, von denen einer Ihrem Ex-Partner nicht mehr zur Verfügung steht und der andere, um dem entgegenzuwirken. Briefe sind kostengünstig und lösen Probleme oft schnell. Aus welchem ​​Grund auch immer, wenn ein Anwalt involviert ist, nehmen die Leute die Dinge ernst. Es bedeutet keine Klage, es bedeutet nur das Mindeste, was Sie tun können, um sicherzustellen, dass Sie gewinnen.
Schranknoc

Antworten:

7

In Ordnung. Dies wird einer der Fälle sein, in denen ich den Prozess durcharbeiten werde, damit er klarer wird. Es wird etwas lang sein, aber hoffentlich nicht schmerzhaft lang.

Beginnen wir am Anfang, sollen wir?

Ausgehend von dem, was wir über die Funktionsweise von Google wissen, basierend auf dem Forschungsbericht von Brin und Page aus dem Jahr 1997, wissen wir einige Dinge, die heute sehr wahrscheinlich noch im Spiel sind.

Google hat eine URL im Index und in der Abrufwarteschlange und ruft die Seite ab. Der Code für die Seite wird in ihrer Datenbank für verschiedene Verarbeitungsformen gespeichert. Einer der Prozesse wäre, neue Links zu finden. Jeder von Google gefundene Link wird zuerst im Linkindex gefunden, falls vorhanden. Wenn dies nicht der Fall ist, wird der Link zur Verknüpfungstabelle und zur Abrufwarteschlange hinzugefügt.

Jeder Link in der Link-Tabelle enthält mindestens diese Elemente, die Link-URL, die Quell-URL und den Link-Text. Es ist wahrscheinlich, dass es andere Datenelemente gibt, die jedoch die Diskussion nicht vorantreiben. Jeder Link, der zur Link-Tabelle hinzugefügt wird, hat die Quell-URL überprüft, aber nicht unbedingt die Ziel-URL. Am Beispiel relationaler Datenbanken könnten die Quell- und Ziel-URLs eine URL-ID in der URL-Tabelle sein, und eine Verknüpfungstabelle würde die Quell-URL- und Ziel-URL-Elemente der Verknüpfungstabelle mithilfe einer ID zurück zur URL-Tabelle verbinden. Verwirrt? Sei nicht.

In jedem Fall, in dem die Zielseite nicht abgerufen wurde, wird der Link in der Link-Tabelle als baumelnder Link bezeichnet. Sobald die Seite abgerufen wurde, ist der Link innerhalb der Link-Tabelle vollständig. Wenn die Zielseite nicht vorhanden ist, ist der Link in der Link-Tabelle ein fehlerhafter Link. Einfach?

Nur vollständige Links können einen Wert übergeben. Der PageRank-Algorithmus benötigt eine vollständige Verknüpfung, um den Wert zu berechnen. Alle baumelnden und defekten Links stoppen alle Berechnungen, die den Link verwenden. Bisher war PR ein rekursiver Prozess, bei dem Verknüpfungswerte mithilfe der Verknüpfungstabelle immer wieder berechnet wurden, bis der Wert, der an eine Verknüpfung angepasst werden kann, innerhalb eines numerischen Werts liegt, der so klein ist, dass er praktisch keinen Unterschied macht. Ich bin sicher, dass dies immer noch ein Haushaltsprozess ist. PR wird heute jedoch mit einer anderen Methode berechnet, die Hops in einem Netzwerk ähnelt und die Entfernung von einer Seite zur anderen mit relativer Bedeutung misst. Es basiert auf dem Vertrauensnetzwerkmodell, für dessen Emulation das ursprüngliche PageRank-Modell entwickelt wurde. Ein Link ist eine Vertrauensabstimmung von einer Entität zu einer anderen. Während es komplizierter wird als dies, du bekommst das Bild. Es macht effektiv dasselbe wie der rekursive Prozess unter Verwendung einer Echtzeitberechnung, obwohl es wahrscheinlich weniger genau ist, aber genau genug, um zuverlässig zu sein. Dies erfordert vollständige Verknüpfungen, da Vertrauenswerte (unter Verwendung des Vertrauensnetzwerkmodells) nicht übergeben werden können, wenn keine Vertrauensstellung hergestellt wird. Denken Sie daran, dass ein Link eine Vertrauensabstimmung oder ein Link im Vertrauensnetzwerkmodell ist. PageRank wird als Vertrauenswert in einem Vertrauensnetzwerk dargestellt.

Nachdem Sie die Links verstanden haben und wissen, wie wichtig sie sind, können Sie fortfahren.

Für eine Suchmaschine ist es nicht sinnvoll, eine URL zu entfernen. Wenn in der URL-Tabelle keine URL vorhanden ist, können Sie nichts über die URL wissen und sind ratlos. URLs werden wahrscheinlich im Allgemeinen nicht gelöscht, es sei denn, es ist beispielsweise sinnvoll, wenn die URL nicht mehr vorhanden ist. Wenn eine Seite jedoch auf NOINDEX gesetzt ist, wurde die Suchmaschine ausdrücklich angewiesen, die Seite NICHT zu indizieren. Da eine Webseite innerhalb des Index aus zwei Dingen besteht, einer URL und dem HTML-Quellcode, entfernt NOINDEX die Seite an dieser Stelle effektiv. Links zu einer NOINDEX-Seite baumeln zumindest.

Nachdem Sie nun wissen, wie eine indizierte Seite aussieht, können Sie weiter vorgehen.

Es gibt viele Möglichkeiten, wie eine Suchmaschine eine Webseite oder Website bestraft. Einer wird dekotiert. Dies ist die schwerste aller Strafen und die Wiederherstellung dauert lange. Diese Kategorie von Strafen können Sie nachweisen, da die Seite nicht gefunden wird und nicht gefunden werden kann. Außerdem informiert Sie die Googles Search Console in etwa darüber, dass Seiten gelöscht werden. Von den verbleibenden Strafen werden die Strafen in SERP-Filtern angewendet.

Wenn eine Suchabfrage ausgeführt wird, gibt es tatsächlich mehrere Abfragen gleichzeitig für den Index, die dann basierend auf einem Teil des Algorithmus zu einer Ergebnismenge zusammengefügt werden. Der verbleibende Algorithmus, den wir oft als einzelne Entität bezeichnen, ist eine Reihe relativ einfacher SERP-Algorithmen. Die primären Algorithmen ordnen die Ergebnismenge basierend auf Echtzeitmetriken wie Trends neu. Von den Algorithmen werden diejenigen als Filter bezeichnet, die Einträge aus der Ergebnismenge entfernen oder die Platzierung eines Eintrags in der Ergebnismenge ernsthaft herabstufen. Einer, der angewendet wird, ist der Filter, der DMCA behandelt, wie mit belegt...we have removed 1 result(s) from this page...

Sind nun, da Sie wissen, wie Strafen angewendet werden, Links, PR- und DMCA-Filter verbunden?

Wir wissen, dass ein Filter angewendet wurde. Dies hat jedoch nichts mit dem Link-Index zu tun, mit dem der PageRank berechnet wird. Es ist so weit wie möglich vom Link- / PR-Prozess entfernt. Links und PR stehen am Anfang des Indizierungsprozesses, während das Entfernen der DMCA-bestraften Seite am Ende des Abfrageprozesses steht. Tatsächlich sind dies zwei völlig getrennte Motoren. Während eine Seite aufgrund einer DMCA-Beschwerde möglicherweise entfernt wird, wird sie nicht tatsächlich aus dem Index entfernt, und daher werden weiterhin Links zu und von der Seite berechnet.

Klar wie Schlamm? Ich hoffe, dass ich das gut erklärt habe. Bitte lassen Sie mich wissen, ob ich etwas für Sie klären kann.

[Aktualisieren]

Eine Ausnahme, die nicht für das OP-Szenario gilt.

@StephenOstermiller bringt einen guten Punkt vor, der das oben Gesagte nicht untergräbt. Der Vollständigkeit halber möchte ich ihn jedoch hinzufügen.

Wie Sie wissen, erfordert das Bewerten einer Website oder Seite innerhalb der Suche viele Faktoren. Dies ist zwar nicht so technisch oder mystisch, wie Sie sich vorstellen können, aber es sind immer noch viele oder Faktoren abzuwägen. Ich habe den Effekt von Vertrauensbewertungen hauptsächlich deshalb vergessen, weil er im Fall des OP nicht zutraf. Also füge ich es hier hinzu.

Offensichtlich gibt es Websites, die nichts nützen, wie Spam-Websites. Innerhalb dieser Klassifizierung von Websites befinden sich Websites, die gewohnheitsmäßig Urheberrechtsinhalte missbrauchen. Dies war vor vielen Jahren ein großes Problem, bei dem Content Scraper Websites aus Ihrer harten Arbeit zusammenstellten. Lange Zeit wurde nichts getan. Die Websites mit Originalinhalten würden ziemlich konsistent an die Scraper-Websites verlieren. Ich sollte wissen. Ich hatte zwei PR 8-Sites, die fast den gesamten Datenverkehr aufgrund von Scraper-Sites ohne jeglichen Rückgriff verloren haben.

Die Dinge haben sich jedoch geändert. Und es sind erst vier Jahre vergangen, seit die bedeutenden Veränderungen begonnen haben.

Für diese spezielle Klassifizierung von Websites kann die Vertrauensbewertung der Websites erheblich reduziert werden. Das ist bekannt. Es dauert Jahre, um die Vertrauenswerte wiederherzustellen, und bei einigen Websites kann dies niemals passieren. Warum glauben Sie beispielsweise, dass Domain-Monetisierer so bereit sind, eine Website mit Hunderttausenden, die in den Startlöchern auf denselben Missbrauch warten, gründlich zu zerstören? Dies liegt daran, dass eine Domain in Wirklichkeit ihren Wert über die Einlösung hinaus ruinieren kann.

Es gibt viele Faktoren, die zur Vertrauensbildung beitragen. Darauf werde ich hier nicht eingehen. Beachten Sie jedoch, dass Vertrauen eine wichtige Komponente beim Aufbau des Ranges für jede Site ist.

Das heißt, für jede Site, die einen schwerwiegenden Verstoß gegen die DMCA mit einer ziemlich umfangreichen Erfolgsbilanz darstellt, würde die Vertrauensbewertung ernsthaft beeinträchtigt. Dies ist nicht das Szenario, das das OP beschreibt. Es ist jedoch das Szenario, das ich hier annehme.

Links und das Einrichten von PageRank bestehen aus mehr als einer Komponente. Einer ist der PageRank (Autorität) der Seite selbst. Für sehr maßgebliche Seiten gibt es eine Berechtigungsobergrenze. Eine PR 8-Seite teilt keinen Wert von 8 unter den Links auf dieser Seite. Dies ist Teil des ursprünglichen PageRank-Algorithmus, mit dem PR eine natürlichere Kurve erhalten soll. Andernfalls wäre es für eine neue Seite selbst nach langer Zeit nahezu unmöglich, mit einer Seite mit hoher Autorität zu konkurrieren. Der Wert des Links selbst wird anhand verschiedener Faktoren bewertet, einschließlich des semantischen Werts des Linktextes, der Link-URL, der Position des Links (Bekanntheit), des semantischen Werts des Inhaltsblocks, der den Link enthält, falls zutreffend usw. Alle Links werden von 0 bis 0,9 bewertet. Die Berechnung der Berechtigungs- und Linkbewertung ist der Wert, der von einem Link übergeben wird.

Schön und gut. Wie wirkt sich dies auf eine Website aus, die einen wesentlichen Verstoß gegen die DMCA darstellt?

Der Wert eines eingehenden Links wird nicht unbedingt durch die Vertrauensbewertung der Zielwebsite beeinflusst, da der Wert der Links von der Quellwebsite stammt. Jeder ausgehende Link könnte jedoch sein. Die Autorität einer Site, die einen signifikanten DMCA-Missbraucher darstellt, wird durch die Vertrauensbewertung beeinflusst. Autorität kommt schließlich aus Vertrauen. Auf diese Weise würde der Wert eines eingehenden Links nicht über ausgehende Links weitergeleitet, ohne dass dies abhängig von der Vertrauensbewertung beeinträchtigt wird.

Dies ändert die Antwort etwas.

Dies gilt zwar nicht für das OP-Szenario, es gibt jedoch ein Szenario, in dem ein eingehender Linkwert mit einer DMCA-Verletzung nicht vollständig über die Site übertragen wird. Dies ist jedoch ein schwieriger Fall, und daher ist der Schwellenwert, bevor dies geschieht, erheblich.

Schranknoc
quelle
Vielen Dank für diese ausführliche Antwort ... Ich werde sie noch ein paar Tage offen halten, um zu sehen, was sonst noch auftauchen könnte ... Ich werde ein bisschen mehr Nachforschungen anstellen und Ihnen ein paar Fragen stellen, bevor ich die Antwort akzeptiere am nächsten oder zweiten Tag, wenn das in Ordnung ist - nochmals vielen Dank, dass Sie sich die Zeit genommen haben, dies alles aufzuschreiben
Timothy Coetzee
Google hat DMCA-Anfragen zurückgeschleift, um ein Ranking-Faktor zu sein: searchengineland.com/… Dieser Algorithmus zielte auf viele DMCA-Anfragen ab und nicht nur auf eine, wie im Fall dieser Frage. Es ist möglich, dass das Abwerten von Links zu DMCA-unterdrückten Seiten Teil dieses Algorithmus-Updates war. Wie bei den meisten Dingen sagt Google nichts. Ich kenne auch keinen guten Weg, es zu testen.
Stephen Ostermiller
Aber ich stimme Closetnoc zu, dass Google Code hätte schreiben müssen, um diese Links speziell abzuwerten, da die DMCA in den Indexierungsprozess passt.
Stephen Ostermiller
@ StephenOstermiller Ja. Ich habe das vergessen. Grundsätzlich erstellt die Index-Engine Rangmetriken, einschließlich Links zu Domänen- und Vertrauensmetriken, während andere Entitäten den Rang herabstufen können. SERP-Filter sind dynamisch. Was in dem Artikel erwähnt wird, scheint eine ganze Kategorie von anhaltenden Verstößen zu sein, die den Vertrauensrang der Websites verschlechtern. Wenn eine Site an Vertrauen gewinnt, ist es sehr schwierig, sie zurückzubekommen. Es kann Jahre dauern. Ein Site-Vertrauensrang kann den Wert eines ausgehenden Links beeinflussen. Wenn mehr Koffein vorhanden ist, werde ich in der Antwort sehen, ob ich dies verstehen kann. Vielen Dank, dass Sie dies angesprochen haben! Prost!!
Schrank
@StephenOstermiller der Teil über Ich habe zu denken, ob der Trust Score wird den Wert eines externen Link bewirken. Ich würde es mir vorstellen, bin mir aber noch nicht sicher, wie das funktionieren würde. Ich müsste ein bisschen darüber nachdenken. Es würde sicherlich nicht den Wert eines eingehenden Links beeinflussen, den ich sehen kann. Ameise, das ist der Teil, der das OP beeinflusst.
Closetnoc
2

HAHA Ich glaube, ich verstehe diese Frage jetzt tatsächlich vollständig: /

Sie haben die Benachrichtigung erhalten, der Link zu IHRER Website ist in der GOOGLE-Suche versteckt, die DATEI befindet sich immer noch auf IHRER Website und es gibt viele ANDERE LINKS, die auf IHRE Website verweisen, und DIESE Links haben beim Anzeigen Gewicht auf IHRE Website Wenn Sie auf GOOGLE verlinken, um auf Ihre Website zu verlinken, haben die Links die ausgelassenen Hinweisinformationen am Ende der Brillensuche. : P Habe ich recht?

In Anbetracht dessen -

Meine ursprünglichen Antworten wären eine große Hilfe für die Leute gewesen, die die DMCA-Abnahmemitteilungen eingereicht haben. OH! -Trommelwirbel

Also hier ist meine Antwort: Nein und verdammt NEIN!

Diese spezifischen Links sind grundsätzlich nicht vertrauenswürdig und Sie sollten sich Sorgen machen, dass sie weiterhin auf Ihre Website verlinken. Sie können genauso gut die Disavow-Bewegung ausführen und sich selbst schützen. Wirklich.

Darüber hinaus sollten es die anderen Websitebesitzer sein, die sich mehr Sorgen machen sollten und warum die Prüfung Ihrer Backlinks sehr wichtig sein kann. Eine Historie dieser Art von Assoziation, in der der Autor diese Art von Links veröffentlicht, hat negative Auswirkungen auf sie.

Sie können in Betracht ziehen, die anderen Personen wissen zu lassen, dass sie schlechte Inhaltslinks haben, die auf SIE verweisen und sie möglicherweise verletzen.

Ehrlich gesagt, diese Art von Inhalten ist es nicht wert, für Sie oder sie zu haben, und Sie sollten sich niemals auf diese Arten von Links verlassen, um Ihrer SEO zu helfen.

Kurzfristige Entscheidungen können langfristige Auswirkungen haben.

Ich habe mich gefragt, warum Sie immer wieder Informationen herausgeben.

norcal johnny
quelle
1
Vielen Dank für Ihren Beitrag ... pLease siehe @closetnoc Antwort, ich glaube, es ist eine detailliertere und genauere Beschreibung, ich denke nicht, dass Sie dissavow in einem solchen Fall verwenden sollten. Und ich werde die Links auf keinen Fall als nicht vertrauenswürdig bezeichnen, die von PR8 + -Seiten wie TheIrishTimes, nzherald ... stammen? Denken Sie auch daran, dass die Domain, von der der Beitrag stammt, immer noch auf rel canonicalmeine Website verweist , obwohl sie aufgrund des DMCA-Hinweises nicht mehr anerkannt wird ...
Timothy Coetzee
1

Interessante Frage. Meiner Meinung nach wird kein Eigenkapital über die Backlinks übertragen, da die Seite nicht von Google gecrawlt oder indiziert wird, da sie aus der Datenbank entfernt wurde. Ich glaube, Google crawlt immer noch Webseiten, die nicht indiziert sind. Ich bin mir jedoch nicht sicher, ob dies anders ist, wenn eine Seite aus der Googles-Datenbank entfernt wurde, auch wenn sie sich noch auf der Website befindet.

Sean Lloyd-Clarke
quelle
Sie sind genau richtig. Der Link wäre ein baumelnder Link, kein defekter Link, und es kann kein Wert wirklich übergeben werden, da die Seite nicht im Index vorhanden ist. Dies schließt Links von der Seite ein, die nicht indiziert sind. Einige sagen, dass diese Seite auch dann existiert, wenn sie nicht in den SERPs angezeigt wird, sodass Links berechnet werden können. Dies könnte teilweise zutreffen. Nur weil eine Seite nicht indiziert ist, bedeutet dies nicht, dass die Seite nicht abgerufen und keine Links berechnet werden. Dies ist noch möglich. Ich gehe jedoch davon aus, dass G nicht so hart arbeitet und mit einem Kettenbruch leben kann. Bis zur Debatte.
Schranknoc
Schauen Sie, die Seite existiert definitiv und Googles weiß davon, denn wenn Sie genau danach suchen, werden Sie feststellen, dass In response to a complaint that we received under the US Digital Millennium Copyright Act, we have removed 1 result(s) from this page. If you wish, you may read the DMCA complaint that caused the removal(s) at LumenDatabase.org.Google davon weiß, so dass es nicht unmöglich ist, dass die Links Gewicht haben ...?
Timothy Coetzee
1
@ TimothyCoetzee Wenn Sie die Seite in den SERPs finden können, dann zählen ja die Links. ... wir haben 1 Ergebnis (e) von dieser Seite entfernt ... ist ein Hinweis. Dies ist ein SERP-Filter. Ja, die Seite ist vorhanden und die Links werden gezählt. Prost!!
Schranknoc
1
Warum wird die Seite nicht gecrawlt? Ich würde nicht erwarten, dass Google das Crawlen von Inhalten beendet, die aufgrund von DMCA aus der Suchmaschine entfernt wurden.
Stephen Ostermiller