Zum Inhalt springen

Google über den Schutz des Anchor-Text-Signals vor dem Einfluss von Spam-Seiten

Google bewahrt die Qualität des Ankertext-Signals, indem es Links von Spam-Seiten ignoriert

In einer “Google SEO office-hours” beantwortete Duy Nguyen, Mitglied des Google-Suchqualitätsteams, eine Frage hinsichtlich der Verknüpfungen zu Spam-Webseiten und deren Bezug zu Vertrauen (Trust).

Es ist faszinierend, wie das Signal des Anker-Texts verteilt würde, ein Thema, das nicht oft zur Sprache kommt. Der Aufbau von Vertrauen in Google ist ein wesentlicher Faktor für zahlreiche Webmaster und SEO-Experten. Es besteht die Annahme, dass "Vertrauen" dazu beiträgt, dass eine Webseite indexiert und korrekt eingestuft wird.

Es ist jedoch allgemein bekannt, dass es keine konkrete "Vertrauens"-Metrik gibt, was gelegentlich zu Verwirrung in der “search community” führt.

Wie kann ein Algorithmus Vertrauen haben, wenn er nichts konkret misst?

Die Google-Mitarbeiter geben dazu keine direkte Antwort, aber es gibt Patente und Forschungsarbeiten, die einen Einblick geben könnten. 

Bereit, mit mir als SEO Freelancer durchzustarten?

Dann schreiben Sie mir eine Nachricht mit Ihrem Anliegen. In einem kostenlosen und unverbindlichen Erstgespräch, widmen wir uns der SEO-Thematik!

Google traut Links von Spam-Seiten nicht

Die Person, die eine Frage in der SEO-Sprechstunde einreichte, fragte:

“If a domain gets penalized does it affect the links that are outbound from it?”

Der Googler, Duy Nguyen, antwortete:

“I assume by ‘penalize’ you mean that the domain was demoted by our spam algorithms or manual actions.

In general, yes, we don’t trust links from sites we know are spam.

This helps us maintain the quality of our anchor signals.” 

Vertrauen und Links

Wenn Google-Mitarbeiter das Thema Vertrauen ansprechen, beziehen sie sich offensichtlich darauf, dass der Algorithmus "etwas als vertrauenswürdig oder nicht einstuft". In diesem Zusammenhang geht es nicht darum, Links von Spam-Websites zu ignorieren, sondern vielmehr darum, das Signal des Anker-Textes nicht zu berücksichtigen. Die SEO-Community spricht oft vom "Aufbau von Vertrauen", doch in diesem Kontext handelt es sich tatsächlich um das Vermeiden von Spam. 

Wie stellt Google fest, dass eine Website Spam ist?

Nicht jede Website wird bestraft oder erhält eine manuelle Maßnahme. Das ist die Aufgabe von Googles Spam Brain, einer KI-Plattform, die Webseiten zu verschiedenen Zeitpunkten analysiert, beginnend mit dem Crawl. 

Gatekeeper für die Indexierung

Spam Brain blockiert Websites zu Beginn des Crawls, einschließlich Inhalten, die über die Suchkonsole und Sitemaps entdeckt werden. 

Verfolgung von indiziertem Spam

Spam Brain fängt auch Spam ab, der zu dem Zeitpunkt indiziert wurde, an dem Websites für das Ranking in Betracht gezogen werden.

Die Funktionsweise der Spam Brain-Plattform besteht darin, dass sie eine KI auf der Grundlage des Wissens trainiert, das Google über Spam hat.

Google erläuterte die Funktionsweise von Spam Brain:

“By combining our deep knowledge of spam with AI, last year we were able to build our very own spam-fighting AI that is incredibly effective at catching both known and new spam trends.”

Bereit, mit mir als SEO Freelancer durchzustarten?

Dann schreiben Sie mir eine Nachricht mit Ihrem Anliegen. In einem kostenlosen und unverbindlichen Erstgespräch, widmen wir uns der SEO-Thematik!

Es ist uns nicht bekannt, auf welches "Spam-Wissen" sich Google bezieht, jedoch existieren diverse Patente und wissenschaftliche Arbeiten zu diesem Thema.

Obgleich viele dieser Patente und Studien in den letzten zehn Jahren entstanden sind, haben sowohl Suchmaschinen als auch Universitätsforscher seitdem keine weiteren Veröffentlichungen dazu gemacht.

Die Relevanz dieser Patente und Forschungsarbeiten besteht darin, dass sie potenziell in veränderter Form in den Google-Algorithmus einbezogen werden könnten, beispielsweise für Trainingszwecke und Künstliche Intelligenz wie das Spam Brain.

Das in dem Paper über das Link-Distanz-Ranking behandelte Patent erläutert, wie die Methode Rangpunkte für Seiten vergibt, basierend auf den Distanzen zwischen einer Reihe vertrauenswürdiger "Startseiten" und den Seiten, auf die diese verlinken.

Die Startseiten dienen als Anfangspunkte für die Berechnung, welche Seiten als normal und welche als abweichend (sprich Spam) eingestuft werden. Die grundlegende Idee ist, dass eine Seite als potenziell spam-beladen betrachtet werden könnte, je weiter sie von einer Startseite entfernt ist. Dieser Aspekt der Spam-Erkennung auf Basis der Link-Distanz wird in den Forschungsarbeiten diskutiert. 

“The system then assigns lengths to the links based on properties of the links and properties of the pages attached to the links.

The system next computes shortest distances from the set of seed pages to each page in the set of pages based on the lengths of the links between the pages.

Next, the system determines a ranking score for each page in the set of pages based on the computed shortest distances.”

Reduzierter Link-Graph

Das genannte Patent erwähnt auch etwas, das als reduzierter Link-Graph bezeichnet wird. Aber dieses Patent ist nicht das einzige, in dem reduzierte Link-Graphen diskutiert werden. Reduzierte Link-Graphen sind auch Gegenstand von Forschungen außerhalb von Google. Ein Link-Graph kann als eine Art Landkarte des Internets gesehen werden, die durch die Verknüpfung von Links erstellt wird.

In einem reduzierten Link-Graph werden die minderwertigen Links und die damit assoziierten Websites entfernt. Das Ergebnis ist das, was man einen reduzierten Link-Graph nennt. 

Hier ist ein Zitat aus dem oben zitierten Google-Patent:

“A Reduced Link-Graph

Note that the links participating in the k shortest paths from the seeds to the pages constitute a sub-graph that includes all the links that are “flow” ranked from the seeds.

Although this sub-graph includes much less links than the original link-graph, the k shortest paths from the seeds to each page in this sub-graph have the same lengths as the paths in the original graph.

…Furthermore, the rank flow to each page can be backtracked to the nearest k seeds through the paths in this sub-graph.”

Google traut Links von sanktionierten Websites nicht

Es liegt auf der Hand, dass Google Links von sanktionierten Webseiten misstraut. Aber manchmal ist es unklar, ob eine Webseite sanktioniert oder von Spam Brain als Spam klassifiziert wurde.

Es wäre ratsam, zu prüfen, ob eine Webseite eventuell nicht vertrauenswürdig sein könnte, bevor man sich bemüht, einen Link von ihr zu bekommen. Meiner Ansicht nach sollten Drittanbieter-Metriken nicht für solche Geschäftsentscheidungen herangezogen werden, da die Berechnungen, die zur Erstellung einer Bewertung genutzt werden, nicht transparent sind. Wenn eine Webseite bereits Links zu potenziell spam-behafteten Webseiten hat, die wiederum eingehende Links von möglicherweise bezahlten Quellen wie privaten Blog-Netzwerken (PBNs) erhalten, ist es sehr wahrscheinlich, dass es sich dabei um eine Spam-Webseite handelt. 

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Teile diesen Artikel

Du hast Interesse an einem SEO-Quick-Check oder benötigst SEO Unterstützung?

Lass doch deine E-Mail und die URL zu deiner Seite da und wir melden uns bei dir!

Schau doch auch bei unseren anderen Blogbeiträgen vorbei

Seo gefällig?

Kontakt

Du wirst nach dem Ausfüllen des Kontaktformular weitergeleitet.

Social

Meld dich bei uns

0176/814 807 29