Jul
23
2008

Duplicate Content vermeiden durch kostenloses PHP Script

No Gravatar

Heute stelle ich Ihnen ein wirklich sinnvolles und nebenbei noch sehr gutes PHP Script vor. Dieses Script nennt sich DC-Check und gibt es in der Version 1.0.

Geschrieben wurde dieses kleine Programm von Jonas, der das Duplicate Content Problem erkannt hat und sogar eine sehr schöne Lösung dafür gefunden hat. Um möglichst alle Fragen richtig zu beantworten und das Plugin genau vorzustellen habe ich Jonas interviewt.

” Jonas, wie bist Du auf die Idee gekommen ein Plugin zu programmieren, das Linkeinträge auf Duplicate Content überprüft?”

Nun als Betreiber diverser Webkataloge kommte man irgendwann unweigerlich auf das Problem von Duplicate Content (DC). User tragen sich mit gleichlautenden Einträgen in verschiedenste Webkataloge ein und sorgen dafür, das der für das Ranking wichtige Content des Eintrags an Relevanz verliert. Insgesamt verliert die Eintrags-Seite damit an Qualität und hilft weder dem Seitenbetreiber, der sich über monetisierbaren Traffic freut, noch dem Eintragenden, der sich eine Verbesserung des eigenen Rankings erhofft. Dieses Risiko des Qualitätsverlusts lässt sich durch entsprechende Analyse des User-Eintrags deutlich reduzieren. Der Antrieb zur Entwicklung des Plugins war also mehr durch eigene Probleme mit DC bedingt. 

“Wie funktioniert das Addon?”

Das Plugin funktioniert eigentlich sehr einfach: Der Eintrag des Benutzers wird in kleine Stückchen zerhackt, diese “Schnipsel” werden mittels Yahoo-Api im Internet geprüft – und falls eine bestimmte Anzahl von Satzteilen oder ganzen Sätzen verdächtig oft existieren oder fast gleichlautend woanders indiziert sind, dann schlägt das Programm Alarm. Nichts besonders kompliziertes – aber sehr hilfreich.

Ist DC-Check nur für EasyLink Webkataloge einsetzbar oder auch für alle anderen Webverzeichnisse?

Momentan ist das Plugin zwar für EL-Kataloge (EL = EasyLink) angepasst, aber mit relativ wenig Aufwand könnte dies an beliebige Katalog-Systeme angepasst werden.

Wird das Script weiterhin kostenlos bleiben?

Ja, definitv. So komplex ist DC-Check auch nicht – und da ich großer Anhänger von Open Source bin, kann das auch gerne so bleiben. Meinen neuestes Tool, einen Textgenerator biete ich z.B. als Open Source SEO-Tool an, das sich genau wie DC-Check momentan großer Beliebtheit erfreut. Das ist Open Source, auf Python oder PHP-Basis und dementsprechend kostenlos.

Gibt es noch Probleme mit dem Script, ist es noch verbesserungsfähig?

Auf jeden Fall. Ich plane momentan einen Javascript-Check, der Text-Eingaben live überprüft, etc. Ausserdem wird momentan ein Yahoo-Api-Key eingesetzt, der nur 5000 Requests pro IP pro 24h zulässt. Das sollte man langrfristig verbessern, vorallem bei großen Katalogen. Für Vorschläge Ideen und Kritik bin ich immer offen.

Was machst du wenn du nicht gerade kostenlose Scripte schreibst?

Ich arbeite im Online Marketing eines IT-Dienstleisters und bin privat mit vielen verschiedenen nicht-kommerziellen Online-Projekten beschäftigt. Gerne erzähle ich noch mehr – bei Interesse einfach fragen!

Vielen Dank für dieses Interview Jonas, im nächsten Bericht erzählst Du uns dann ein wenig mehr über Deinen Textgenerator, ja?

Natürlich, mach ich gerne. Danke für das Interview, Jonas

Weiterführende Links:
EasyLink Webkatalog Software
Webkatalog von Jonas mit automatischer Duplicate Content Prüfung durch DC-Check 1.0
Titelbild vom Dream World Blog
Wer Interesse an dem Script hat und es testen möchte, der kann das tun indem er z.B. hier einen Kommentar dazu abgibt, ich leite es dann an Jonas weiter. Ansonsten freut sich Jonas auch über eine Mail an info/at\endurity/dot\com

Duplicate Content vermeiden durch kostenloses PHP Script


Mittwoch, Juli 23rd, 2008, 19:59