Kommentarfunktion digitalisiert Bücher
Mit Weltliteratur gegen Spam
Internet & Netzwelt
US-Forscher haben sich einen ganz besonderen Trick gegen Spammer ausgedacht: Nutzer tippen zur Verifizierung Buchstaben ab - und helfen damit beim Digitalisieren alter Bücher.
Die Grundidee ist altbekannt: Wer sich heute bei Web-Angeboten registrieren oder in einem Blog einen Kommentar hinterlassen will, muss oftmals ein paar verschwommene Buchstaben von einer kleinen Grafik abtippen. Ziel der Übung ist, automatisierte Skripte auszutricksen, die Weblogs und andere Netz-Angebote zum Verbreiten von Spam nutzen.
Im Netz sind derartige Tests auch als Captchas bekannt - eine Abkürzung, die für "Completely Automated Public Turing test to tell Computers and Humans Apart" steht. Alan Turing war ein berühmter US-Wissenschaftler, der mit der Idee des Turing-Tests einen der Grundsteine für die Künstliche-Intelligenz-Forschung legte.
Jetzt bemühen sich einige Wissenschaftler der Carnegie Mellon University darum, die menschliche Intelligenz beim Ausfüllen der Spam-Fallen ein bisschen effektiver zu nutzen. Sie gehen davon aus, dass täglich weltweit mehr als 60 Millionen Captcha-Tests ausgefüllt werden. Wenn jeder dieser Tests auch nur zehn Sekunden dauert, dann entspricht das mehr als 150.000 Stunden kollektiver Arbeit pro Tag.
Ein paar Sekunden fürs Internet Archive
Diese Zeit wollen die beteiligten Forscher nun für einen guten Zweck einsetzen. Ihr Recaptcha genanntes System blendet bei jedem Test zwei Wörter ein. Eines davon ist dem System bekannt und dient wie gehabt als Spam-Falle. Das andere entstammt einem Buch, das derzeit für das Internet Archive digitalisiert wird.
Das Internet Archive bemüht sich seit Jahren darum, Bücher mit abgelaufenen Urheberrechten kostenlos ins Netz zu stellen. Das Problem: Computer können beim Scannen eines alten Buchs mit vergilbten Seiten und verwaschenen Fonts oft nicht jedes Wort erkennen. Einzelne Wörter müssen per Hand korrigiert werden. Recaptcha soll nun dabei helfen, diesen Prozess mit Hilfe des Netzes zu automatisieren. Jedes unbekannte Wort wird dabei in einer Reihe von Tests eingesetzt, um Flüchtigkeitsfehler zu minimieren.
Auch für E-Mails geeignet
Webmaster können sich kostenlos auf Recaptcha.net anmelden, um das System in ihre eigene Webseite einzubinden. Doch auch Nutzer ohne eigenes Blog oder eigene Webseite können von Recaptcha Gebrauch machen: Das System bietet die Möglichkeit, die eigene E-Mail-Adresse mit einem Buchstaben-Rätsel vor Spam zu schützen.
Dazu gibt man diese einfach einmal auf Recaptcha.net in ein Formularfeld ein. Die Webseite bedankt sich dafür mit einer Web-Adresse, die man nun in Blogs und Foren an Stelle der eigenen Mail-Adresse angeben kann. Klickt jemand auf den Link, dann bekommt er nach dem Lösen des obligatorischen Rätsels die gewünschte Mail-Adresse angezeigt.
Weitere Artikel zum Thema
-
Studie: Eine von 12,5 Millionen Spam-Mails ist erfolgreich
Trotz geringem Prozentsatz rechnet sich der Versand über Botnetze
-
Ruhe im Postfach: Größter Spammer-Ring gesprengt
Botnetz von HerbalKing schaffte zehn Milliarden Mails pro Tag
-
auto motor und sport: Test-Archiv kostenlos
Mehr als 2.500 Testberichte mit über 4.000 Automodellen online
Mehr über: Internet, Spam
Jetzt sind Sie dran.
Kommentieren
Mit Weltliteratur gegen Spam
Was sagen Sie dazu?
nach oben




