Spam gibt es leider überall. Egal, ob es sich dabei um aufdringliche Werbung per Post handelt oder online per E-Mail. Es gibt jedoch einen zentralen Unterschied: Das Verschicken riesiger Mengen an Briefen per Post kostet bekanntlich ein Vielfaches mehr als das Versenden per E-Mail. Und das Gleiche trifft auf Formulare zu. Ein bösartiger Spam-Bot kann mit einem winzigen Budget problemlos einen ganzen Monat lang hunderttausende oder sogar Millionen Formulare ausfüllen und abschicken. Ein Captcha ist dabei eine einfache und weit verbreitete Möglichkeit, automatische Bots-Anfragen zu unterbinden.
Weiterer Kontext (Audio 🎧)
Definition und Zweck
Captcha ist ein großes Akronym und steht für “Completely automated public turing test to tell computers and humans apart”, also zu Deutsch ein „vollautomatischer öffentlicher (Turing-)Test zur Unterscheidung von Computern und Menschen“.
Die bekannteste Form dabei sind die reCAPTCHAs von Google.
Begonnen hat die ursprüngliche Version mit verzerrtem Text aus Büchern. Früher war es enorm schwer, solche verzerrten Texte mit Computern auszulesen. Die unfassbaren Mengen an Zeit, die Menschen auf der ganzen Welt damit verbracht haben, gegenüber Webseiten zu bestätigen, dass sie ein Mensch und kein Roboter sind, wurden zudem genutzt, um bei der Digitalisierung von Büchern und der Verbesserung der automatischen Texterkennung zu helfen.
Seit einigen Jahren ist es für Computer jedoch trivial einfach geworden, solche Texträtsel zu lösen, und zwar um ein Vielfaches schneller, als es jeder Mensch könnte.
Inzwischen müssen Bilder kategorisiert werden. Mal geht es um Zebrastreifen, die markiert werden müssen, ein anderes Mal um alle Bilder mit Booten.
Diese reCAPTCHAs von Google sind für die meisten Einsatzzwecke kostenfrei und schützen sehr effizient. Durch die starke Verflechtung mit dem Google-Ökosystem müssen verifizierte Google-Nutzer häufig keine Bilderrätsel ausfüllen. reCAPTCHAs überprüfen viele unterschiedliche Faktoren im Hintergrund. Oberflächlich sieht es also so aus, als wären es nur einige Bilderrätsel, aber das ist nur die Spitze des Eisbergs.
Die größte Alternative zu Googles Captchas, aber im Vergleich dennoch winzig, kommt von hCaptcha. Hier müssen ebenfalls Bilder kategorisiert werden. Das Besondere bei hCaptcha ist jedoch, dass externe Datenunternehmen das Kategorisieren von Bildern in Auftrag geben können. Sie als Webseitenbetreiber verdienen durch das Lösen der Captchas Ihrer Nutzer sogar Geld. Alternativ können Sie die Einnahmen auch an eine Organisation spenden.
Wenn nur ein schwacher Schutz benötigt wird und man auf externe Anbieter verzichten will, kann man zudem eigene Captchas programmieren.
Referenz zu Crawlern
Neben dem Schutz von Formularen kann man Captchas auch einsetzen, um böswillige Bots am Crawlen einer Webseite zu hindern. Gutartige Crawler wie Google oder Bing folgen Standards, mit denen man das Crawlen der gesamten Seite oder einzelner Unterseiten unterbinden kann, sollte dies erwünscht sein. Bösartige Crawler halten sich jedoch häufig nicht daran. Daher lassen sich unter Umständen auch hier Captchas einsetzen.