Spam gibt es leider überall. Egal ob es sich dabei um aufdringliche Werbung per Post handelt, oder online per E-Mail. Es gibt jedoch einen zentralen Unterschied: Das Verschicken riesiger Mengen an Briefen per Post kostet bekanntlich ein Vielfaches als das Verschicken per E-Mail. Und das Gleiche trifft auf Formulare zu. Ein bösartiger Spam-Bot kann mit einem winzigen Budget problemlos einen ganzen Monat hunderttausende oder Millionen Formulare ausfüllen und abschicken. Ein Captcha ist dabei eine einfache und weit verbreitete Möglichkeit automatische Botsanfragen zu unterbinden.
Weiterer Kontext (Audio 🎧)
Definition und Zweck
Captcha ist ein riesiges Akronym und steht für “Completely automated public turing test to tell computers and humans apart”, also zu Deutsch ein “vollautomatischer öffentlicher (Turing) Test zur Unterscheidung von Computern und Menschen”.
Die bekannteste Form dabei sind die reCAPTCHAs von Google.
Begonnen hat die ursprüngliche Version mit verzerrtem Text aus Büchern. Früher war es enorm schwer, mit Computern solche verzerrten Texte auszulesen. Die unfassbaren Mengen an Zeit, die Menschen auf der ganzen Welt verbracht haben, um gegenüber Webseiten zu bestätigen, dass sie ein Mensch und kein Roboter sind, wurden zudem verwendet, um bei der Digitalisierung von Büchern und Verbesserung von automatischen Texterkennung zu helfen.
Seit einigen Jahren ist es für Computer jedoch trivial einfach geworden, solche Text-Rätsel zu lösen. Ein vielfaches schneller als jeder Mensch könnte.
Inzwischen müssen Bilder kategorisiert werden. Mal geht es um Zebrastreifen, die umrandet werden müssen, ein anderes Mal um alle Bilder mit Booten.
Diese reCAPTCHAs von Google sind für die meisten Einsatzzwecke kostenfrei und schützen sehr effizient. Durch die starke Verflochtenheit mit dem Google-Ökosystem müssen geprüfte Google-Nutzer häufig keine Bilderrätsel ausfüllen. reCAPTCHAs überprüfen viele unterschiedliche Faktoren im Hintergrund. Oberflächlich sieht es also danach aus, als wären es nur irgendwelche Bilderrätsel, aber das ist nur die Spitze des Eisbergs.
Die größte Alternative zu Googles Captchas, aber im Vergleich trotzdem winzig, kommt von hCaptcha. Hier müssen Bilder ebenfalls kategorisiert werden. Das Besondere bei hCaptcha ist jedoch, dass externe Datenunternehmen bei hCaptcha das Kategorisieren von Bildern in Auftrag geben können. Sie als Webseitenbetreiber verdienen durch das Lösen von Captchas ihrer Nutzer Geld. Alternativ können Sie das Geld auch an eine Organisation spenden.
Wenn es nur einen schwachen Schutz bieten soll und man auf externe Anbieter verzichten will, kann man zudem auch eigene Captchas programmieren.
Referenz zu Crawlern
Neben dem Schutz von Formularen kann man Captchas auch einsetzen, um böswillige Bots am Crawling einer Webseite zu unterbinden. Gutartige Crawler wie Google oder Bing folgen Standards, mit denen man das Crawling der Ganzen, oder nur einzelnen Unterseiten unterbinden kann, sollte das erwünscht sein. Bösartige Crawler halten sich aber häufig nicht daran. Daher lassen sich unter Umständen auch hier Captchas einsetzen.