Das musst du wissen

  • Human Computation bezeichnet die Kombination von menschlicher Arbeitskraft und Computern, um Probleme zu lösen.
  • Bekannteste Art der Human Computation sind Captchas: Programme, welche Mensch und Maschine unterscheiden.
  • Sie halten so Bots fern – lernen aber durch die Eingaben der User auch dazu.

«Ich bin kein Roboter». Das müssen wir im Internet täglich bestätigen und meist auch noch beweisen, indem wir eine Aufgabe lösen. Zum Beispiel verzerrte Buchstaben entziffern und eingeben. Dahinter aber steckt eine geniale Idee: Eine solche Aufgabe hält nicht nur Bots, also schädliche Computerprogramme, fern, sondern wir trainieren damit auch Sprachprogramme.

_____________

📬 Das Neuste und Wichtigste aus der Wissenschaft, jeden Dienstag und Donnerstag per E-Mail:
Abonniere hier unseren Newsletter! ✉️

_____________

Zwei der bekanntesten und am weitesten verbreiteten Programme, die derart auf die menschlichen Fähigkeiten zurückgreifen, sind reCaptcha und Duolingo. Entwickelt wurden sie von Forschenden um Luis von Ahn, ehemaliger Professor an der Carnegie-Mellon-Universität in Pennsylvania. Er sagt von sich: «Ich entwerfe Systeme, die Menschen und Computer kombinieren, um grosse Probleme zu lösen, die weder Computer noch Mensch allein lösen könnten.» Damit beschreibt der Computerwissenschaftler den Grundgedanken von human computation, auch Crowdsourcing genannt. Dabei geht es nämlich darum, Aufgaben, die Programme noch nicht oder nur schlecht lösen können, durch Menschen ausführen zu lassen. Optimalerweise ohne, dass die Menschen etwas davon merken.

Wir helfen, Bücher zu entziffern

In den häufigsten Fällen wird eine Aufgabe gestellt, die für Computerprogramme in der Regel unlösbar ist, für die Menschen aber gerade einmal ein paar Sekunden brauchen. Die seit dem Jahr 2000 bestehende Urversion solcher Programme, der man auch heute noch begegnet, ist das Captcha. Der Begriff steht für: «completely automated public Turing test to tell computers and humans apart». Also: Ein automatischer Test, der Computer und Menschen auseinanderhält. Ein klassisches Captcha besteht aus einem Bild, das verzerrte Zeichenkombinationen zeigt.

2007 bauten der Computerwissenschaftler von Ahn und seine Kollegen eine zweite Funktion in die Captchas ein: reCaptcha, das von der gleichnamigen Firma auf den Markt gebracht wurde, zeigte keine willkürlichen Zeichenfolgen mehr an, sondern Wörter, die beim Scannen von Büchern nicht automatisch bestimmt werden konnten. Damals erkannten Schrifterkennungssoftwares nur rund 80 Prozent der Wörter in alten Büchern und Zeitungen richtig. Menschliche Transkripteure hatten zwar eine Genauigkeit von 99 Prozent, waren aber langsam und teuer. Die Kombination beider Methoden war die Lösung. Das Digitalisieren von Büchern wurde schneller, besser und vor allem günstiger.

Sobald ein Wort von den zwei genutzten Schrifterkennungsprogrammen nicht erkannt wurde beziehungsweise die Lösungen nicht übereinstimmten, wurde es zum Captcha. Das macht die Captchas nebenbei auch sicherer als computergenerierte Varianten, weil schon klar ist, dass sehr gute Programme sie nicht entschlüsseln konnten. Sobald das Captcha drei Mal hintereinander von menschlichen Usern gleich eingegeben wurde, wird die eingegeben Variante als Lösung angesehen. Alternativ reichen auch zwei identische menschliche Lösungen, wenn diese einer der Lösungen der Schrifterkennungsprogramme entsprechen.

Science-Check ✓

Studie: reCAPTCHA: Human-Based Character
Recognition via Web Security Measures
KommentarDies ist ein Kommentar der Autorin / des AutorsBei der Studie handelt es sich um einen Bericht. In ihm zeigen und bewerten die Autoren, die gleichzeitig die Entwickler von reCaptcha sind, wie der aktuelle Stand und bisherige Erfahrungen mit dem System aussehen. Dabei verlassen sie sich einerseits auf ein durchgeführtes Experiment, in dem die Ergebnisse von reCaptcha mit menschlichen Transkripteuren und Standard-Schrifterkennungssoftware verglichen werden. Die in diesem Experiment generierten Daten werden aber nicht transparent gemacht. Sie beziehen sich zudem auch auf die Erfahrungen und Zahlen, die das erste Jahr des Betriebs von reCaptcha ergeben haben. Dass die Autoren die Entwickler sind und zudem die experimentellen Daten nicht veröffentlicht werden, macht die Studie allerdings weniger unabhängig und zuverlässig.Mehr Infos zu dieser Studie...

Die Entwickler von reCaptcha berichteten 2008 im Fachmagazin Science, dass damals bis zu 100 Millionen ihrer Captchas pro Tag ausgefüllt wurden. Jedes einzelne Ausfüllen dauert nur Sekunden, aber addiert man all diese Sekunden, kommt man auf hunderttausende Stunden menschlicher Arbeit. In der besagten Studie konnten mit dieser Methode 99 Prozent der Wörter richtig erkannt werden. Das heisst: Von über 24 000 Wörtern waren gerade einmal 216 falsch. Die damalige Schrifterkennungssoftware machte im Vergleich dazu fast 4000 Fehler, erkannte also nur etwa 84 Prozent der Wörter richtig. Zudem macht reCaptcha die Transkripte beständiger gegenüber Tippfehlern, auch im Vergleich zu professionellen Transkripteuren. Nach dem ersten Jahr wurden über 1.2 Milliarden reCaptchas gelöst und damit 440 Millionen Wörter. Das entspricht laut der Studie etwa 17 600 Büchern, die dadurch ohne menschliche Transkripteure übersetzt werden konnten.

Aus Uni-Spin-off wird Google-Tochter

Die durch den Wissenschaftler von Ahn und seine Kollegen gegründete Firma reCaptcha war und ist zwar nicht der einzige Anbieter von Captchas, aber der grösste. Zudem waren sie die einzigen, die trotz der kostenlosen Verbreitung der Captchas in der Lage waren Gewinn zu machen. Dies schafften sie dadurch, dass sie die Digitalisierungsdienste anboten. Einer der ersten und grössten Auftraggeber in der Anfangszeit war die New York Times. Für sie wurden so Zeitungen aus 20 Jahren innerhalb weniger Monate digitalisiert.

Das Konzept war so erfolgreich und vielversprechend, dass Google das Programm 2009 kaufte. Google nutzte reCaptcha, um seine Sparte Google-Books zu unterstützen. Seitdem hat sich das reCaptcha-Konzept natürlich weiterentwickelt. Als zusätzliche Quelle für die normalen Captchas kamen Bilder von Hausnummern und Strassenschildern, die von Google-Streetview aufgenommen wurden, dazu. Neben den Abfragen, in denen Zeichenfolgen, Texte oder Hausnummern angezeigt werden, kamen zudem reine Bilderkennungsfragen hinzu. Diese sind einerseits praktischer für mobile Anwendungen und zudem sicherer, da fortgeschrittene Schrifterkennungssoftware inzwischen fast alle klassischen Zeichen-Captchas erkennen kann. Ähnlich wie beim Transkribieren helfen auch die neuen Optionen den Programmen beim Lernen. Wenn wir heute zum Beispiel Ampeln, Hydranten oder Busse in einem Bild markieren sollen, hilft das der Bilderkennungssoftware in den Autos von morgen. Wir trainieren also unbewusst die Computerprogramme unserer Zukunft.

Diesen Beitrag teilen
Unterstütze uns

regelmässige Spende