Turing-Test

Aus Informatik
Wechseln zu: Navigation, Suche

Eine Möglichkeit Intelligenz zu testen besteht darin, einfach vorauszusetzen, dass der normale Mensch intelligent sei, was immer das auch genauer bedeuten mag. Man verzichtet danach für ein technisches System ebenfalls auf eine konstruktive Definition des Intelligenzbegriffes und versucht ein überprüfbares Vergleichsmerkmal zu finden, das es zu entscheiden gestattet, ob sich das technische System genauso intelligent verhält wie der Mensch. Der Test wurde zuerst von dem englischen Mathematiker A. Turing (1912-1954) vorgeschlagen und kann wie folgt charakterisiert werden.

Turingtest.png

Man stellt sich drei Räume RS, RM, RB vor, zwischen denen es keine direkte Sicht- oder Hörverbindung gibt, die aber mit allen modernen Möglichkeiten der Telekommunikation ausgestattet sind. Im Raum RS befinde sich das auf KI zu testende technische System S, im Raum RM ein als Vergleichsperson fungierender Mensch M und schließlich im Raum RB ein Beobachter B oder Schiedsrichter, der mit M und S in beliebiger Weise kommunizieren kann. B darf aber nicht bereits durch Augenschein, sprachliche Eigenheiten usw. erkennen können, in welchen Raum sich M oder S aufhalten. Das erwähnte überprüfbare Merkmal besteht nun in folgendem: Wenn B durch noch so geschickte Fragen oder Problemstellungen, die er den Systemen in Raum RM bzw. RS stellt, aufgrund der erhaltenen Antworten oder Reaktionen nicht entscheiden kann, in welchem Raum sich M bzw. S befinden, dann kann man mit gutem Recht sagen, dass das System S genauso intelligent ist wie der Mensch M.

Die Ideen Turings erhalten durch den Einsatz so genannter Chatterbots neue Aktualität. Chatterbots sind Computerprogramme, mit denen man z. B. im Internet kommunizieren kann. Im März 1999 nahmen 13000 Personen an einem solchen Test, veranstaltet von der Tageszeitung "Daily Mail" und dem Rundfunksender BBC, teil. 27 Prozent ließen sich vom Chatterbot mit dem Namen Mabel täuschen, dachten also, sie chatten mit einem Menschen!

Kritik am Turing-Test

Der Turing-Test weist durchaus Schwächen auf, da er nur einige Bereiche der Intelligenz berücksichtigt. Dieser Test hat aber die Diskussion um die KI stark beeinflusst. Hier geht es in erster Linie nicht darum, was Intelligenz in ihrem Wesen ausmacht, sondern wie sie sich äußert.

Es gibt mittlerweile eine Reihe von Argumenten, die den Turing-Test als ungeeignet zur Feststellung von Intelligenz ansehen:

  • Die "Simulation einer zwischenmenschlichen Unterhaltung" ist weniger als Intelligenz und testet also nur einen Teil dessen, was unter (menschlicher) Intelligenz verstanden wird.
  • Eine Maschine könnte intelligent sein, ohne dass sie wie ein Mensch kommunizieren kann.
  • Viele Menschen (z. B. kleine Kinder oder Menschen mit psychischen Problemen) würden den Turing-Test nicht bestehen, sind aber trotzdem intelligent.
  • Menschen, die nicht mit den Testbedingungen kooperieren, würden den Test nicht bestehen, was auch für die postulierte intelligente Maschine denkbar wäre - das Nicht-kooperieren zeugt nicht von Dummheit.
  • Falls Intelligenz und Bewusstsein einander nicht bedingen, kann der Turing-Test die Frage nach dem Bewusstsein einer Maschine nicht beantworten.
  • Die Größe einer Datenbank von möglichen Gesprächsverläufen ist durch die Laborsituation beschränkt. Ein reines Durchsuchen von Datensätzen durch den Computer würde dem Turing-Test zu Folge schon Intelligenz bedeuten.

Loebner-Preis

Turing vermutete, dass es bis zum Jahr 2000 möglich sein werde, Computer so zu programmieren, dass der durchschnittliche Anwender eine höchstens 70%ige Chance habe, Mensch und Maschine erfolgreich zu identifizieren, nachdem er fünf Minuten mit ihnen "gesprochen" hat. Dass sich diese optimistische Vorhersage nicht erfüllte, gilt heute für einige als Zeichen der Überheblichkeit seitens der Pioniere der künstlichen Intelligenz.

Bislang hat kein Computerprogramm den Turing-Test bestanden. Programme wie ELIZA oder AOLiza sind Versuchspersonen gegenüber kurzzeitig als menschlich erschienen, ohne dass sie den Turing-Test formal bestehen könnten, da sie in ihrer Antwortstrategie nur scheinbar auf ihr Gegenüber eingingen und den Versuchspersonen nicht bewusst war, dass sie es mit nichtmenschlichen Gesprächspartnern zu tun hatten.

1991 schrieb Hugh Gene Loebner den Loebner-Preis aus, der an das Computerprogramm verliehen werden soll, das als erstes den Turing-Test besteht. Der Preis ist mit 100.000 US-Dollar und einer Goldmedaille dotiert. Bisher konnte jedoch kein Computerprogramm die nötigen Voraussetzungen erfüllen. Weiterhin wird jährlich ein Loebner-Preis an das Computerprogramm verliehen, das einem menschlichen Gespräch am nächsten kommt. Dieser ist mit 2.000 US-Dollar und einer Bronzemedaille dotiert.

Website des Loebner-Preises