Universität des Saarlandes
Fachschaft Computerlinguistik
Proceedings 5. TaCoS

Abduktive Inferenz

Implementierung und Anwendung
für die Interpretation natürlicher Sprache

Gekürzte Online-Version

Martin Jansche · Kurfürstenanlage 61 · 69115 Heidelberg
e-Mail: martin.jansche@urz.uni-heidelberg.de

Allgemeine Information

Skizziert werden sollen die Grundlagen einer Erweiterung von PROLOG um abduktive Inferenz, wie sie in [Stickel 1990] und [Hobbs et al. 1993] vorgestellt wurde. Gedanken, auf die in jenen Aufsätzen nicht eingegange wurde, enthält nur der letzte Abschnitt, alles davor beschränkt sich darauf, vor allem das in [Stickel 1990] Dargelegte teils wörtlich zu referieren.

Soll in

Johann besitzt einen Pinscher. Der Hund ist stubenrein.
der Ausdruck der Hund interpretiert werden, kann man sein Weltwissen über Hunde heranziehen, welches Informationen darüber enthalten wird, daß z. B. Dackel, Pudel, Pinscher usw. Hunde sind. Somit ist es möglich, daß der Hund auf einen Dackel, Pudel oder Pinscher usw. referiert.

Nun muß man Dackel, Pudel, Pinscher auf ähnliche Weise herleiten wie der Hund. Daß es sich um einen Dackel, bzw. Pudel handelt, müßte gutgläubig angenommen werden. Jedoch kann Pinscher ganz leicht auf das zuvor genannte einen Pinscher bezogen werden. Daß solch ein Bezug hergestellt werden kann, macht die Hypothese, bei der Hund handle es sich um den erwähnten Pinscher, um einiges wahrscheinlicher als die Annahme, man habe es mit einem noch unbekannten Dackel oder Pudel zu tun.

Abduktives Inferieren

Abduktion bietet keine Erweiterung der Prädikatenlogik. Eine abduktive Erweiterung von PROLOG unterliegt der in dieser Sprache gemachten Beschränkung auf die Hornklausellogik, lediglich die darüber zugelassenen Inferenzen werden erweitert: Abduktion ist Inferenz, bei der (unsicher) auf Fakten geschlossen wird, und ähnelt der Induktion, die auf Regeln schließt.

Es ist strittig, welche Inferenzen unter »Abduktion« subsumiert werden sollen. Bei dem hier vorgestellten Inferenzschema handelt es sich um gewichtete Abduktion mit Rückwärtsverkettung. Verschiedene andere Abduktionsarten sind Sonderfälle hiervon, wieder andere können mit dem vorgestellten Verfahren nicht behandelt werden.

Im einfachsten Fall (least specific abduction, [Stickel 1990, 238 f.]) stellt Abduktion lediglich die Annahme als Inferenz bereit: ein zu beweisendes Literal der Ausgangsformel darf angenommen werden und gilt damit als bewiesen.

Chained specific abduction erlaubt es, nicht nur Literale in der Ausgangsformel anzunehmen, sondern auch solche, die erst durch Rückwärtsverkettung von Literalen der Ausgangsformel entstehen. Dies ist für die Interpretation natürlicher Sprache besonders geeignet, da Koreferenzbeziehungen hergestellt werden können, Metonymien aufgelöst usw. (Anwendungen finden sich in [Hobbs et al. 1993, 104 ff.]).

Oben wurde gezeigt, wie der Hund auf einen Pinscher bezogen werden kann. Da es sich um unsicheres Schließen handelt, führt man Kosten als Kriterium für die Güte eines Beweises ein. Die Kosten ändern sich entsprechend dem Kontext, ein Literal, das vermutlich bekannt ist, erhält hohe Annahmekosten, da es aufgrund der Wissensbasis erklärt werden sollte.

Es liegt nahe, daß der mit einen Pinscher korrespondierende semantische Ausdruck niedrige Annahmekosten bekommt, da er wahrscheinlich nicht bewiesen werden kann, außer es gäbe gute Gründe zu vermuten, daß der besagte Pinscher bereits bekannt ist. Andererseits erhält hund(X) -- ich gehe davon aus, daß dies die korrekte Übersetzung ist -- hohe Annahmekosten, da hier möglichst keine Annahme gemacht, sondern ein geeigneter Antezedent gefunden werden soll. Dies geschieht z. B., indem hund(X) mittels hund(H) :- pinscher(H) rückwärtsverkettet und das dabei entstehende pinscher(X) mit dem Pinscher-Literal links davon, bzw. aus der Wissensbasis unifiziert wird. Dem entspricht nur eine der möglichen Lesarten des Satzes; den Kosten des Beweises entnimmt man, wie sehr sie bevorzugt wird.

Was der billigste Beweis ist, hängt davon ab, wie die Axiomkosten und Gewichtungen in der Wissensbasis einerseits, und die Annahmekosten andererseit gewählt wurden. Die abduktive Ableitung des biligsten Beweises liefert keine Erkenntnisse, die über das implizite Wissen, das in der Verteilung der Kosten und Gewichtungen liegt, hinausgehen. Wie diese Gewichtungen und Kosten bestimmt werden, ist nicht geklärt.

Abschließende Ideen

In PROLOG kann man ein Modell, relativ zu dem interpretiert wird, durch eine Menge von Fakten angeben, ein zu interpretierender Satz wird als Anfrage (query) umgesetzt und kann entweder hergeleitet werden oder nicht.

PROLOG gibt außer der Antwort, ob ein Beweis für eine Anfrage gefunden werden konnte, die Belegungen der Variablen zurück, die die Anfrage beweisbar machen. Daß Variablenbelegungen weitergereicht werden müssen, um eine adäquate Semantik von natürlicher Sprache geben zu könnnen, ist in diversen semantischen Theorien jüngster Zeit berücksichtigt worden.

Um abduktive Inferenz erweitertes PROLOG liefert zu jeder Anfrage zusätzlich diejenigen Literale, die der Wissensbasis hinzugefügt werden müßten, um die Anfrage in gewöhnlichem PROLOG beweisbar zu machen. Diese entsprechen der neuen Information des interpretierten Satzes. Daß aber Modelle erst im Diskurs dynamisch erzeugt werden, bedeutet eine Absage an die klassische modelltheoretische Semantik und wurde in dieser Form kaum diskutiert.

Die für die Interpretation natürlicher Sprache relevante Überlegung ist die, daß in einem Diskurs nicht nur Diskursreferenten (ähnlich Objekten vom Typ e in Montague Grammar) etabliert werden, sondern daß ein Satz in einem informativen Diskurs eine Anweisung an die Diskurspartnerin ist, die ausgedrückten Propositionen (ähnlich Objekten vom Typ t in MG) für wahr zu halten und ihr Modell so zu verändern, daß sie, wertete sie sie darin aus, wahr würden.

Eben das ist das Wesen von Information, daß eine Auswertung in einem gegebenen Modell nicht sinnvoll ist, da jeder Proposition nur der Wahrheitswert falsch zugeordnet würde, weil neue Information ja derart ist, daß sie gerade nicht beweisbar ist in einem Modell, bezüglich dem sie neu ist.

Abgesehen von Kritik an rein technischen Details besteht ein wesentlicher Kritikpunkt des vorgestellten Abduktionsschemas darin: es ist monoton, das heißt, man erfährt nur, welche Fakten der Wissensbasis hinzugefügt werden müssen, aber nicht, ob und welche Fakten, die dem Inhalt einer interpretierten Mitteilung widersprechen, aus der Wissensbasis gelöscht werden müßten. Daher gehen die meisten Beispiele davon aus, daß eine Wissensbasis mit einer sehr großen Zahl an Regeln und einer geringen Menge von Fakten vorliegt.

Ein weiterer substantieller Kritikpunkt: eine Interpretation generischer Sätze der Art Der Delphin ist ein Säugetier besagt, daß -- je nach Wissensbasis -- zwei neue Fakten aufgenommen werden sollten. Hier versagt diese Form der Abduktion, die adäquat war für Sätze, die auf einen Abgleich des Faktenwissens der Kommunikanten abzielen. Ein generischer Satz aber hat eine Veränderung im Regelwissen des Kommunikationspartners zum Ziel. Doch um dieses Problem zu lösen, bedarf es einer wesentlich weiter gefaßten Theorie von Wahrheit und semantischer Repräsentation.

Literatur

[Hobbs et al. 1993]
Hobbs, J. R./Stickel, M. E./Appelt, D. E./Martin, P.: Interpretation as abduction. In: Artificial Intelligence 63, 1993. S. 69--142.

[Stickel 1990]
Stickel, M. E.: Rationale and methods for abductive reasoning in natural language interpretation. In: Studer, R. [Hrsg.]: Natural Language and Logic. International Scientific Symposium. Hamburg, FRG, May 9-11, 1989, proceedings. Berlin: Springer, 1990. S. 233--252.

Die vollständige Fassung gibt es als Postscript-Datei.
Zurück zur Übersicht der Beiträge