Erforschen, wie menschliches Wissen Maschinen vermittelt werden kann

Veröffentlicht

Professor Cuenca Grau – Argumentation über Wissensgraphen

(Bernardo Cuenca Grau) (16. Dezember 2020)

Foto von Marvin Lagonera auf Unsplash

Meine Forschung in den letzten fünfzehn Jahren konzentrierte sich auf Wissensrepräsentation und Argumentation (KRR) – ein Bereich der künstlichen Intelligenz und Informatik, der sich mit der symbolischen, maschineninterpretierbaren Darstellung menschlichen Wissens befasst und die effektive Manipulation dieses Wissens durch Computerprogramme in Kombination mit Daten.

Zum Beispiel untersucht KRR die Darstellung in einem Format, in dem ein Computer Aussagen wie „Jeder Dramatiker ist ein Autor“ verstehen kann. und wenn eine Person i Wenn Sie in einer Stadt in einem bestimmten Land geboren sind, ist dies das Geburtsland der Person. “ Sobald solche Informationen in einer geeigneten Sprache (normalerweise einer Art formaler Logik) eindeutig dargestellt wurden, können KRR-Systeme verwendet werden, um Daten auf intelligentere Weise zu verarbeiten.

Zum Beispiel, wenn unsere Daten dies angeben Wenn Douglas Adams ein in Cambridge geborener Dramatiker ist und sich Cambridge in Großbritannien befindet, kann ein Computerprogramm automatisch ableiten, dass Douglas Adams ein in Großbritannien geborener Autor ist. Die Rolle des Denkens besteht darin, diese impliziten Informationen aus den explizit angegebenen Daten und dem dargestellten Domänenwissen algorithmisch herauszufinden.

In den letzten Jahren bestand ein enormes Interesse an der Entwicklung und Bereitstellung von so- sogenannte Wissensdiagramme – eine Möglichkeit, Fakteninformationen (Daten) und Wissen als miteinander verbundenes Netzwerk zu speichern (im Fachjargon Informatik als Diagramm bezeichnet).

In einem Wissensdiagramm werden Datenelemente als Knoten in dargestellt das Diagramm, während die Beziehungen zwischen Datenelementen die Kanten des Diagramms bilden. In unserem vorherigen Beispiel könnte ein Wissensgraph beispielsweise einen Knoten für Douglas Adams, einen Knoten für Cambridge und eine Kante haben, die mit der Beziehung Geburtsort gekennzeichnet ist, die den ersteren mit dem letzteren verbindet.

Diagramme bieten ein sehr flexibles Format für die Darstellung von Daten. Geeignet für eine Vielzahl von Anwendungen, bei denen traditionellere Ansätze für das Datenmanagement (z. B. relationale Datenbanktechnologien) nicht einfach anwendbar sind. Ein in Anwendungen weit verbreitetes Wissensdiagramm ist Wikidata , das die in Wikipedia verfügbaren Informationen in einem Diagramm mit über 80 Millionen Knoten und etwa einer Milliarde Kanten dazwischen codiert.

Große Technologieunternehmen übernehmen schnell Wissensgraphen und verwenden sie auf neue und unerwartete Weise. Google hat ein Wissensdiagramm mit über 70 Milliarden Kanten entwickelt, das für die Beantwortung von Fragen im Web verwendet wird: Versuchen Sie, eine Frage in Google einzugeben, z. B. „Wie hoch ist der Eiffelturm?“, Und Sie erhalten eine direkte Antwort, nämlich “ 300 m, 324 m bis zur Spitze , die durch Abgleichen Ihrer Frage mit dem Wissensdiagramm von Google erhalten wurde.

Unternehmen wie Google streben ein hohes Ziel an: Letztendlich wird alle menschliche Weisheit, alles, was Sie über die Welt wissen möchten (können Sie sich vorstellen?), im Wissensdiagramm verfügbar sein bereit oder bereit, innovative Anwendungen zu nutzen. Und nicht nur das, Informationen über Millionen von Produkten werden von Unternehmen wie eBay in Wissensdiagrammen gespeichert. Diagramme über alles, was Sie sich vorstellen können, werden halbautomatisch aus Websites, Datenbanken und sogar Textdokumenten generiert. Ein Unternehmen namens DiffBot verfügt über ein Wissensdiagramm mit über einer Billion (ja, mit einem t) Kanten, wobei täglich 150 Millionen neue Kanten hinzugefügt werden!

Wie man sich leicht vorstellen kann, ist es keine leichte Aufgabe, solche gigantischen Graphen zu verwalten und sie einfach und effizient abzufragen. Und hier können Wissensrepräsentations- und Argumentationstechnologien sehr nützlich sein.

Quelle: Keble College Review

Stellen Sie sich zum Beispiel vor, wir haben ungefähr 5.000 Dramatiker wie Douglas Adams in unserem Wissensdiagramm. Wenn wir möchten, dass alle Autoren sind (und das tun wir sicherlich!), Müssen wir dem Diagramm explizite Kanten hinzufügen, die den Knoten für jeden einzelnen Dramatiker mit dem Knoten verbinden, der das Konzept eines „Autors“ im Diagramm darstellt. Das sind 5.000 Kanten, die manuell hinzugefügt werden müssen.

Nicht nur das, wenn wir plötzlich einen Fehler in unseren Daten bemerken (vielleicht ist John Smith doch kein Dramatiker), müssten wir auch alle Kanten entfernen, die von diesem Fehler abhängen (das ist die Tatsache, dass John Smith ein Autor ist, was nur wahr war, weil angenommen wurde, dass er ein Dramatiker ist.

Dies ist fast unmöglich über Benutzerupdates oder sogar programmgesteuert zu verwalten. Ein viel bequemerer Weg wäre die Darstellung einer Regel, die besagt, dass „jeder Dramatiker ein Autor ist“; Dann könnte eine spezielle Software (ein Denker) diese Regel interpretieren und gegebenenfalls automatisch die relevanten Kanten zum Diagramm hinzufügen und daraus entfernen.

Automatisches Denken mit Tausenden von Regeln und Diagrammen, die Milliarden von enthalten Kanten sind sowohl aus Forschungs- als auch aus technologischer Sicht ein sehr herausforderndes Problem. Tatsächlich war es vor etwa 10 bis 15 Jahren weit über den Stand der Technik hinaus, als Forschungssysteme Schwierigkeiten hatten, mit Graphen umzugehen, die Zehntausende von Knoten enthielten.

Die Situation hat sich jedoch geändert hat sich in den letzten Jahren dramatisch verändert. Wir haben jetzt Systeme, die Ergebnisse zu komplexen Abfragen über Diagramme zurückgeben können, die Milliarden von Kanten in Millisekunden enthalten. Wir haben auch Systeme, die in der Lage sind, komplexe Regelsätze, die in leistungsstarken Regelsprachen geschrieben sind, zu verwalten und zu argumentieren und ihre Schlussfolgerungen im laufenden Betrieb beizubehalten, wenn Daten in der Grafik aktualisiert werden.

Eines dieser Systeme ist RDFox – eine leistungsstarke Wissensgraph- und Argumentations-Engine, die am Institut für Informatik der Universität Oxford entwickelt wurde und jetzt ein kommerzielles Produkt ist, das von Oxford Semantic Technologies (https://www.oxfordsemantic.tech) entwickelt und vertrieben wird.

Als Mitbegründer von Oxford Semantic Technologies Ich bin sehr stolz auf das, was in letzter Zeit erreicht wurde – um zu sehen, wie ein sorgfältig durchdachtes System Anfragen fast augenblicklich begründen und beantworten kann, wenn es auf ausgefeilte Regelsätze und großformatige Diagramme mit mehreren zehn Milliarden Verbindungen angewendet wird. Als Wissenschaftler ist es ein unglaublich erfreuliches Gefühl zu erleben, wie fundamentale, hochmoderne Forschung, die in unserer Gruppe für Wissensrepräsentation und Argumentation in Oxford durchgeführt wird, jetzt von Anwendungen verwendet wird, von denen wir noch vor wenigen Jahren träumen konnten. P. >

Über den Autor

Professor Bernardo Cuenca Grau arbeitet an der Universität Oxford im Fachbereich Informatik. Eine vollständige Biografie finden Sie im Artikel (Meet the Founders).

Über den Artikel

Dieser Artikel wurde ursprünglich im Keble College Review veröffentlicht. Das College und der Autor der Oxford Semantic Technologies Medium Publication erteilten die Erlaubnis, den Artikel erneut zu veröffentlichen.

Team und Ressourcen

Das Team hinter Oxford Semantic Technologies begann 2011 mit der Arbeit an RDFox am Informatik-Institut der Universität Oxford mit der Überzeugung, dass flexibles und leistungsstarkes Denken eine Möglichkeit für datenintensive Anwendungen ist, ohne die Richtigkeit der Ergebnisse zu gefährden. RDFox ist das erste marktreife Wissensdiagramm, das von Grund auf unter Berücksichtigung von Überlegungen entwickelt wurde. Oxford Semantic Technologies ist ein Spin-out der University of Oxford und wird von führenden Investoren wie der Samsung Venture Investment Corporation (SVIC), der Oxford Sciences Innovation (OSI) und dem Investment Arm (OUI) der Oxford University unterstützt. Der Autor ist stolz darauf, Mitglied dieses Teams zu sein.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.