Was ist der Unterschied zwischen der Verwendung von RDFS / OWL und XML?

10

Ich habe mich gefragt, welche Vorteile die Ontologiesprachen von RDFS / OWL gegenüber der Verwendung eines Tagging- / Markup-Systems (wie http://www.schema.org/ ) zum Verwalten und Erstellen von Metadaten haben.

Webster Thesaurus
quelle
3
Die Inferenzmaschine, das ist was. Über die überraschenderweise keine der folgenden Antworten spricht. Motoren wie Jena können neue Daten ableiten und transitive Eigenschaften nutzen.
Andrew T Finnell
2
@ AndrewFinnell poste eine detailliertere Erklärung als Antwort bitte
Andrew, ich stimme zu und würde deine Antwort abstimmen. Die derzeit vorhandenen Antworten sind nicht informiert und von geringer Qualität.
Dibbeke
@ AndrewFinnell, ich möchte auch, dass Sie Ihre eigene Antwort posten. Ich frage mich auch, ob Schlussfolgerungen den Rahmen des OP sprengen oder nicht. (Ich dachte ursprünglich, aber dann ist es vielleicht nicht)
ZJR

Antworten:

5

Ihre Frage macht so wenig Sinn wie sie ist. RDFS ist eine sehr einfache Schemasprache, um RDF-Einschränkungen auszudrücken. OWL ist ein fortgeschritteneres Schema, um eine komplizierte Ontologie auszudrücken. Sie haben absolut nichts mit XML gemeinsam, außer dass sie in XML ausgedrückt werden können.

Stefano Borini
quelle
4

Konnte nicht mehr mit ZJRs Antwort übereinstimmen. Es ist völlig uninformiert.

  1. Wie analysiert man Mikrodaten? Was analysiert es auch? RDFa analysiert RDF, ein gängiges Datenmodell, nach dem das Semantic Web gesucht hat. Mikrodaten entstanden im Grunde genommen, weil Hickie nicht die Mühe hatte, die RDF- und RDFa-Spezifikationen zu lesen. Es mag für einen Entwickler einfacher sein, aber es ist nicht besser für das Web (dh faul )
  2. Eine Liste der gängigen OWL-Vokabulare finden Sie unten:

  3. Die nächste Version von RDF steht kurz bevor, einschließlich neuer Serialisierungsformate wie Turtle und RDFj

  4. SPARQL 1.1 steht ebenfalls unmittelbar bevor. Abfrageverbund, Eigenschaftspfadausdruck, SPARQL-Update und vieles mehr.

  5. Die BBC basiert auf RDF. Die Facebook-Diagramm-API bietet RDF (das ist richtig, Sie können einen Diagramm-URI mithilfe des Text / Turtle Accepts-Headers zurückstellen und RDF zurückerhalten) und viele andere große Unternehmen.

Zusammenfassend sind Semantic Web, RDF, RDFS, OWL, SPARQL und alle Semantic Web-Standards sehr lebendig und aufregend. Wenn Sie mir nicht glauben, schauen Sie sich alle Aktivitäten auf http://www.semanticoverflow.com an

William Greenly
quelle
Die BBC baut auf RDF auf, obwohl sie Mikrodaten zugeordnet ist. Sie bauten die Site im Jahrzehnt 2000-2010 zu einer Zeit wieder auf, als W3C wunderbare magische Werkzeuge für RDF versprach. Diese Werkzeuge kamen nicht wirklich zustande, RDF ist ein Vermächtnis. Solide Organisationsstruktur, aber schrecklich zu teilen, Mikrodaten decken die letzte Meile ab. (und rette den Tag)
ZJR
und noch einiges mehr: Ein nützliches SPARQL steht seit Ewigkeiten bevor. Der Wortlaut der RDF-Spezifikation hat viel Zeit gekostet und die meisten potenziellen Implementierer jahrelang verängstigt. (Keine Ahnung, ob sie das behoben haben, haben sie das behoben ? imho, jedenfalls zu spät ) und dann RDF<some-letter>erzeugt die Nomenklatur die ganze Zeit Verwirrung und Streit.
ZJR
1
Die BBC basiert auf RDF unter Verwendung von BigOWLIM, nicht von Mikrodaten. Mircodata ist kein kanonisches Datenformat. Es ist eine Ergänzung zu HTML. Die neue olympische Plattform basiert vollständig auf RDF, wie in Pressemitteilungen und Präsentationen ihrer Akademie erwähnt.
William Greenly
4

RDF / OWL vs XML ist eine falsche Alternative. Tatsächlich verwendet XML eine der beliebtesten Serialisierungen.

Auch RDF / OWL vs Mikroformate ist eine falsche Alternative. Tatsächlich gibt es Standards, die die Verwendung von RDF als Mikroformat, die offizielle RDFa von eRDF und W3C mit standardisierter Einbettung in HTML5 ermöglichen .

Die Frage ist also wirklich, welchen Vorteil die Verwendung von Standardformaten mit W3C-Zulassung hat. Gründe sind:

  • Es gibt bereits mehrere Ontologien, darunter die am häufigsten verwendeten wie Dublin Core und FOAF .
  • mehrere Triple-Shops kompatibel mit RDF / OWL für die meisten jeder Programmiersprache.
  • Verschiedene der oben genannten Triple-Stores verfügen über Inferenz-Engines mit SPARQL- Schnittstelle.

Insgesamt sehe ich keinen Grund, warum Sie sich für ein nicht standardmäßiges Mikroformat ohne W3C entscheiden sollten.

vartec
quelle
1

RDF und OWL sind etablierte Standards für die Codierung semantischer Daten und ihres Schemas auf einer viel tieferen und allgemeineren Ebene als ein Ad-hoc-Markup.

Mit OWL können Sie beispielsweise ein neues Schema definieren, das von anderen Tools zumindest teilweise verstanden wird (da Sie verschiedene OWL / RDF-Schemata miteinander mischen können). Auf diese Weise können Sie aus einem Datensatz verschiedene "Ansichten" davon exportieren und alle zusammenarbeiten lassen. Sie können auch nur Verknüpfungen zwischen Objekten und ihren Eigenschaften "untersuchen" .

Bei Mikrodaten handelt es sich im Grunde genommen um eine ad-hoc akzeptierte Reihe von Dingen, die Sie anwenden können, und nicht um eine allgemeine semantische Plattform.

p_l
quelle
Ich bin immer noch verwirrt darüber, wie sich RDF von RDFS von OWL unterscheidet. Können diese Begriffe austauschbar verwendet werden?
Webster Thesaurus
@WebsterThesaurus RDF ist eine ziemlich einfache Sprache, um Konzepte zu beschreiben, die auf Tripeln von Subjekt-Verb-Objekt basieren. RDFS ist ein RDF-Schema, im Grunde ein vordefinierter Satz von Begriffen, um die Definition der Beziehungen zu vereinfachen. OWL ist ein Ontologie-Beschreibungssystem, viel leistungsfähiger als RDFS, aber schwieriger zu implementieren
p_l
1

Zunächst möchte ich darauf hinweisen, dass diese Antwort nicht von einem Experten auf diesem Gebiet verfasst wurde. Obwohl ich ein Befürworter semantischer verteilter Systeme bin, denke ich, dass die Anwendungen von OWL derzeit begrenzt sind. Obwohl eine genaue Beschreibung der Nische, in der OWL angewendet werden kann, den Rahmen dieser Antwort sprengen würde, könnte ich möglicherweise einige Vor- und Nachteile ans Licht bringen.

OWL ist im Grunde eine Sprache, die den Ausdruck semantischer Konstrukte mithilfe der Klassifizierung ermöglicht, ähnlich wie die Klassen, die Sie aus OOP kennen, und Einschränkungen zwischen Klassen und ihren Instanzen. Man könnte es als eine formellere und übergeordnete Methode ansehen, um Beziehungen zu beschreiben, die Sie aus einer relationalen Datenbank kennen.

Um diese Sprache zu beschreiben und zu kommunizieren, muss sie in ein bestimmtes Format serialisiert werden. Es gibt mehrere Formate, von denen RDF nur eines ist.

Es gibt drei verschiedene Ebenen von OWL, die eine Steigerung der Ausdruckskraft ermöglichen, aber die Berechenbarkeit einschränken (z. B. ob Sie eine mögliche Lösung für die Fragen finden können, die Sie der in einer OWL-Definition beschriebenen Wissensdatenbank stellen). Dies sind OWL Lite, DL und Full.

Der wichtigste Vorteil der Verwendung von OWL / RDF ist der Wissensaustausch zwischen verschiedenen Wissensdatenbanken (oder Klassifizierungshierarchien) und die Erstellung nützlicher Schlussfolgerungen, ohne dass alle diese Grundlagen im Voraus erstellt werden müssen, damit sie kommunizieren können. Dies erfolgt teilweise durch Definieren von Äquivalenzklassen. Durch die Verwendung von Namespaces kann der Ingenieur die Eindeutigkeit feststellen. ein nützliches Paradigma.

Ein weiterer Vorteil ist die ständig wachsende Anzahl von Inferenz-Engines und Abfragesprachen. In unserer vernetzten Welt besteht Bedarf an verteiltem Wissensaustausch.

Möglicherweise ist ein wichtiger Nachteil die relativ hohe Komplexität der Ermittlung der Berechenbarkeit von Schlussfolgerungen und ihrer räumlichen und zeitlichen Einschränkungen. Z.B. In OWL full können Sie möglicherweise nach Schlussfolgerungen fragen, deren Beendigung nicht nachgewiesen werden kann. Somit gibt es sicherlich eine Grenze für die Leistung von OWL.

OWL-Wissen ist diskret ... es gibt keine Halbwahrheiten oder Glaubenssysteme. Diese zu haben würde die Lösungen höchstwahrscheinlich viel zu komplex machen.

Der wichtigste Nachteil für meinen Geschmack ist jedoch, dass man einfach nicht viele gute Ingenieure auf dem Gebiet finden kann. Sie benötigen einen Wissensingenieur, ein oder zwei Informatiker und ein kleines Entwicklungsteam, um selbst eine kleine Wissensbasis aufzubauen. Daher ist es oft viel billiger und effektiver, nur beschreibende Sprachen wie das XML-Schema zu verwenden und die erforderliche Semantik in einem für Menschen lesbaren Dokument zu beschreiben.

Dibbeke
quelle
0

Bei RDFS geht es darum, strukturierte Daten zu beschreiben. Es wäre viel nützlicher, wenn es Methoden oder Funktionen enthalten würde, damit wir Schnittstellen damit beschreiben könnten. Derzeit benötigen Sie dazu ein zusätzliches Vokabular, z. B. WSDL oder Hydra von Webservices. Ich denke, es gibt auch ein Vokabular für OOP, ich kenne nur nicht viele Vokabeln.

OWL ist so etwas wie XSD. Es geht darum, Ihre Daten zu validieren. Wenn Sie beispielsweise eine Zeichenfolge mit höchstens 20 Zeichen erwarten, verwenden Sie OWL, um diese Regel zu beschreiben und einen Validator zu generieren. Theoretisch könnte man das auch mit RDFS und XSD machen. Ich habe keine Ahnung, warum die Leute OWL erfinden mussten, anstatt nur XSD zu verwenden. Möglicherweise liegt es daran, dass XSD nicht auf RDFS basiert, sodass beispielsweise die XSD-Zeichenfolge kein Nachkomme von RDFS Literal ist.

Schema.org beschreibt gängige Klassen wie beispielsweise Person. Sie erstellen ein eigenes RDFS-ähnliches Vokabular, das Thing anstelle von rdfs: Class, domainIncludes anstelle von rdfs: domain, rangeIncludes anstelle von rdfs: range usw. anstelle von RDFS enthält. Ihre eingeschränkten Typen sind ebenfalls ad-hoc. Sie verwenden Text und Nummer, ohne sie zu definieren oder zumindest mit rdfs: Literal- oder XSD-Grundelementen zu verbinden. Soweit ich das beurteilen kann, verwenden sie weder XSD noch OWL, um eingeschränkte Typen zu definieren. Ich bin mir nicht sicher, ob es irgendwelche Einschränkungen in ihrem Wortschatz gibt, aber wenn ja, werden sie wahrscheinlich in den von Menschen lesbaren Beschreibungen erwähnt, sodass Sie keinen geeigneten Validator für schema.org generieren können, was Sie tun könnten, wenn sie es tun würde XSD / OWL und RDFS verwenden.

Daher denke ich, dass der Vorteil der Verwendung von Standards wie RDFS, XSD, OWL darin besteht, dass Sie Bibliotheken schreiben können, die Sie für jedes Dokument wiederverwenden können.

inf3rno
quelle
-2

Für die Entwicklung zukünftiger Produkte gelten RDFS / OWL-XML-Dateien als ziemlich tot und verschwunden.

Sie erfordern zu viel Arbeit , um Konzepte auszudrücken, die eine benutzerdefinierte Lösung, die auf benutzerdefinierten Textformaten basiert, besser ausdrücken würde , während die Daten für Mensch und Maschine gleichermaßen lesbarer und bearbeitbarer bleiben. Sie schaffen keinen wirklichen Wert und machen das Leben für alle, die über sie stolpern, nur ein wenig elender. (und muss sich mit ihrer Namespace-Nomenklatur befassen)

Es gibt jedoch gigantische Lösungen für die Dokumentenverarbeitung, die auf ihnen basieren. Sie wurden kürzlich entwickelt, bereitgestellt und sind derzeit in Betrieb. Sie drohen sehr lange zu verweilen. Viele Programmierer werden in Zukunft zweifellos unter vielen RDF- und OWL-induzierten WTFs leiden.

Mikrodatensysteme (die validatorfreundliche Version von Mikroformaten ) wie die in schema.org beschriebenen bieten Entwicklern, Redakteuren und Lesern gleichermaßen viele Vorteile. sowohl menschlich als auch mechanisch.

RDF-Konzepte (die es wert sind, gespeichert zu werden) können schmerzlos über Mikrodatendarstellungen abgebildet werden (und werden tatsächlich explizit zugeordnet).

Mit Mikrodatenelementen können Autoren und Dokumentverarbeitungssysteme die Kommunikation auf eine Weise bereichern , die für den Leser recht einfach (so einfach wie CSS oder DOM) zu handhaben und anzupassen ist.

ZJR
quelle
Warten Sie, ich verstehe nicht ... Wie unterscheiden sich Mikrodaten von XML / HTML? Der in schema.org beschriebene Plan besagt ausdrücklich, dass sie Tags auf ihren Webseiten verwenden ... ist das nicht auch das, was XML und HTML tun?
Webster Thesaurus
Und wenn Mikrodaten so viel besser sind, warum drängt der W3C dann auf RDFS / OWL und nicht auf Mikrodaten selbst?
Webster Thesaurus
Ich denke, diese Antwort ist ziemlich irreführend, da RDF! = XML. Die XML-Codierung von RDF ist nur eine von vielen und wurde mit dem Ziel entwickelt, in vorhandene XML-Anwendungen gemischt zu werden. Darüber hinaus bedeutet die Rückkehr zu benutzerdefinierten Systemen (ja, einschließlich Mikrodaten) die Rückkehr zu "Schreiben eines benutzerdefinierten Parsers zum Ficken von allem", anstatt generisches Vokabular verwenden zu können. Mit RDF / OWL kann ich verschiedene Anwendungen mischen, die jeweils an einer Teilmenge der beteiligten Daten arbeiten, sowie flexiblen Code mit automatischer Reflexion schreiben - ein gutes Beispiel ist Xanasys LinkExplorer.
p_l
1
Uninformative meinungsgebundene Antwort. Bitte geben Sie Hinweise zur Sicherung dieser Ansprüche an.
Dibbeke
@Dibbeke Meine ursprüngliche Vermutung war, dass das OP nach pragmatischen Metadaten suchte. RDF ist in diesem Fall übertrieben. Der meinungsgebundene Teil ist relativ zu meiner Überzeugung, dass RDF immer ein Overkill ist .
ZJR