[ox-de-raw] keimform.de: »Wie finden wir uns?«
- From: Stefan Meretz <stefan.meretz hbv.org>
- Date: Thu, 18 Jan 2007 10:38:46 +0100
http://www.keimform.de/2007/01/18/wie-finden-wir-uns/
»Wie finden wir uns?«
Von StefanMz, 18. Januar 2007, 10:05 Uhr
Mehr zufällig als geplant hatte ich die Gelegenheit am ersten
ExpertFinder-Workshop
[http://lsdis.cs.uga.edu/~aleman/efw2007/program/] in Berlin
teilzunehmen. Dabei ging es um interessante Fragen, die uns auch hier
umtreiben: »Wie finde ich, wen oder was ich suche? Und wie werde ich
gefunden?« Hier nun also ein kurzer Bericht vom Workshop.
Die Lösung für solche Fragen ist das semantische Web
[http://de.wikipedia.org/wiki/Semantisches_Web], dachte man. Das
internationale Standardisierungsgremium W3C
[http://de.wikipedia.org/wiki/W3c] versucht sich schon eine Weile an
der Definition einer Infrastruktur [http://www.w3.org/2001/sw/], aber
irgendwie kommt das semantische Internet nicht aus dem Knick. Warum?
Das liegt in der Natur der Semantik, würde ich sagen.
Kleiner erkenntnistheoretischer Ausflug
Semantik bedeutet Bedeutung. Es geht um die Bedeutungen der Welt, die
die Menschheit hergestellt oder als Vorgefundenes in ihre Lebenspraxis
bedeutungsvoll integriert hat. Diese Welt-Bedeutungen lassen sich nicht
formal definieren, weil sie – sobald man sie von unser Lebenspraxis
trennt – tot sind. Alle, die sich nun mit Semantik theoretisch oder
praktisch vergnügen, machen nun genau das: Sie fixieren Bedeutungen in
einer abgeschlossenen »Blockwelt«
[http://en.wikipedia.org/wiki/Blocks_world] mit definierten Syntax
[http://de.wikipedia.org/wiki/Syntax] -Semantik
[http://de.wikipedia.org/wiki/Semantik] -Beziehungen. In solchen
Miniwelten kann man nun formal (syntaktisch) mit bedeutungsvollen
(semantischen) Einheiten umgehen, etwa maschinell lesen und
verarbeiten. Nehmen wir als Beispiel eine »Miniwelt mit Hausnummern«,
wer HTML ein wenig kennt, kann das gut lesen:
...
<hausnummer>42</hausnummer>
...
Das Problem bei solchen Miniwelten ist, dass die Semantik eigentlich nur
außerhalb der Miniwelt _verstehbar_ ist, nämlich in unserer
Lebenspraxis. Es gibt also eine quasi undefinierte (weil
undefinierbare) Referenz nach "außen". Wenn in der Miniwelt zum
Beispiel steht: "42", dann funktioniert das nur, weil wir wissen, was
Häuser sind, was Nummern sind und dass es (hierzulande) üblich ist,
Häusern Nummern zu verpassen, um sie besser finden zu können etc.
Innerhalb der Miniwelt sind beides – "hausnummer" und "42" – nur
Zeichen. Solange wir wissen, wir wir solche Miniwelten zu benutzen
haben, ist das alles kein Problem. Wir tun dies ohne dauernd. Schwierig
wird es, wenn mehrere Miniwelten aufeinander treffen: Sehr häufig
passen die Semantiken nicht zueinander, weil sich die impliziten
Verweise in unsere Lebenspraxis nicht decken.
Damit sind wir beim Grundproblem: Im semantischen Web lassen sich
beliebig viele »informatische Ontologien«
[http://de.wikipedia.org/wiki/Ontologie_%28Informatik%29] definieren,
die jeweils ein eigenes Vokabular
[http://de.wikipedia.org/wiki/Kontrolliertes_Vokabular] verwenden und
in einer bestimmten Domäne [http://de.wikipedia.org/wiki/Dom%C3%A4ne]
funktionieren, aber untereinander oft nicht kompatibel sind. Nehmen wir
an, in einer bestimmten Lebenspraxis werden Wohnorte nicht über
Hausnummern, sondern über Landschaftsmarken (früher üblich) gefunden.
Dann taugt die Miniwelt mit der formal definierten Hausnummer nicht
mehr. Hinzu kommt ein zweites Grundproblem, das ich aber nicht so hoch
hängen will: Die Selbstreferenzialität. Welche Ontologie enthält denn
die definierten Ontologien, also sich selbst?
Ganz allgemein gesagt haben wir es mit einem _Semantik-Paradoxon_ zu
tun: Das platte World Wide Web ist ein großer Haufen Zeichenmüll, der
nur mit Brute-Force [http://de.wikipedia.org/wiki/Brute_force] (aka
Google) handhabbar ist. Viel cleverer wäre es, wenn das WWW kapiert,
was ich will. Es müsste also "semantisch" funktionieren. Das WWW als
Abbildung (eines Ausschnitts) der Lebenspraxis ist nun aufgrund des
oben beschriebenen Problems grundsätzlich nicht vollständig semantisch
definierbar. Es gibt keine Welt-Ontologie. Oder anders gesagt: Es gibt
nur eine Welt-Ontologie, und das ist unsere Lebenspraxis.
Nun ja, das ist nicht so schlimm und für manchen vielleicht auch
trötzlich. Es wäre ja trotzdem schon viel gewonnen, wenn wir in einigen
Bereichen ein paar Miniwelten zur Verfügung hätten, auf den wir
operieren könnten. Wir müssten uns nur entspannen und von der
Vorstellung Abschied nehmen, man könnte die Welt »repräsentieren«. Es
wäre ja schon ganz schick, wenn Miniwelten unser _Werkzeug_ sein würden
und wir also die Syntax-Semantik-Beziehungen genauso ansehen: Was wäre
wirklich nützlich für uns? Statt: Wie bilden wir die Welt ab?
Pragmatisch geht die Reise ohnehin genau in diese Richtung. Nun also
zum Workshop.
Chaos der Ontologien
Auf dem ExpertFinder-Workshop spielten drei
Ontologie-Beschreibungssysteme (aka: Miniwelten) eine Rolle:
- FOAF [http://de.wikipedia.org/wiki/FOAF] (»Friend Of A Friend«,
gesprochen in einem Wort analog "loaf") ist ein Format zur
Beschreibung von Personen. Wichtigstes Feld ist "knows", was auf
andere Personen verweist. So lassen sich Bekanntschaftsnetzwerke
nutzbar (surfbar, grafisch darstellbar etc.). Vergleichbar ist FOAF
mit vCard [http://de.wikipedia.org/wiki/Vcard], was wohl (fast) alle
E-Mailprogramme nutzen.
- SIOC [http://en.wikipedia.org/wiki/SIOC] (»Semantically Interlinked
Online Communities«, gesprochen wie "Schock") ist ein Format zur
Erfassung von Online-Diskussionen in Blogs, Foren oder Mailinglisten.
SIOC lässt sich gut mit FOAF verbinden.
- SKOS [http://de.wikipedia.org/wiki/SKOS] (»Simple Knowledge
Organisation System«, gesprochen wie geschrieben: "Skoss") ist eine
W3C-Spezifikation [http://www.w3.org/2004/02/skos/] zur Darstellung
hierarchischer Informationsstrukturen, Thesauri, Taxonomien etc.
Mit hinzunehmen würde ich auch noch:
- DOAP [http://en.wikipedia.org/wiki/DOAP] (»Description Of A Project«,
gesprochen wie "dope") ist ein Format zur Beschreibung von Freien
Softwareprojekten. Genutzt wird DOAP von Software-Registern wie
CodeZoo [http://www.codezoo.com/], SWIK [http://swik.net/],
CheeseShop [http://cheeseshop.python.org/pypi] etc.
Das Problem aller dieser Formate ist ihre zu geringe Verbreitung.
Ein "Henne-und-Ei-Problem": Es nutzen noch nicht viele, so dass die
eigene Beteiligung Nutzen verspricht; ein höherer Nutzen erfordert die
Beteiligung von mehr Nutzern. Kurz: Die kritische Masse
[http://de.wikipedia.org/wiki/Netzwerkeffekt] ist nicht da. Ähnlich bei
den Anwendungen: Es gibt viel wenig, weil sie zu wenig nachgefragt
werden und vice versa.
Gleichzeitig existieren zum Beispiel neben FOAF mit der vCard Formate,
die durchaus intensiv benutzt werden. Allerdings sind diese ähnlichen
Formate nicht ohne weiteres ineinander überführbar. So wurde auf dem
Workshop diskutiert, welchen Weg man gehen kann. Interessant war für
mich zu beobachten: Ein Ami schlug einen pragmatischen Weg vor (»Nimm
dir einen Graduate Student und lass dir ein Programm schreiben«),
während der Österreicher eine saubere Abbildung (»Ich will eine
allgemeine Lösung auf der Basis eines deklarativen Mappings«) vorzog.
Irgendwie passt es doch immer wieder...
Was heisst das für uns?
Es gibt am 18.2.2007 ein Treffen
[http://www.keimform.de/2007/01/05/bildung-eines-serviceknotens-fuer-ein-kommunikationsnetz-von-solidargemeinschaften/],
um über die Frage der besseren Vernetzung von Projekten
der »Solidarischen Ökonomie« (was immer das ist...) zu sprechen. Ich
fürchte, da kommt nur wieder der übliche Kanon raus: Noch ein Wiki,
Blog, Newsletter etc. Bringt es das? Bringt es was, sich am Kampf um
Aufmerksamkeit zu beteiligen, anstatt zu gucken, wie wir untereinander
zeitsparende Netzwerke knüpfen können? Ich halte es für
vielversprechender, die schmale Kraft in die eigene P2P-Vernetzung
[http://de.wikipedia.org/wiki/P2P] zu stecken, als ungelesene Infos in
die Welt zu blasen. Oder wenn denn Info-Fluten sein muss (es gibt ja
gute Gründe), dann wenigstens in einer Weise, dass die Informationen
wiederverwendbar sind. Dazu müssen sie maschinenlesbar sein. Die
vorgestellten Miniwelt-Formate bieten sich an. Allerdings setzt das die
Bereitschaft voraus, sich mit neuen Techniken zu befassen – erstmal nur
eine Herausforderung für das Denken.
--
Start here: www.meretz.de