Schlagwort-Archive: Semantic Web

New SW Case Study by Tecnalia

Tecnalia, in Spain, has provided a W3C Semantic Web Case Study on the Aquaring portal on aquatic resources. The portal offers a multilingual semantic search engine, a semantic tag cloud adapted to user context, map, exhibitions, etc. The initial aim was to offer a multilingual and unique access point to a heterogeneous and distributed collection of digital resources. This collection was provided by European expert organizations, keeping in mind the possible future integration into Europeana: the European Digital Library.

Read more New SW Case Study by Tecnalia

Kann man die Bedeutung von Wörtern ergoogeln?

Kann man die Bedeutung von Wörtern ergoogeln oder “Normalisierte Google-Distanz”.
Gibt man einen Begriff, beispielsweise “Pferd”, in die Suchmaschine Google ein, erhält etwa 12.300.000 indexierte Seiten (Stand: September 2007). Für einen weiteren Begriff, zum Beispiel “Reiter”, sind es 13.900.000 Seiten. Kombiniert man die Begriffe, werden ca. 1.690.000 Seiten gefunden. Für das gemeinsame Auftreten der Begriffe “Pferd” und “Bart” werden zwar immer noch 262.000 Seiten aufgeführt, es ist jedoch deutlich, dass “Pferd” und “Reiter” enger zusammenhängen. Daraus ergibt sich eine bestimmte Wahrscheinlichkeit für das gemeinsame Auftreten dieser Begriffe. Im Vergleich zur Gesamtmenge der indexierten Seiten (etwa 8.000.000.000) ergibt dies die NGD.

Das Beispiel stammt übrigens von Wikipedia Normalisierte Google-Distanz und man findet es auch im unten erwähnten Artikel.

Man definiert folgende Formel für die NGD zweier Begriffe x und y [1]:

Google Distanz

Google Distanz

2005 erschien schon der Artikel “Computer ergooglen die Bedeutung von Worten” und da heißt es:

Holländische Wissenschaftler glauben, mit der “normalisierten Google-Distanz” von Begriffen einer Künstlichen Intelligenz die Bedeutung von Worten automatisch lehren zu können
Wie könnten Computer Sprache lernen und dabei auch die Bedeutung von Worten sowie die Beziehungen zwischen ihnen verstehen? Dieses Problem der Semantik stellt eine gewaltige, bislang nur ansatzweise bewältigte Aufgabe dar, da Worte und Wortverbindungen oft mehrere oder auch viele Bedeutungen haben, die zudem vom außersprachlichen Kontext abhängen. Die beiden holländischen Ein künstliches Bewusstsein aus einfachen Aussagen). Paul Vitanyi und Rudi Cilibrasi vom Nationalen Institut für Mathematik und Informatik in Amsterdam schlagen eine elegante Lösung vor: zum Nachschlagen im Internet, der größten Datenbank, die es gibt, wird einfach Google benutzt…

Weblinks:
Google’s search for meaning
Links dazu auf Wikipedia:
Semantische Nähe
Semantisches Web
Semantik
Künstliche Intelligenz