Donnerstag, 23. Mai 2013

Der Open-IT Summit ist eine vom Hersteller- und Anbieterverband "Open Source Business Alliance" in eigener Regie zusammengestellte Subkonferenz. Für Auswahlkriterien und Zusammenstellung legt unser Partner eigene Maßstäbe an. Sie erfolgen unabhängig vom Programmkomitee des LinuxTag e. V.

Multilinguale Suchanwendungen für Big Data Bestände – Ein semantischer Ansatz mit Open Source Software und Open Data

von Sandy Lucka (Avantgarde Labs GmbH)

Thursday, 23.05.2013, OITS 3, 15:00-16:00 Uhr

Die neue Suchanwendung „SLUBsemantics“ der Sächsischen Landesbibliothek – Staats- und Universitätsbibliothek Dresden ermöglicht den Nutzern themenorientierte Suchanfragen in ihrer Muttersprache zu stellen und liefert alle thematisch relevanten Exemplare des Bibliothekskatalogs sortiert zurück, unabhängig ihrer Originalsprache.

Das intelligente Suchsystem stellt bibliografische Daten mittels Big-Data-Technologien in einen thematischen Kontext, der aus der größten sozial erzeugten, freien Enzyklopädie Wikipedia stammt. Mit Hilfe der Basistechnologie von „SLUBsemantics“ kann grundsätzlich jeder Textkorpus semantisch angereichert und themenorientiert durchsuchbar gemacht werden. Die neue Suchanwendung reduziert nicht nur den Zeitaufwand für das erfolgreiche Retrieval von Informationen, sondern ermöglicht auch das Aufdecken von bisher verborgenen Wissen.

Über den Autor Sandy Lucka:

Sandy Lucka ist Berater für Semantische Suchtechnologien, Data Mining und Datenmanagement bei der Firma Avantgarde Labs.
Als forschungsnaher IT-Dienstleister entwickelt Avantgarde Labs intelligente Informations- und Suchtechnologien auf Basis von Enterprise Open Source Software und Open Data.

Keywords: Big Data Anwendungen, Semantische Technologien, Datenmanagement, Text Mining, Wikipedia Mining, Hadoop, Talend, Solr, RapidMiner

www.avantgarde-labs.de