English | Deutsch

Web Datenextraktion und -integration

Nummer und Art:

181130 VU WS 2005/06

LVA Leiter: Robert Baumgartner
Kurzbeschreibung: Ansätze zur Web-Datenextraktion/-integration
Vorbesprechung: Do 6.10., 10:00 (pktl.), Seminarraum 184/2
Anmeldung: bis 2.10. per e-mail (beschränkte TN Zahl)
Sprache: Folien in englischer Sprache, Vorlesung je nach dem ob nicht deutschsprachige StudentInnen im Rahmen des Computational Logic Studiums teilnehmen
Termine: In etwa jeder zweite Donnerstag 10:00-13:00 (ab dem 20.10.), Seminarraum 184/2 (tw. geblockt)
Ablauf: Vorlesung gekoppelt mit Übungen (Beispiele und Gruppenarbeiten); Übungen um 10:00, Vorlesung um 11:00 (am ersten Termin um 10:00)
Schlüsselwörter: XML Familie, XML Schema, XPath, XSLT, XQuery, (HTML) Datenextraktion und Wrappergenerierung, Definition und Gebiete IE, Abgrenzung zu IR, Lixto Projekt: Visual Wrapper und Transformation Server, Applikationserstellung mit Lixto, weitere Wrappergenerierungssprachen und -tools, Wrapper Learning und Automatische Extraktion, Aggregation und Syndikation von Daten, Portalintegration, e-biz Frameworks, Extraktion aus PDF Dokumenten
Anrechenbarkeit: Diese VU ist Prüfungsfach oder Wahlfach in diversen Bakkelaureats- und Masterstudien und kann auch im Rahmen der KfK Semantic Web Advanced Topics gewählt werden und ist auch Teil des European Master Programs Computational Logic.
Verwandte Lehrveranstaltungen: Proseminar Web Information Extraction (Herzog, Gatterbauer)

Achtung: Aus terminlichen Gründen wurde der 1. Termin vom 20.10. auf den 3.11. verlegt und der 2. Termin in Folge auf den 17.11. verschoben, und der 3. Termin am 24.11. eingeschoben.

Voraussichtlicher Aufbau der VU und Unterlagen
Vorb.
Vorbesprechung
6.10.
1.Termin
Motivation IE, XML und XML Schema (bis 12:30)
3.11.
2.Termin
XML Abfragesprachen (+Übg.)
17.11.
3.Termin
XML Abfragesprachen, Techniken der IE, Ansätze Wrappergenerierung (+Übg.)
24.11.

4.Termin

Lixto Visual Wrapper und Elog (+ Übg)
1.12.
5.Termin
Lixto Transformation Server (+Übg)
15.12.
6.Termin
Drei Beispielprojekte: über - Induktive Wrappererstellung, automatische Datenextraktion, Datenextraktion aus PDF (+Übg)
12.1.
7.Termin
Gruppenvorträge (10:00-12:30, 13:30-16:00; je 5 Gruppen)
1|2|3|4|5|6|7|8|9|10
26.1.

Gruppeneinteilung Gruppenvortragsthemen&Einteilung

Staff
Robert Baumgartner, zuletzt bearbeitet am 3/2/2006