Nummer und Art: |
181130 VU WS 2005/06
|
LVA Leiter: |
Robert Baumgartner |
Kurzbeschreibung: |
Ansätze zur Web-Datenextraktion/-integration |
Vorbesprechung: |
Do 6.10., 10:00 (pktl.), Seminarraum 184/2 |
Anmeldung: |
bis 2.10. per e-mail
(beschränkte TN Zahl) |
Sprache: |
Folien in englischer Sprache, Vorlesung je nach dem ob nicht deutschsprachige
StudentInnen im Rahmen des Computational Logic Studiums teilnehmen |
Termine: |
In etwa jeder zweite Donnerstag 10:00-13:00 (ab dem 20.10.), Seminarraum
184/2 (tw. geblockt) |
Ablauf: |
Vorlesung gekoppelt mit Übungen (Beispiele und Gruppenarbeiten);
Übungen um 10:00, Vorlesung um 11:00 (am ersten
Termin um 10:00) |
Schlüsselwörter: |
XML Familie, XML Schema, XPath, XSLT, XQuery, (HTML) Datenextraktion
und Wrappergenerierung, Definition und Gebiete IE, Abgrenzung zu IR,
Lixto Projekt: Visual Wrapper und Transformation Server, Applikationserstellung
mit Lixto, weitere Wrappergenerierungssprachen und -tools, Wrapper
Learning und Automatische Extraktion, Aggregation und Syndikation
von Daten, Portalintegration, e-biz Frameworks, Extraktion aus PDF
Dokumenten |
Anrechenbarkeit: |
Diese VU ist Prüfungsfach oder Wahlfach in diversen Bakkelaureats-
und Masterstudien und kann auch im Rahmen der KfK
Semantic Web Advanced Topics gewählt werden und ist auch
Teil des European Master Programs
Computational Logic. |
Verwandte Lehrveranstaltungen: |
Proseminar Web
Information Extraction (Herzog, Gatterbauer) |
Achtung: Aus terminlichen Gründen
wurde der 1. Termin vom 20.10. auf den 3.11. verlegt und der 2. Termin
in Folge auf den 17.11. verschoben, und der 3. Termin am 24.11. eingeschoben.
Voraussichtlicher Aufbau der VU und Unterlagen
|
Vorb.
|
Vorbesprechung
|
|
6.10.
|
1.Termin
|
Motivation IE, XML und
XML Schema (bis 12:30)
|
|
3.11.
|
2.Termin
|
XML Abfragesprachen (+Übg.)
|
|
17.11.
|
3.Termin
|
XML Abfragesprachen,
Techniken der IE, Ansätze Wrappergenerierung (+Übg.)
|
|
24.11.
|
4.Termin
|
Lixto Visual Wrapper
und Elog (+ Übg)
|
|
1.12.
|
5.Termin
|
Lixto Transformation
Server (+Übg)
|
|
15.12.
|
6.Termin
|
Drei Beispielprojekte:
über - Induktive Wrappererstellung, automatische Datenextraktion,
Datenextraktion aus PDF (+Übg)
|
|
12.1.
|
7.Termin
|
Gruppenvorträge
(10:00-12:30, 13:30-16:00; je 5 Gruppen)
|
|
26.1.
|
Gruppeneinteilung Gruppenvortragsthemen&Einteilung
|