| Nummer und Art: |
181130 VU WS 2005/06
|
| LVA Leiter: |
Robert Baumgartner |
| Kurzbeschreibung: |
Ansätze zur Web-Datenextraktion/-integration |
| Vorbesprechung: |
Do 6.10., 10:00 (pktl.), Seminarraum 184/2 |
| Anmeldung: |
bis 2.10. per e-mail
(beschränkte TN Zahl) |
| Sprache: |
Folien in englischer Sprache, Vorlesung je nach dem ob nicht deutschsprachige
StudentInnen im Rahmen des Computational Logic Studiums teilnehmen |
| Termine: |
In etwa jeder zweite Donnerstag 10:00-13:00 (ab dem 20.10.), Seminarraum
184/2 (tw. geblockt) |
| Ablauf: |
Vorlesung gekoppelt mit Übungen (Beispiele und Gruppenarbeiten);
Übungen um 10:00, Vorlesung um 11:00 (am ersten
Termin um 10:00) |
| Schlüsselwörter: |
XML Familie, XML Schema, XPath, XSLT, XQuery, (HTML) Datenextraktion
und Wrappergenerierung, Definition und Gebiete IE, Abgrenzung zu IR,
Lixto Projekt: Visual Wrapper und Transformation Server, Applikationserstellung
mit Lixto, weitere Wrappergenerierungssprachen und -tools, Wrapper
Learning und Automatische Extraktion, Aggregation und Syndikation
von Daten, Portalintegration, e-biz Frameworks, Extraktion aus PDF
Dokumenten |
| Anrechenbarkeit: |
Diese VU ist Prüfungsfach oder Wahlfach in diversen Bakkelaureats-
und Masterstudien und kann auch im Rahmen der KfK
Semantic Web Advanced Topics gewählt werden und ist auch
Teil des European Master Programs
Computational Logic. |
| Verwandte Lehrveranstaltungen: |
Proseminar Web
Information Extraction (Herzog, Gatterbauer) |
Achtung: Aus terminlichen Gründen
wurde der 1. Termin vom 20.10. auf den 3.11. verlegt und der 2. Termin
in Folge auf den 17.11. verschoben, und der 3. Termin am 24.11. eingeschoben.
|
Voraussichtlicher Aufbau der VU und Unterlagen
|
|
Vorb.
|
Vorbesprechung
|
|
6.10.
|
|
1.Termin
|
Motivation IE, XML und
XML Schema (bis 12:30)
|
|
3.11.
|
|
2.Termin
|
XML Abfragesprachen (+Übg.)
|
|
17.11.
|
|
3.Termin
|
XML Abfragesprachen,
Techniken der IE, Ansätze Wrappergenerierung (+Übg.)
|
|
24.11.
|
|
4.Termin
|
Lixto Visual Wrapper
und Elog (+ Übg)
|
|
1.12.
|
|
5.Termin
|
Lixto Transformation
Server (+Übg)
|
|
15.12.
|
|
6.Termin
|
Drei Beispielprojekte:
über - Induktive Wrappererstellung, automatische Datenextraktion,
Datenextraktion aus PDF (+Übg)
|
|
12.1.
|
|
7.Termin
|
Gruppenvorträge
(10:00-12:30, 13:30-16:00; je 5 Gruppen)
|
|
26.1.
|
Gruppeneinteilung Gruppenvortragsthemen&Einteilung
|