| Termin: | Montags, 15:30-17:30 Uhr; Es herrscht Anwesenheitspflicht für alle Seminarteilnehmer.
Achtung Terminänderung: Am 07.02.2005 finden drei Vorträge statt. Das Seminar beginnt deshalb an diesem Tag bereits um 14:30 Uhr und dauert bis 17:30 Uhr. |
| Ort: | FMI-Bau Garching, Boltzmannstr. 3, Ted Codd Seminarraum
(02.09.014) (II. Stock, zwischen 9. und 11. Finger) |
| Beginn: | Das Seminar beginnt im Januar 2005. Der erste Termin ist der 17.1.2005. Es werden dann jeweils zwei Vorträge an einem Termin stattfinden. Am letzten Termin (7.2.2005) finden drei Vorträge statt. |
| Anmeldung: | ab sofort per Email an Prof. Kemper. Dieses Seminar ist für Studierende mit Vorkenntnissen in und speziellem Interesse an Datenbanksystemen gedacht und dient u.a. der Vorbereitung von Diplomarbeiten in dem Bereich. Bitte geben Sie bei der Anmeldung ein umfassendes Bild Ihres bisherigen Studienverlaufs an (Studiengang, Semesterzahl, DB-Kenntnisse, Leistungen im Hauptstudium, ...) sowie Ihre weiteren Pläne. |
| Ansprechpartner/in: | Prof.
Alfons Kemper, Ph.D.(
)
Dr. Angelika Reiser ( ) Raum 02.11.053, Tel. 289-17284 Richard Kuntschke ( ) Raum 02.11.043, Tel. 289-17286 |
| Vorkenntnisse: | Stoff der Vorlesung Datenbanksysteme; Vordiplom bei Diplomstudierenden; Parallel zum Seminar können/sollten die Vorlesungen Datenbanksysteme und Informationssysteme: Verteilte und Web-Datenbanken gehört werden. |
| Schein: | Benoteter Schein bei Vortrag und regelmäßiger aktiver Teilnahme (Diskussionsbeiträge) |
| Bereiche: |
|
Über das Internet rücken im Prinzip alle weltweit persistenten Daten in
Zugriffsreichweite. Eine sprunghafte Zunahme des Datenvolumens entsteht durch
Peer-to-Peer-Datenverbünde, die durch eine sehr hohe Zahl von typischerweise nur
temporär zugänglichen Datenquellen gekennzeichnet sind. Weiterhin werden
zunehmend kontinuierliche Ströme von Daten, z.B. durch datenerfassende Geräte
wie Sensoren, generiert. Die Beherrschung und effektive Nutzung dieser Datenflut
erfordert eine bedarfsgetriebene automatisierte Kopplung und Integration der
vielfältigen Datenquellen. Für die anwendungsbezogene Nutzung und Verarbeitung der Daten, insbesondere in zahlreichen
innovativen Anwendungsbereichen in Wirtschaft und Wissenschaft sowie
im Gesundheitswesen und Katastrophenmanagement, sind verteilte Informationssysteme von essentieller Bedeutung. Die Unterstützung sehr vieler
Datenquellen und von Datenströmen erfordert dynamische, hochgradig automatisierte
Kooperations- und Integrationsansätze in derartigen Systemen. Einen
weiteren methodischen Schwerpunkt bilden neue Formen der Metadatenverwaltung mit
deskriptiven Operatoren zur Analyse und Manipulation unterschiedlichster
Metadatenmodelle. Eine Schlüsselrolle kommt dabei der Nutzung ontologischer
Metadaten zu, um eine semantisch aussagekräftige Fusion und Analyse der Daten zu
erreichen. Große Bedeutung haben darüber hinaus neue Methoden zur Analyse und
Verbesserung der Datenqualität sowie zum Datenschutz. Die technischen
Voraussetzungen für verteilte Informationssysteme sind aufgrund von
Basistechnologien wie XML, Grid-Computing und Web-Services für den
Datenaustausch und der Interoperabilität von Anwendungsdiensten weitgehend
verfügbar und sollen im Rahmen des Seminars einführend vorgestellt werden.
Um die Skalierbarkeit gewährleisten zu können, müssen neuartige
Architekturansätze verfolgt werden, die den neuen Entwicklungen in der
verteilten Infrastruktur, wie den Peer-to-Peer-Netzen Rechnung tragen. Im Internet
werden Daten zunehmend als Datenströme bereitgestellt, so dass die Daten nur
flüchtig zur Verfügung gestellt werden. Hier gilt es durch entsprechende Publish/Subsribe-Verfahren
die relevanten Daten zu verknüpfen und sie den Nutzern in aufbereiteter Form
(gefiltert, aggregiert, bereinigt) zur Verfügung zu stellen. Aus Gründen der Skalierbarkeit benötigen verteilte Informationssysteme
ein sich selbst organisierendes Architekturkonzept, das man heute auch mit
dem Begriff „autonomic computing“ bezeichnet. Des Weiteren muss die Bearbeitung der eingehenden Daten laufend beobachtet
und angepasst werden, da man auf sich ändernde Auslastungen und Antwortzeiten
reagieren muss. Die weitläufige Verknüpfbarkeit von Daten führt unweigerlich zu
Sicherheitsproblemen, die es zu lösen gilt, um den Datenschutz personenbezogener
Daten zu garantieren.
Von den Teilnehmern des Seminars wird die aktive Mitarbeit während des gesamten Seminars erwartet. Sie können sich also nicht einfach "nur" auf Ihren eigenen Vortrag konzentrieren, sondern müssen sich auch aktiv mit den anderen Themen des Seminars auseinandersetzen.
Aus diesem Grund soll jede/r Teilnehmer/in zusätzlich zur Bearbeitung ihres/seines eigenen Themas einen weiteren Vortrag moderieren. Die Moderatoren moderieren den jeweiligen Vortrag, stellen die/den Vortragende/n vor und leiten die Diskussion nach dem Vortrag. Das setzt voraus, dass die Moderatoren sich vorher eingehend mit dem Thema auseinandersetzen.
Am wichtigsten: Die Moderatoren sollen den Vortragenden schon bei der Gestaltung der Ausarbeitung und des Vortrags Feedback geben. Die Moderatoren sind, in gewisser Weise, für die Qualität des Vortrags und der Ausarbeitung mit verantwortlich. Das setzt voraus, dass die Moderatoren die Ausarbeitung rechtzeitig vorher zu lesen bekommen (und sie auch sehr genau lesen), den Vortragenden Feedback geben und sich den Vortrag schon vorher probeweise anhören. Die Vorträge sollen etwa eine Stunde (inklusive Diskussion) dauern.
Aber nicht nur die Moderatoren müssen sich vorher mit dem aktuellen Thema auseinandersetzen. Es wird von allen Teilnehmern verlangt, dass sie sich die Ausarbeitung des jeweils anstehenden Vortrages vorher durchgelesen haben. Deshalb werden die Vortragsausarbeitungen über diese Webseite zur Verfügung gestellt. Ich empfehle, die Ausarbeitung in LaTeX (im article-Format) zu erstellen Auf jeden Fall müssen Sie sicherstellen, dass sie über die Webseite eine professionelle pdf-Version bereitstellen. Die Ausarbeitung sollte etwa 10-15 Seiten (12pt Font) lang sein. In der Ausarbeitung muss die verwendete Literatur "sauber" angegeben werden (Ich empfehle BiBTeX-Stil alpha, wenn man LaTeX verwendet.). In meinem Buch können Sie nachschauen, wie Literaturlisten auszusehen haben (Man sollte da wirklich sorgfältig vorgehen, da die Literaturliste die "Visitenkarte" der Ausarbeitung ist.).
Der Vortrag soll zwischen 45 und 50 Minuten dauern, auf keinen Fall länger. Daran anschließen sollte sich eine etwa 15 minütige Diskussion. Für den Vortrag empfehle ich ein Microsoft-Produkt: PowerPoint. Es macht aber keinen Sinn, mit PowerPoint einen Stichpunkt-Vortrag zu erstellen. Sie sollten die Vortragsfolien animieren -- wann immer das sinnvoll ist. Außerdem sollten Sie die Gratwanderung zwischen sinnvoller Animation und "Kitsch" austarieren lernen. Dabei kann Ihnen aber sicher die/der Moderator/in ein bisschen helfen. Sie sollen in diesem Seminar, neben dem eigenen Verständnis des technischen Inhalts, auch die didaktisch ansprechende Präsentation des Stoffs lernen (das werden Sie auch dann können müssen, wenn Sie nicht Hochschullehrer werden wollen, da eine gute Präsentationstechnik auch von Informatikern im Berufsleben immer stärker gefordert wird).
Auf jeden Fall muss jeder Vortrag so frühzeitig mit der/dem Moderator/in geprobt werden, dass noch Änderungen eingearbeitet werden können. Bitte verwenden Sie Ihren eigenen PC (oder irgendwelche PCs, die irgendwo "rumstehen" -- ggf. können Sie den PC in meinem Sekretariat nach Rücksprache mit meiner Sekretärin nutzen) um den Vortrag zu erstellen. Ich werde einen Beamer und einen PC mit PowerPoint2003 für den Vortrag zur Verfügung stellen. Bringen Sie Ihren Vortrag bitte auf einer (lesbaren) CD-ROM mit. Wenn Sie keinen CD-Brenner haben, schicken Sie mir die Endfassung des Vortrags bitte mindestens 24 Stunden vorher. (Wenn Sie partout ein anderes System für Ihre Folienerstellung verwenden möchten, steht natürlich auch ein Acrobat Reader für pdf-Folien auf meinem PC zur Verfügung.)
Um den Terminplan einhalten zu können, müssen die Ausarbeitungen rechtzeitig zu Beginn des Seminars Anfang Januar im Web verfügbar sein (und schon eine Woche vorher bei den Moderatoren und mir vorliegen). Nachdem die/der Moderator/in ihr/sein Feedback gegeben hat, schaue ich mir die Ausarbeitung an, so dass noch Zeit für eine evtl. notwendige Überarbeitung bleibt.
Verwenden Sie bitte keine "billigen" Bitmap-Kopien von Vorlagen, da Sie in der Regel das Copyright damit verletzen und die Datei stark aufblähen. Testen Sie bitte, dass man die Datei über diese Webseite des Seminars herunterladen kann.
Die Vorträge sind nicht nur im Web verfügbar zu machen; sie müssen auch jeweils von allen Seminarteilnehmern vorher gelesen werden. Sie sollten sich also schon vorher mit dem Thema beschäftigen, damit Sie während des Vortrags "kluge" Fragen stellen können.
Bei Ihrem Vortrag achten Sie bitte darauf, dass die Zuhörer den Vortrag verstehen können. Die Thematik muss gut moderiert werden; die grundlegenden Konzepte sollen an anschaulichen Beispielen erläutert werden. Nach Möglichkeit sollten die Beispiele selbst ausgearbeitet werden und nicht aus der zugrunde liegenden Literatur "blind" übernommen werden. Die angegebene Literatur ist lediglich als Einstieg in die Thematik gedacht, so dass man sich selber zusätzliche Literatur beschaffen muss. Generell achten Sie bitte darauf, dass Sie sich nicht dem Vorwurf des Plagiarismus aussetzen. Eine wörtliche Übersetzung einer Vorlage fällt sehr wohl darunter. Sie sollen den Stoff selbst "durchdringen" und dann in eigenen Worten und mit eigenen Beispielen eine Ausarbeitung erstellen.
Die angegebene Literatur stellt immer nur den Einstieg in die Thematik dar; weitere Literaturstellen können Sie dann aus der transitiven Hülle der dort zitierten Arbeiten extrahieren. Für die Literaturrecherche empfehle ich den (großartigen) Bibliographieserver namens DBLP (Data Base and Logic Programming) von Michael Ley in Trier bzw. die etwas schnellere Mirror-Site in Aachen. Über diesen Server kommen Sie i.d.R. auch auf die Homepage der Autoren, wo man oft Postscript-Reprints der Veröffentlichungen findet. Eine weitere Webseite für die Literaturrecherche finden Sie unter http://www.csindex.com/ (Hier sind auch einige Publikationen in ps- oder pdf-Format gespeichert -- ist das überhaupt legal hinsichtlich Copyright?). Ferner empfehle ich die Mitgliedschaft bei ACM; dort kann man dann die "digital library" abonnieren und hat alle ACM-Veröffentlichungen on-line zur Verfügung. Und natürlich kann man die Artikel (sofern sie auf Konferenzen oder in Zeitschriften veröffentlicht wurden) auch in der Bibliothek nachschlagen und ggf. kopieren.
Die Ausarbeitungen müssen bis Anfang Januar fertig gestellt und über diese Passwort-geschützte Webseite vernetzt werden.
1. The LSD Schema Matcher
Vortrag: Georgios Tsoukas
Moderation: Alexandros Gougas
Termin: 17.1.2005
2. StreamGlobe and the FluX Query Engine
Vortrag: Mariam Saadat
Moderation: Alexander Perzylo
Termin: 17.1.2005
3. Efficient Query Reformulation in Peer Data Management Systems
Vortrag: Georg Büxel
Moderation: Moez Chaabeni
Termin: 24.1.2005
4. Model-Driven Data Acquisition in Sensor Networks
Vortrag: Dimitar Menkov
Moderation: N.N.
Termin: 24.1.2005
5. Quality of Service in an Information Economy
Vortrag: Alexander Perzylo
Moderation: Mariam Saadat
Termin: 31.1.2005
6. A Publish & Subscribe Architecture for Distributed Metadata Management
Vortrag: Alexandros Gougas
Moderation: Georgios Tsoukas
Termin: 31.1.2005
7. ObjectGlobe: Ubiquitous Query Processing on the Internet
Vortrag: Moez Chaabeni
Moderation: Georg Büxel
Termin: 7.2.2005
8. Dynamic Distributed Query Processing on the Internet
Vortrag: Omar Zaghdoudi
Moderation: Fatemeh Joweini
Termin: 7.2.2005
9. The CQL Continuous Query Language
Vortrag: Fatemeh Joweini
Moderation: Omar Zaghdoudi
Termin: 7.2.2005