Bonjour,
J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée
"Algorithms for XML Stream Processing: Massive Data, External Memory and Scalable Performance".
Elle aura lieu le 16 mai 2011, à 10h, à la Faculté des Sciences et
Technologie de l'Université Paris-Est Créteil Val de Marne, dans la
salle des thèses (Bâtiment P2 niveau dalle),
et à la fin de la soutenance un pot sera donné dans la même salle.
Jury :
- Rapporteurs :
Rada CHIRKOVA, North Carolina State University, USA
Véronique BENZAKEN, Université Paris-Sud 11, France
- Examinateurs :
Mohamed ZERGAOUI, Innovimax SARL, France
Mostafa BAMHA, Université d’Orléans, France
- Directeur de thèse :
Gaétan, HAINS Université Paris-Est, France
Résumé :
Plusieurs applications modernes nécessitent un traitement de flux
massifs de données XML, cela crée des défis techniques. Parmi ces
derniers, il y a la conception et la mise en ouvre d’outils pour
optimiser le traitement des requêtes XPath. Il s’agit alors de fournir
une estimation précise des coûts de ces requêtes traitées sur un flux
massif de données XML.
Dans cette thèse, nous proposons un nouveau modèle de prévision de
performance qui estime à priori le coût (en terme d’espace utilisé et de
temps écoulé) pour les requêtes structurelles du fragment de langage
Forward XPath.
Ce faisant, nous réalisons une étude expérimentale pour confirmer la
relation linéaire entre le traitement de flux, et les ressources d’accès
aux données. Par conséquent, nous présentons un modèle mathématique
(utilisant des régressions linéaires) pour prévoir le coût d’une requête
XPath.
En outre, nous présentons une technique nouvelle d’estimation de la
sélectivité. Elle constituée de deux éléments. Le premier est le résumé
path tree ou arbre des chemins: une présentation concise et précise de
la structure d’un document XML. Le second est l’algorithme d’estimation
de sélectivité: un algorithme efficace de flux pour traverser l’arbredes
chemins afin d’estimer les valeurs des paramètres de coût. Ces
paramètres sont utilisés par le modèle mathématique pour déterminer le
coût d’une requête XPath.
Nous comparons les performances de notre modèle avec les approches
existantes. De plus, nous présentons un cas d’utilisation de celui-ci
dans un système en ligne appelé "online stream-querying system". Le
système utilise notre modèle de prédiction de performance pour estimer
le coût (en terme de temps / mémoire) d’une requête XPath. En outre, il
fournit une estimation précise à l’auteur de la requête relativement au
coût et au volume de sa requête. Ce cas d’utilisation illustre les
avantages pratiques de la gestion de performance avec nos techniques.
Mots clés: Traitement de flux, données XML, requêtes XPath,
estimation de sélectivité, Modèle de performance, optimisation de
requêtes.
""
--
Muath ALRAMMAL, Ph.D. student.
LACL, Université Paris-Est, 94000 Créteil,
muath.alrammal@u-pec.fr
SW Engineer at Innovimax SARL
Consulting, Training & XML Development
9, impasse des Orteaux
75020 Paris, France
Please consider the environment before printing this e-mail