Bonjour,

J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée

"Algorithms for XML Stream Processing: Massive Data, External Memory and Scalable Performance".

Elle aura lieu le 16 mai 2011, à 10h, à la Faculté des Sciences et Technologie de l'Université Paris-Est Créteil Val de Marne, dans la salle des thèses (Bâtiment P2 niveau dalle),
et à la fin de la soutenance un pot sera donné dans la même salle.

Jury :

- Rapporteurs :
Rada CHIRKOVA, North Carolina State University, USA
Véronique BENZAKEN, Université Paris-Sud 11, France

- Examinateurs :
Mohamed ZERGAOUI, Innovimax SARL, France
Mostafa BAMHA, Université d’Orléans, France

- Directeur de thèse :
Gaétan, HAINS Université Paris-Est, France

Résumé :

Plusieurs applications modernes nécessitent un traitement de flux massifs de données XML, cela crée des défis techniques. Parmi ces derniers, il y a la conception et la mise en ouvre d’outils pour optimiser le traitement des requêtes XPath. Il s’agit alors de fournir une estimation précise des coûts de ces requêtes traitées sur un flux massif de données XML.

Dans cette thèse, nous proposons un nouveau modèle de prévision de performance qui estime à priori le coût (en terme d’espace utilisé et de temps écoulé) pour les requêtes structurelles du fragment de langage Forward XPath.
Ce faisant, nous réalisons une étude expérimentale pour confirmer la relation linéaire entre le traitement de flux, et les ressources d’accès aux données. Par conséquent, nous présentons un modèle mathématique (utilisant des régressions linéaires) pour prévoir le coût d’une requête XPath.
En outre, nous présentons une technique nouvelle d’estimation de la sélectivité. Elle constituée de deux éléments. Le premier est le résumé path tree ou arbre des chemins: une présentation concise et précise de la structure d’un document XML. Le second est l’algorithme d’estimation de sélectivité: un algorithme efficace de flux pour traverser l’arbredes chemins afin d’estimer les valeurs des paramètres de coût. Ces paramètres sont utilisés par le modèle mathématique pour déterminer le coût d’une requête XPath.
Nous comparons les performances de notre modèle avec les approches existantes. De plus, nous présentons un cas d’utilisation de celui-ci dans un système en ligne appelé "online stream-querying system". Le système utilise notre modèle de prédiction de performance pour estimer le coût (en terme de temps / mémoire) d’une requête XPath. En outre, il fournit une estimation précise à l’auteur de la requête relativement au coût et au volume de sa requête. Ce cas d’utilisation illustre les avantages pratiques de la gestion de performance avec nos techniques.

Mots clés: Traitement de flux, données XML, requêtes XPath, estimation de sélectivité, Modèle de performance, optimisation de requêtes.

""

--
Muath ALRAMMAL, Ph.D. student.
LACL, Université Paris-Est, 94000 Créteil,
muath.alrammal@u-pec.fr

SW Engineer at Innovimax SARL
Consulting, Training & XML Development
9, impasse des Orteaux
75020 Paris, France

Please consider the environment before printing this e-mail