5.4. Les parseurs XML

 

Les parseurs associés à un programme applicatif permettent de récupérer les données, le texte des éléments et les valeurs des attributs.

 

On distingue deux modèles de processeurs XML :

 

- Les processeurs DOM (Document Access Model)

Le modèle DOM est une recommandation du W3C. Les interfaces sont réalisées en IDL CORBA défini par l'OMG. Un processeur DOM présente au programme applicatif ou au navigateur, une arborescence d'objets correspondant au document traité.

 

Processeurs DOM :

    * Paquetage Perl DOM ;

    * Docuverse du W3C ;

    * composant ActiveX MSXML XMLDOM de Microsoft intégré dans Internet Explorer 5 et utilisable aussi bien dans un navigateur (IE4 ou IE5) que dans un serveur Web ;

    * XP de James Clark ;

    * XML4J d'IBM ;

    * Project X Java de Sun ;

    * XML Parser for Java d'Oracle ;

    * Saxon de Michael Kay ;

    * Xerces d'Apache ;

    * Aelfred de Microstar.

 

- Les processeurs SAX (Simple Access to XML) appellent des fonctions enregistrées par le programme applicatif, à chaque fois qu'un élément ou qu'un attribut particulier est rencontré.

 

Processeurs SAX :

    * Paquetage Perl Expat de James Clark ;

    * Xerces d'Apache.

 

Les processeurs DOM (" DOM parsers ") sont le plus souvent rencontrés, une fois que les objets DOM sont maîtrisés. Ils permettent une navigation aisée dans un document, ils nécessitent cependant la présence du document entier en mémoire.

 

Les processeurs SAX (" SAX parsers ") présentent une interface de plus bas niveau mais ils sont plus performants (les processeurs DOM utilisent souvent un processeur SAX en interne).

 

- Cours à l'Université de Lille, 2020/2021 - -