- BeautifulSoup
-
BeautifulSoup Développeur Leonard Richardson Dernière version 3.0.4 (10 avril 2007) [+/−] Type Bibliothèque de parsage Licence Python Software Foundation License modifier BeautifulSoup est un parseur (X)HTML écrit en Python qui peut aussi être utilisé avec le XML. Il utilise des instances pour extraire le contenu des balises.
Si la page web soumise à BeautifulSoup est correctement formée, l'arbre la représentant est correct, mais si la page est mal formée (balise non correctement fermée par exemple) l'arbre lui correspondant sera généré à partir d'heuristiques qui sont les mêmes que celles utilisées par les navigateurs web pour traiter du code HTML/XML mal formé.
Lien externe
Voici la page où le développeur de BeautifulSoup, Leonard Richardson, présente son outil: page de BeautifulSoup. Un lien pour le téléchargement y est également disponible ainsi qu'un autre pour l'explication de son fonctionnement avec des exemples.
Wikimedia Foundation. 2010.