hAtom - de la bombe!
Par biou le mercredi 14 décembre 2005, 11:42 - Web Sémantique - Lien permanent
Il y'a quelques temps j'ai bricolé un script pour importer un weblog 20six dans dotclear. Le résultat est ici : www.bloglaurel.com et semble s'être passé correctement.
Pour effectuer cet import j'ai dû réaliser un parseur permettant de récupérer toutes les informations des posts sur le blog 20six, le problème étant que le code html en sortie de 20six n'est pas terrible, d'autant plus que je ne savais pas que ce code dépendait du thème utilisé et le thème du blog que je devais importer était custom. Conclusion : mon parseur 20six est inutilisable pour l'import d'un autre blog que celui que j'ai importé.
Pour éviter ce genre de problèmes à l'avenir, je me suis un peu renseigné sur les formats d'échange de données de blogs (au minimum les posts avec toutes leurs métadonnées comme le titre, l'auteur, la date, les catégories...) et pour l'instant je n'ai pas trouvé grand-chose de convaincant. Il y'a un format textuel initié par MovableType d'export (spec ici), qui semble super rudimentaire et avoir pas mal de problèmes, notamment en terme d'encodage des caractères. L'avenir du blog semblant être au format Atom pour tout ce qui est de l'interopérabilité avec les blogs, atom offrant à la fois un format de syndication et une api web pour alimenter un blog, il semble possible d'utiliser aussi atom pour l'export et l'archivage.
En effet l'export et la syndication sont assez similaires, il faudrait juste pouvoir avoir des feeds qui aillent plus loin que 30 posts par exemple... C'est là qu'intervient hAtom. hAtom est un microformat, c'est-à-dire, pour faire simple, une structuration particulière des données d'une page web XHTML qui permet de retrouver facilement ses données dans un format connu, par exemple Atom, à l'aide d'une transformation xml, par exemple xslt.
Concrètement, qu'offre ce microformat?
avec hAtom, on peut structurer les pages web d'archive de son blog, par exemple en modifiant un tout petit peu le template, et on fournit un lien vers une transformation xslt dans les headers, pour info. Ainsi les archives du blog s'affichent toujours de la même manière pour les utilisateurs "normaux", mais on peut obtenir dorénavant des fichiers atom facilement à partir de ces pages, et mon problème d'export serait réglé.
Je vais sûrement tenter une implémentation de ces idées sur un thème dotclear et sur mon dotparking. Je vous tient au courant de l'avancement des travaux :)
quelques liens :
http://dannyayers.com/archives/2005/08/27/hatom-no-seriously/
http://dannyayers.com/archives/2005/11/24/hatom-draft/
http://weblog.burningbird.net/archives/2004/09/03/tool-independence-the-export-format/
http://semtext.org/atom/atom.html (pour les semantic-webbeux)
Commentaires