Ce dimanche se tenait l'AG de l'association Globenet à laquelle j'étais convié pour faire une présentation d'Ubuntu. Ce fut l'occasion d'obtenir « en live » les différentes questions suscitées par cette distribution, même si je m'attendais à une audience beaucoup moins érudite !
Billets
Accès rapide
Présentation Ubuntu à l'AG de Globenet
Posté dans les catégories : Conferences, Ubuntu, 4 commentaires.
Convertisseur de syntaxes wiki Dotclear à Dokuwiki
Le jour de l'unification des syntaxes wiki sera un grand jour. Voila le parfait exemple d'un défaut du monde du Logiciel Libre, toujours premiers pour dire qu'il faut appliquer les standards mais pas très doués pour en créer un... enfin bon j'avoue que je suis un peu énervé. Dans le cadre du transfert de certains billets de blogs sur le wiki de documentation d'ubuntu-fr on me demande souvent s'il n'existe pas un convertisseur pour passer d'une syntaxe wiki Dotclear à une syntaxe wiki Dokuwiki, c'est maintenant chose faite.
Posté dans les catégories : Python, Web, 17 commentaires.
N'hésitez pas à consulter les archives si vous en voulez plus !
Aide
Les archives mensuelles permettent de retrouver un contexte d'écriture, n'hésitez pas à utiliser le formulaire de recherche au besoin :
Pensées actuelles
Aucune pensée n'était archivée pour ce mois. Voici les dernières publiées.
Interview sur data.gouv.fr
J'ai été contacté pour répondre à une interview pour 20minutes, alors puisqu'on est dans l'ouverture autant publier mes réponses ici :-)
En quoi les internautes peuvent-ils être intéressés par data.gouv.fr ?
À mon sens, data.gouv.fr n'est pas destiné au grand public, il faut considérer chaque jeu de données libéré comme une fleur : les réutilisateurs de ces données brutes (dévelopeurs, hackers citoyens) vont pouvoir venir butiner les données qui leur semblent intéressantes, les croiser, en tirer le meilleur pour ensuite proposer des usages innovants aux utilisateurs finaux.
Data.gouv.fr est avant tout un catalogue fédérateur qui permet de regrouper les données issues des différentes instances de l'État, c'est une aide pour les potentiels réutilisateurs. On aurait pu s'attendre à un effort d'interopérabilité en ce sens grâce à l'usage de formats ouverts mais ça n'est pour l'instant pas le cas, peut-être lors d'une prochaine itération ?
Est-ce si important pour eux la transparence des infos ?
Je l'espère ! La transparence des information est l'un des piliers de la démocratie qui est plutôt mal en point en ce moment. L'initiative OpenData propose un tournant aussi important pour le citoyen que l'a été le Web 2.0 pour l'internaute : devenir acteur de sa cité, de sa nation alors qu'il se trouvait jusqu'alors dans un rôlé passif de consommation de la démocratie, un rôle de simple électeur, ce qui nous a mené à la situation actuelle d'incurie de l'État.
Cette ouverture des données va avoir un impact non négligeable sur les prochaines élections et on peut d'ailleurs noter par un pur hasard du calendrier que cette libération intervient à quelques mois d'une présidentielle… forçant le prochain quinquennat à poursuivre la démarche.
N'est ce pas trop difficile d'accès ?
Il y a 2 problèmes majeurs sur les données libérées par data.gouv.fr : la problématique des formats propriétaires employés qui freinent leur réutilisation et la qualité des données. Par qualité des données, j'entends à la fois la pertinence des informations mais également les liens qui peuvent être réalisés pour croiser ces informations. Les informations brutes n'ont qu'un intérêt très limité, c'est leur croisement qui permet de les valoriser. Si ces liens ne sont pas standardisés c'est chaque réutilisateur qui va devoir s'en charger et c'est extrêmement fastidieux.
C'était jusqu'à présent un problème de poule et d'œuf : peu d'outils de visualisation étaient disponibles (malgré les initiatives locales et internationales) car on manquait de données. Gageons que l'écosystème des données ouvertes français va mutualiser ses efforts dans un pur esprit de coopétition pour faciliter l'accès et la visualisation de ces données.
Le malaise ParisWeb
Je rebondis sur les ratés de ParisWeb par Karl et notamment sur l'aspect communautaire. J'ai toujours un arrière goût amer en revenant de cette conférence, je passe à chaque fois un excellent moment à retrouver des amis, à discuter jusqu'à pas d'heure, à admirer la qualité de l'organisation mais au final j'ai l'impression d'avoir occupé la place de quelqu'un qui aurait pu apprendre énormément plus du contenu des conférences et je trouve ça très dommage car le web a besoin de jeunes. (Dit comme ça, c'est super prétentieux, si je connais les sujets c'est surtout car je connais/suis les orateurs et je les ai souvent déjà vu à l'œuvre, que je me suis intéressé à ce qu'ils font, rien de plus). Or, des jeunes, il y en a de moins en moins j'ai l'impression, je suis pas loin de penser que la moyenne d'âge de ParisWeb prend une année par an et c'est terrible en terme de transmission. L'année prochaine je préférerais voir des places réservées aux jeunes plutôt que des pré-ventes pour les habitués qui n'apprennent finalement plus grand chose.
Cela étant dit, et puisque ce sont majoritairement des habitués qui vont lire ce texte, j'aime faire partie de cette communauté et je serais extrêmement frustré de ne pas prendre part à cette réunion annuelle pleine de joie, d'alc^W^amour et de trolls. J'avais évoqué l'idée d'un ParisWeb off à moitié sérieux cette année, il faudrait essayer de trouver un format hybride pour ne pas non plus que le fossé se creuse entre les jeunes et, mmmh…, les expérimentés, erm. Les deux parties ayant beaucoup à apprendre de ces échanges.
Ça met bien sûr à l'ordre du jour les objectifs de la conférence et là-dessus c'est plutôt au staff de s'exprimer, encore une fois c'est un malaise assez personnel, pas sûr qu'il soit partagé...
Note: pour les personnes qui ne sont jamais venues à ParisWeb, je critique ici certains points mais ça reste de loin ma conférence favorite, et vous devriez y aller l'an prochain, surtout si vous êtes jeune ;-). Qui aime bien châtie bien.
Retour sur mon intervention ParisWeb
J'ai eu la chance de pouvoir participer à ParisWeb en tant qu'orateur cette année au sujet de l'OpenData (un billet arrive pour résumer le fond), et ça ne s'est pas du tout passé comme je l'avais imaginé. Je souhaitais innover avec un format qui soit proche de la discussion (peut-être ambitieux avec autant de personnes dans la salle), partant d'une page blanche et d'un navigateur. Un format hybride : après un très rapide tour d'horizon de ce qui était déjà fait, la session se transforme en conférence dont vous êtes le héros avec des thématiques amenées par l'animateur qui sont ensuite discutées, sorte de ping-pong entre la salle et l'animateur. C'était la théorie du moins.
Car en pratique ça n'a pas du tout fonctionné pour différentes raisons :
- je n'ai pas énoncé les règles au début de mon intervention donc forcément personne n'a pu jouer le jeu, et du coup beaucoup ont dû se demander pourquoi une page blanche, manque de préparation ? ;
- j'ai perdu confiance dans ce format en commençant à parler, un peu à cause du stress, un peu par manque de confiance en moi, et du coup j'ai tenté de commencer par expliquer les thèmes que je voulais aborder, tous à la suite dans un enchaînement très brouillon et approximatif en repartant dans une configuration plus classique : exposé + questions.
Ce format n'était pas adapté au support prévu : je n'ai pas réussi à écrire tous les thèmes en les enonçant (les coupures discussions étaient aussi destinées à ça), je n'ai pas eu le temps de lire les notes que j'avais au sujet des thématiques (pareil), la discussion finale était assez plate alors qu'il y avait un potentiel énorme dans la salle. J'ai vécu ça très difficilement, et j'ai malheureusement le sentiment que ça a été partagé par la salle, je dois des excuses à toutes les personnes qui se sont retenues d'être méchantes sur twitter pendant une heure, par amitié :-). Au final, le fond a globalement été respecté mais la forme était désastreuse.
Le pire dans l'histoire c'est que je ne pense pas que le format imaginé soit mauvais, au contraire. Par contre j'aurais dû le tenter à plus petite échelle avant, ça m'aurait mis en confiance (ou ça l'aurait invalidé) et j'aurais pu affiner la façon de l'introduire à la salle. Je vous épargne ici le paragraphe sur le fait qu'on sort grandit de ses échecs blablabla, j'ai au moins un an pour ruminer tout ça et m'auto-flageller. N'hésitez pas à commenter si vous étiez présent (ou à m'envoyer un mail si vous n'aimez pas être méchant en public ;-)).
Nettoyer les données
Un petit extrait du dernier numéro de l'incroyable Nodalities magazine (il est toujours possible de s'abonner gratuitement pour recevoir la version papier) dans l'article consacré à l'initiative LinkedGov par Hadley Beeman :
A significant amount of work is required to clean and reformat the data, link it (both internally and with other datasets on the Web), and add metadata to make it understandable to users outside the team or public body that published it. Many entrepreneurs are dissuaded from creating new businesses on this data, put off by the months of overhead necessary to prepare the data before they can even begin coding an application.
Je pense que l'on va avoir besoin de tels outils/initiatives en France, dans la lignée de la checklist OpenData établie durant le Barcamp Bordeaux.
Retours à chaud sur SemWeb.Pro
En direct depuis un wagon de TGV, en revenant de SemWeb.Pro, la conférence dédiée au Web Sémantique. Du bon et du moins bon, comme toujours :
- Une introduction par Ivan Herman sur un état des lieux du Web Sémantique focalisé sur les nouveautés de SPARQL, RDFa et R2RML, ce qui était extrêmement pertinent compte tenu de l'auditoire. Rien à redire, ça réveille les neurones :-)
- Une série de 4 courtes interventions sur des solutions qui devaient montrer des concrétisation utilisant le Web Sémantique mais ça ne m'a pas plus que ça convaincu. Guillaume présentait EMFTriple, un Object Triple Mapper qui avait l'air sympa mais pour finalement conclure sur le fait que c'est uniquement un travail de recherche qui n'est pas (encore ?) utilisé ; Nicolas Chauvat présentait CubicWeb sur lequel je n'arrive toujours pas à accrocher, en tout cas le fait d'essayer de faire des sites de conférences avec ne sert pas l'image du produit à mon avis ; François Paulus a parlé de médiation sémantique mais n'a rien montré de concret ; Grégoire Burel a introduit le web sémantique pendant 10 minutes avant d'arriver à présenter Asterid dont la démo en ligne n'était pas opérationnelle et le code pas encore libéré. On peut mieux faire en terme de pragmatisme.
- La conférence de presse était intéressante et c'est vraiment dommage qu'elle n'ait pas été filmée vu la qualité des échanges et des informations, ça méritait d'être diffusé à plus large échelle. Quand je vois la façon dont c'est restitué derrière par les journalistes ça me désespère.
- La table ronde « Ouverture des données publiques » a été un carnage. Il y avait Pierre Audibert de l'INSEE qui n'avait aucune notion technique mais dont le maître mot était « on met à disposition beaucoup de données depuis longtemps ». Ça au moins c'est précis… Et je ne parle pas des méconnaissances de sa propre infrastructure puisqu'il n'avait vraisemblablement aucune idée de la mise à disposition de données en RDF sur le site de l'INSEE. On passait ensuite à Alain Chaumet pour l'IGN qui nous a fait l'apologie du GéoPortail. Quand on sait le fiasco que ça a pu être au lancement ça fait sourire, quand on voit les possibilités d'import/export et d'exploitation ça fait pleurer par contre. Heureusement il y avait Emmanuelle Bermes de la BNF pour remonter le niveau car là on commençait à sérieusement râcler le fond, enfin une approche qui montre une réflexion autour de la donnée et de ses possibles exploitations. Ouf, tout n'est pas perdu. Enfin Tangui Morlier pour Regards Citoyens c'était du connu, il a su rester très zen malgré certaines réactions limites, dommage qu'il n'ait pas plus parlé de NosDonnées (vs. NosDéputés). Bon avec un tel panel, ça pouvait difficilement être constructif, c'était juste consternant.
- Yves Raymond a enchaîné sur son travail à la BBC. Après ce à quoi on venait d'assister ça a été une grosse claque culturelle ! Excellente illustration de ce que l'on peut faire avec de l'agrégation sémantique pour générer des portails à la volée, ayant tenté de le faire il y a 3 ans pour un client je me sens plus que concerné par cette approche. J'étais un peu déçu qu'il ne parle pas plus de technique mais j'avais déjà lu ce que je voulais savoir par ailleurs. Merci de nous fournir enfin un exemple pertinent et rafraichissant !
- Thomas Steiner, chercheur chez Google a présenté un outil d'extraction de données sémantiques à partir d'une vidéo Youtube, ça aurait pu être intéressant mais les exemples étaient assez mal choisis du coup on avait du mal à comprendre l'intérêt de son projet, dommage.
- Jérôme Mainka a présenté le moteur de recherche d'Antidot et son affinage par facette, là j'ai un peu décroché car je réfléchissais à la pertinence d'une navigation pour le web des données en navigant via facettes, me demandant dans quelle mesure il était possible d'indexer en temps réel le web à n+1 relations : arriver sur une ressource, indexer toutes les relations relatives, proposer une exploration pertinente, cliquer sur une ressource, itérer.
- Olivier Rossel nous a parlé de son produit : Datao. J'ai un peu de mal avec l'ergonomie des interfaces présentées mais je salue le travail et l'initiative de vouloir rendre le web sémantique exploitable sans forcément avoir de notions techniques.
- On a terminé sur des lightning talks dont le rythme était soutenu et les interventions intéressantes. C'est ce qu'il faut après une journée chargée !
Niveau logistique sur place, du très bon boulot, vraiment. Bravo.
L'année prochaine, j'espère que des acteurs comme Owni, ou des villes ayant ouvert leurs données pourront être invités pour relever le débat dans les tables rondes ou tout simplement les personnes compétentes des organismes car il s'agit à mon avis plus d'une erreur de casting. J'espère également que des solutions pourront être présentées qui sont en production et qui fonctionnent bien, on manque de référence francophone en la matière. Et enfin WebID aura suffisamment évolué pour avoir quelques résultats intéressants à mon avis.
RSS et incompréhensions
Petite tempête dans un verre d'eau récemment car certains réalisent que l'icône RSS va disparaître de l'interface du navigateur Firefox pour sa version 4.
Petit aparté avant la suite : je n'utilise plus d'agrégateur depuis quelques temps car j'ai remplacé ma découverte de liens par Twitter qui est un filtre social que je trouve très pertinent.
RSS est l'exemple même d'une donnée serialisée qui a du mal à trouver une interface pertinente. Alors qu'il y aurait énormément à faire dans le domaine des navigateur pour exploiter cette donnée, quelques exemples en vrac :
- possibilité de représenter la home d'un site/blog avec un design propre à l'utilisateur/navigateur en exploitant les derniers articles listés dans le RSS ;
- possibilité d'afficher un billet de manière standard à l'utilisateur améliorant sa lisibilité, je ne liste plus le nombre de fois où la fonctionnalité lecteur de Safari sauve mes yeux car certains auteurs n'ont aucune notion de lecture prolongée à l'écran (et je ne parle pas des flocons qui tombent pour Noël...) ;
- possibilité d'améliorer la page d'accueil d'un navigateur, les Top Sites, Netvibes, etc ne sont pas allés assez loin dans ce domaine, surtout dans le filtrage et la pertinence des informations.
Alors RSS va-t-il mourir ? Est-ce qu'il a déjà véritablement vécu serait une question plus judicieuse à mon avis, il y a trop peu de travail fait en terme d'interfaces des données issues du web. Amorcer une réflexion comme le fait Mozilla est un premier pas mais c'est à mon avis orthogonal à une réflexion plus profonde sur le couple donnée/lien et sa représentation dans les navigateurs. Mais pour ça il faut encore avoir une force d'innovation.
Fascisme de perroquet
J'étais en train de me renseigner sur les Zone Autonome Temporaire remises au goût du jour par les réflexions sur WikiLeaks et j'ai été interpellé par ce commentaire critique de la TAZ par Luther Blissett en 1996 :
Écrire sans que personne ne te lise véritablement est déprimant. Se heurter à un mur de méfiance est tragique. Mais avoir des lecteurs trop facilement influençables est la pire chose qui soit. Ces lecteurs s'imaginent qu'il suffit de lire et de répéter comme des perroquets les formules les plus étranges ; leur véritable désir est en fait d'obéir à quelqu'un, de lire avec les yeux d'un autre, de se soumettre à l'autorité du « maître ». Fascisme de perroquet.
Je me demande si Internet ne favoriserait pas cette forme de fascisme (exacerbée par les ReTweets et autres J'aime). Pharmakon quand tu nous tiens…
Ce n'est pas la taille qui compte
On peut s'amuser à comparer qui a la plus grosse mais la libération des données c'est avant tout une histoire de qualité et de réutilisabilité. Or ceci n'est possible qu'en améliorant la manière de les publier en se basant sur des systèmes de notation simplistes, j'aimerais bien avoir le même tableau avec le nombre de jeux de données par nombre d'étoiles.
Publieurs de données, concentrez vous sur la qualité, pas la taille, les développeurs vous remercieront.