J'ai lu pas mal de choses marrantes ces derniers jours à ce sujet et je ne vais pas tirer sur l'ambulance mais plutôt essayer de montrer la stratégie qui accompagne Native Client (NaCl). Je ne suis pas anti-Google, derrière la peur que j'ai exprimé se cache vraisemblablement une certaine admiration aussi : ils ont une vision claire de l'évolution du web et de la place qu'ils vont y occuper.
Billets
Accès rapide
★ Choisissez votre avenir
Après avoir critiqué toute ma scolarité l'éducation française, notamment sur le manque d'interventions de professionnels, j'ai sauté sur l'occasion lorsque l'association de mon ancienne formation m'a invité la semaine dernière à aller parler à des étudiants de mon expérience un peu atypique. C'est une intervention qui a été difficile à préparer car elle m'a obligé à faire un bilan personnel sur mon parcours, à prendre suffisamment de recul pour trouver le bon message à faire passer. Après tout ça ne fait que deux ans que j'ai quitté l'école donc c'est assez marrant de venir en vétéran.
Posté dans les catégories : Bio Informatique, Conferences, 12 commentaires.
N'hésitez pas à consulter les archives si vous en voulez plus !
Aide
Les archives mensuelles permettent de retrouver un contexte d'écriture, n'hésitez pas à utiliser le formulaire de recherche au besoin :
Pensées
Revue de bandes dessinées
Ça change un peu du web de temps en temps et c'est la pleine saison :
- Dernier tome des Chroniques de la Lune Noire : quelle déception. Après une série exceptionnelle, seul le dessinateur a dû vraiment s'éclater dans ce dernier tome qui a un scénario proche de zéro. C'est tellement dommage, alors que tant de choses restent énigmatiques (la famille de Wismerhill, les buts de Lucifer et Methraton, etc). Ou alors c'est pour mieux vendre ensuite les Arcanes ? En tout cas quel gâchis de finir ainsi...
- Dernier tome de Lanfeust des Étoiles : bon là aussi panne de scénario et fin bâclée alors qu'il y avait un potentiel énorme. Les séries estampillées Troy deviennent vraiment des pompes à fric : histoires totalement décousues, moins de blagues, planches bâclées (même sentiment avec le deuxième tome des Conquérants de Troy). Re-déception donc.
- Tome 31 de Thorgal, ou tome 2 de Jolan ? On sait plus mais le principal c'est que ça reparte parce que la série commençait à sérieusement s'essouffler. L'arrivée de sang neuf a fait beaucoup de bien et on retrouve la magie de certains tomes parmi les meilleurs, merci Y. Sente pour ce nouveau cycle.
- Tome 8 du Scorpion : avis partagé sur ce tome où l'on apprend des choses mais le dénouement tarde à arriver (en fait je l'ai lu en pensant que c'était le dernier). C'est dommage car j'aime beaucoup l'histoire, j'espère que ça ne dépassera pas les 10 tomes...
- Les Gouttes de Dieu : on termine avec un manga découvert récemment et qui mérite à être plus connu. L'histoire est à déguster pour les amateurs de vins qui souhaitent en apprendre un peu plus sur l'œnologie. Le scénario tient la route et c'est une vraie mine d'informations intéressantes pour arriver au meilleur mariage sur votre table. À consommer sans modération :-).
Bon bout d'an !
ADN, web et confidentialité
Pour répondre à David P. en commentaire, j'ai du mal à cautionner l'utilisation de l'ADN sur le terrain glissant de la gestion de l'identité mais il faut bien voir que c'est déjà possible en ligne !
Plus inquiétant dans le domaine (via sebsauvage), il semblerait qu'une base de données de l'ADN directement prélevé sur les nouveaux-nés voit le jour à des fins plus que douteuses (mais non enfin c'est pour la recherche). « Yes, we can! » qu'ils disaient... il serait peut-être temps de rebooter l'Amérique ? (si quelqu'un l'a lu, retours bienvenus).
[edit du soir] : si quelqu'un sachant lire le suédois pouvait me confirmer la traduction approximative de ce billet, notamment :
Le fait est que, depuis 1975, un échantillon de sang a été prélevé sur un total de nouveau-né en Suède, cet échantillon est utilisé pour la recherche sur Phénylcétonurie (PKU) et est stocké à utiliser dans la recherche future. Au total, environ 3,3 millions de Suédois ont des échantillons de sang dans ce registre.
Différencier Web Sémantique et Open Stack
Gautier me faisait judicieusement remarquer que je parle souvent d'OpenID et consorts dans mes billets relatifs au Web Sémantique et que ça n'en fait pas partie au sens strict, comprendre W3C du terme. Je suis tout à fait d'accord et je ne voudrais pas ajouter de confusion dans un domaine qui est bien assez compliqué comme ça.
Je distingue (entre autres) :
- des moyens de modélisation (RDF), de définition (OWL) et de requêtage (SPARQL) des données qui sont gérés par le W3C sous l'appellation Web Sémantique ;
- des protocoles d'identification (OpenID) et d'accès (OAuth) à ces données qui sont gérés par l'OpenWeb Foundation sous l'appellation Open Stack.
Partant de ce constat, j'hésite à utiliser le terme web sémantique (sans majuscules) cher à la communauté des microformats ou web des données liées ou finalement web, tout simple mais mois explicite. Finalement c'est très clair dans ma tête mais quel terme est-ce que vous préféreriez que j'emploie pour être le plus compréhensible possible ?
Nombre d'occurences d'un mot dans un texte en Python
Juste un petit snippet car j'en ai eu besoin récemment pour faire des statistiques sur des termes recherchés et je pense que ça peut être utile :
from itertools import groupby
def word_frequencies(content, blacklist):
"""
Count the number of words in a content, excluding blacklisted terms.
Return a generator of tuples (count, word) sorted by descending frequency.
Example::
>>> song = 'Ob la di ob la da "rla di da" da "da"'
>>> for count, word in word_frequencies(song, ['di']):
... print "%s %s" % (count, word)
...
4 da
2 la
2 ob
1 rla
"""
sorted_words = sorted(word \
for word in content.lower().replace('"', '').split() \
if word not in blacklist)
return ((len(list(group)), word) for word, group in groupby(sorted_words))
if __name__ == "__main__":
import doctest
doctest.testmod(verbose=True)
À adapter selon votre convenance, si vous avez mieux je suis preneur, comme toujours.
La documentation Django en local (html et pdf)
Le billet de NiKo m'a rappelé que Glooze voulait avoir un pdf de la documentation de Django, ça prend 3 minutes (ou 3 heures, ça dépend de votre connexion et de votre processeur).
Pré-requis
- installer sphinx (easy_install sphinx ou avec votre méthode préférée) ;
- installer latex (avec MacTeX ou avec une bonne doc si vous êtes sous mac, dans les deux cas c'est looooong).
Si vous êtes sous une distribution GNU/Linux ça devrait être plus rapide avec votre gestionnaire de paquets préféré, oui OS X a bien du retard à ce niveau là...
3 étapes
- récupérer les sources de Django et les décompresser ;
aller dans le dossier docs et lancer la commande sphinx-build appropriée, pour la version html : sphinx-build . build_html
et pour la version pdf : sphinx-build -b latex . build_latex
générer le pdf à partir du latex : latex build_latex/django.tex django.pdf
Et voilà, vous avez un pdf de la documentation Django qui fait 700 pages et qui n'est pas super bien mis en forme (notamment le code...) mais ça peut dépanner. Si vraiment ça vous passionne, vous pouvez faire votre propre feuille de styles qui s'applique lors de la conversion mais bon j'ai déjà du mal à voir un intérêt au pdf... la version html est beaucoup mieux !
À ce sujet, Python 3 est sorti aujourd'hui, on va voir s'il est envisageable de sortir une version non compatible (nativement) avec la précédente sans tuer un langage, en tout cas les gros projets commencent à définir des roadmaps. La migration est grandement facilitée par l'utilitaire 2to3 et par les warnings affichés lors de l'utilisation de votre code avec Python 2.6, ça devrait pas être si terrible ;-).
Interfaces et promotion du Web Sémantique
C'est un des principaux défauts et heureusement ça bouge pas mal dans ce domaine en ce moment :
- une interface d'exploration en 3D des contenus SIOC assez délirante, je n'ai pas l'impression que tout fonctionne très bien mais en tout cas c'est innovant (regardez la vidéo) ;
- une interface simple pour créer son profil FOAF, l'avantage c'est qu'ils expérimentent sur la plateforme le FOAF+SSL dont je parlais précédemment, attention c'est en cours de développement ;
- une proposition pour intégrer OpenID dans le navigateur, c'est exactement ce dont je parlais avec Paul lors de Paris-Web ;
- Nepomuk et le bureau sémantique semblent bien progresser, il faudra que je me replonge là-dedans un de ces jours ;
- et pour finir un peu de technique avec l'article Building Semantic Web CRUD operations using PHP qui reprend notamment les bases pour faire de la création, récupération, mise à jour et suppression avec SPARQL, bon à savoir même s'il existe des ORM pour ça aussi :-).
24ways, le calendrier de l'Avent des geeks web
Comme chaque année depuis maintenant 4 ans, j'attends ce moment avec impatience, 24ways est de retour avec un nouveau design pour le plus grand bonheur des développeurs web !