Accueil / Blog / Métier / 2018 / Butinage de mai 2018

Butinage de mai 2018

Par Simon Georges publié 04/06/2018
Contributeurs : Régis Leroy
La veille de Makina Corpus sur ses technologies de prédilection.
Butinage de mai 2018

La vidéo du mois

Au début du mois a eu lieu la conférence Google I/O, et une des conférences est devenue indispensable à regarder pour les développeurs web, notamment ceux qui manipulent des frameworks front-end : comment créer un site Javascript facilement indexable par les moteurs de recherche :

Spoiler : pas tellement d'autre solution que ce que nous vous avons présenté dans cet article, mais vous apprendrez pas mal de petits détails intéressants sur le fonctionnement de l'indexation.

Machine Learning

Bien sûr, l'annonce du mois, c'est la sortie de l'IA de Google qui prend des rendez-vous pour vous : Duplex ([EN]). Mais au-delà de ces effets d'annonce, de nombreuses choses évoluent dans le domaine.

Notamment, on parle de plus en plus des "World Models", dont l'article fondateur est décomposé dans cet article de blog ([EN]) :

World Model

Mais le domaine de la compréhension de texte évolue également, avec ce mois-ci la publication de l'état de l'art de l'embedding de mots ou de phrases ([EN]) et la sortie d'UMLFiT ([EN]), un modèle pré-entrainé de fast.ai, qui nécessite beaucoup moins d'exemples pour entraîner un classifieur sur du texte.

Le traitement d'images n'est pas en reste, avec la sortie de GluonCV ([EN]), qui implémente les récents papiers de recherche de façon accessible aux nouveaux arrivants dans le domaine. Si vous entraînez les modèles, attention au volume de données à télécharger !

D'ailleurs, avec l'évolution et la progression des algorithmes de machine learning, les domaines commencent à fusionner, et on exploite désormais à la fois la reconnaissance d'images et la compréhension du texte, par exemple pour lire sur les lèvres à partir d'images ([EN]).

Et, parce que nous ne faisons pas que du Python à Makina Corpus, voici les équivalents Javascript des bibliothèques Python de data-science ([EN]).

Webmapping

Kepler.gl

L'avenir de la cartographie open source se prépare : Uber sort sa boîte à outil géospatiale open source Kepler.gl ([EN]), destinée à afficher des cartes avec une énorme volumétrie de données, éventuellement en 3 dimensions, avec un rendu plutôt soigné. À suivre absolument !

Mais l'article du mois, c'est probablement un article sur Loc2vec ([EN]) : l'utilisation d'embedding (en machine learning, sur le modèle du Word2Vec de Google) pour mesurer la ressemblance entre des tuiles raster, et même de réaliser des opérations arithmétiques dessus :

Tile embedding

Front-end

Ce mois marque la sortie de la version 6 d'Angular ([EN]), moins centrée sur le framework lui-même et plus sur l'outillage associé.

En attendant, il est temps de revenir aux fondamentaux : d'abord, un article sur les en-têtes HTTP ([EN]), et notamment, ceux que vous pouvez tranquillement supprimer ! Ensuite, une vidéo qui vous apprendra (et vous fera revoir) tout ce que vous devez savoir sur les cookies.

Divers

ABONNEZ-VOUS À LA NEWSLETTER !
Voir aussi
Butinage juillet 2018 Butinage juillet 2018 06/08/2018

La veille de Makina Corpus sur ses technologies de prédilection.

Butinage juin 2018 Butinage juin 2018 02/07/2018

La veille de Makina Corpus sur ses technologies de prédilection.

Butinage d'avril 2018 Butinage d'avril 2018 02/05/2018

La veille de Makina Corpus sur ses technologies de prédilection.

Butinage de mars 2018 Butinage de mars 2018 03/04/2018

La veille de Makina Corpus sur ses technologies de prédilection.

Butinage de février 2018 Butinage de février 2018 05/03/2018

La veille de Makina Corpus sur ses technologies de prédilection.