Makina Blog

Le blog Makina-corpus

Rétro(pro)spective


Que faut-il retenir de l'année 2018, et qu'attendre de 2019 ?

Nous dérogeons ce mois-ci à l'habitude, et plutôt que de vous proposer un de nos habituels butinages mensuels, nous vous proposons de revenir sur ce qui a d'après nous marqué l'actualité de nos technologies en 2018, et ce que nous prévoyons / imaginons pour 2019.

Le sujet de l'année

À moins de vivre dans une cave, vous avez constaté que le 25 mai 2018 a marqué un changement majeur dans le comportement des sites web. C'est en effet à ce jour que le Règlement Général sur la Protection des Données est vraiment entré en fonction (en fait, que les sanctions sont devenues possibles).

Si les sites n'ont pas du tout arrêté d'utiliser des trackers ou des publicités, cela a par contre révélé parfois l'étendue du désastre de ce système sur certains sites (notamment de médias), en exposant publiquement le nombre de scripts tiers utilisés.

L'objectif majeur du RGPD était de redonner aux utilisateurs le contrôle sur leurs données personnelles. C'est un texte jurisique assez technique, qu'heureusement NextInpact a décortiqué pour nous. La CNIL fournit également de nombreux outils pour vous accompagner.

D'un point de vue technique, pour la plupart des sites vitrines, il y a peu d'enjeux, dès lors que vous n'utilisez pas de scripts tiers et que vous ne collectez pas de données personnelles (mais vous ne le faites pas, n'est-ce pas ?).

2018 pour nos technologies

PHP

La branche 5.x maintenant très ancienne est enfin abandonnée, ce qui permet enfin de profiter pleinement des apports des versions 7.x (puisque la 7.0 est également abandonnée). Les versions s'enchaînent, et on attend avec impatience la version 7.4 en 2019 qui apportera notamment le typage des attributs de classes.

Symfony

Même si la version 4.X et Flex sont sortis fin 2017, l'année 2018 a vu de nombreuses améliorations comme : 

Drupal

La nouvelle majeure de l'année 2018 pour Drupal est probablement l'annonce concernant la sortie de Drupal 9 en 2020. Cela va permettre d'impacter vos décisions pour les lancements de projets pour les mois / années à venir :

L'idée majeure est de faciliter sur le long terme les évolutions du logiciel en se calant petit à petit sur les sorties de versions de Symfony (dont certains composants forment depuis Drupal 8 la base du CMS), et de communiquer plus efficacement sur les nouvelles versions de Drupal pour permettre aux projets d'entreprise de maîtriser leur calendrier.

Drupal poursuit donc son objectif de se concentrer sur les projets "ambitieux" des SI.

D'un point de vue plus technique, Drupal continue de développer ses possibilités d'APIs avec en 2019 l'intégration dans le cœur d'une couche de web services basée sur la JSON:API, là encore avec l'objectif de rester pertinent dans des technologies web en mouvement.

Python

2018 a marqué (enfin) la reconnaissance de Python comme langage majeur du développement informatique aujourd'hui, notamment grâce à l'énorme croissance de machine learning.

Il est d'ailleurs temps pour vos développements de définitivement passer à Python 3.

2018 est aussi l'année de changements dans les communautés, tant Python que Django ([EN]).

Cartographie

Les architectures cartographiques ont beaucoup évolué ces dernières années, et l'article de l'année sur le sujet est probablement "Our Modern FOSS Spatial Stack" ([EN]). Nous préparons notre propre version de cet article pour vous permettre de vous mettre à niveau sur le sujet.

2018, c'est aussi la confirmation d'OpenStreetMap comme données de références pour de nombreux secteurs, tant publics (transport, par exemple) que pour de gros acteurs privés. Nous l'avions déjà remarqué de part la forte présence des collectivités au State Of The Map France qui avait lieu à Bordeaux cette année, seront-ils toujours aussi nombreux en 2019 ? Réponse au prochain SOTM Fr à Montpellier du 13 au 16 juin.

Ces gros acteurs privés contribuent d'ailleurs également en proposant leurs bibliothèques cartographiques en open source. Uber a en effet sorti en 2018 l'application Kepler, construite avec la bibliothèque Deck.gl et Mapbox. Kepler offre de nouvelles possibilités d'affichage afin d'explorer rapidement de large jeux de données.
 

Visualisation des données des migrations résidentielles en France, en 2013 (source : Insee)

Machine Learning

D'un point de vue technique 2018 marque (enfin !) le développement massif des modèles utilisables en traitement du langage (Natural Language Processing).

En effet, si le traitement des images par des réseaux neurones fonctionne depuis quelques années, avec de nombreux modèles connus, maîtrisés dans l'état de l'art, ce n'était pas le cas pour le NLP jusqu'à maintenant.

Cette année a vu de nombreuses avancées majeures dans le domaine ([EN]). On peut citer notamment BERT, proposé par Google, qui risque de bouleverser pas mal l'éco-système NLP :

L'architecture de BERT est basée sur un encodeur (partie gauche de l'image) et un décodeur (partie droite de l'image). Les spécificités du modèle sont notamment :

  • Un modèle bi-directionnel (par rapport à la plupart des modèles NLP qui vont de la gauche vers la droite) ;
  • Un modèle qui fait de la prédiction de phrase (et pas seulement de mot dans une phrase).

2019, l'année du logiciel libre ?

Microsoft, dont la nouvelle majeure de 2019 est le rachat de GitHub, est désormais le principal contributeur mondial open source.

D'autres sociétés, comme Uber ci-dessus, produisent une large partie de leur travail sous licence libre, comme par exemple des bibliothèques de visualisation.

Dans le domaine de l'intelligence artificielle, l'intégralité des papiers sont disponibles, de nombreux exemples de code sont disponibles sur GitHub et tous les frameworks (en tout cas, tous ceux qui sont principalement utilisés) sont sous licence libre.

Pourtant si l'open source directement utile au monde de l'entreprise avance, le logiciel libre au service des citoyens lui, souffre d'un manque de contribution flagrant, en témoigne le peu de contributions pour nombre de logiciels grand public tels que Gimp (liens à ajouter). Et si cette année vous contribuiez au libre, comme à l'Université Technologique de Compiègne à l'occasion de projets d'étudiants ?

Décentralisation ?

Mastodon va-t-il réussir à s'imposer au détriment de Twitter ? L'utilisation de PeerTube va-t-elle se répandre ? Solid (encore un projet open source) va-t-il profiter de la notoriété de son créateur pour percer dans le paysage ?

Éthique & Vie privée

On l'a vu avec le RGPD et le machine learning, les problématiques éthiques et le respect de la vie privée, autrefois souvent ignorés, sont désormais (ou devraient désormais) être pris en compte de façon plus systématique. Des articles comme celui sur les ratés de la reconnaissance faciale au pays de Galle montrent qu'à mesure que les découvertes dans le domaine de l'IA sortent des laboratoires pour venir s'installer dans notre quotidien, des questionnements apparaissent.

Dans le domaine médical où le Machine Learning est à l'origine d'avancées précieuses, des travaux sont menés pour permettre une anonymisation des données qui inciterait les patients à être moins réticents sur leur utilisation.

À Nantes, Makina Corpus participe à NaonedIA, un collectif regroupant chercheurs et entreprises afin d'impulser une dynamique territoriale dans le domaine de l'IA. Et avant même de vous parler de techniques, ce sont les principes éthiques de cette initiative qui sont mises en avant.

Enfin gageons que les logiciels open-source, par les possibilités d'audit de code et de vérification d'échanges de données qu'ils permettent, devraient avoir leur carte à jouer. Car au delà de l'exploitation des données, l'IA soulève le problème de contrôler ce que réalise réellement ces algorithmes qui prétendent révolutionner nos vies.

Conclusion

Voir que nos langages (Python, notamment) et nos valeurs (éthique, respect de la vie privée) deviennent enfin des sujets majeurs de préoccupation dans le monde technique ne peut que nous réjouir.

Pour vous mettre à niveau sur les enjeux de 2019, n'hésitez pas à suivre nos formations Python ou Machine Learning!

Formations associées

Formations Python

Formation Python

À distance (FOAD) Du 29 janvier au 2 février 2024

Voir la formation

Formations IA / Data Science

Formation Machine Learning

Nantes Du 2 au 4 avril 2024

Voir la formation

Formations IA / Data Science

Formation Initiation au Python scientifique

Nantes Du 25 au 27 mars 2024

Voir la formation

Actualités en lien

Image
Drupal 7 - 8 et 9
27/05/2020

Drupal 9 : préparez-vous !

Dans quelques jours, le 3 juin 2020, aura lieu la sortie de Drupal 9 en version stable. À quels changements s’attendre ? Quel sera l’impact sur les sites développés actuellement en Drupal 8 et Drupal 7 ? Voici quelques informations qui vous permettront de mieux appréhender cet événement et d'en mesurer les impacts.

Voir l'article
Image
Bruxelles_mobilité_drupal
18/09/2017

Retour d'expérience sur la réalisation d'un portail Drupal mêlant cartographie et Open Data

Utilisation de Drupal comme outil centralisateur de flux.

Voir l'article
Image
2rever
30/05/2017

Initiation au Machine Learning avec Python - La théorie

Dans ce tutoriel en 2 parties nous vous proposons de découvrir les bases de l'apprentissage automatique et de vous y initier avec le langage Python. Cette première partie se veut non technique et présente les concepts du Machine Learning, les différents types d'apprentissage et leurs principaux algorithmes. Il situe enfin Python dans cet univers en présentant les nombreuses librairies à votre disposition pour aborder cette discipline.

Voir l'article

Inscription à la newsletter

Nous vous avons convaincus