jeudi 25 février 2016

La génétique du big data : un risque pour le futur ? Dotons nos machines de résilience collective.

Comme vous probablement, je vois la percée dans le monde agricole de nouvelles solutions numériques et les bénéfices qu'elles peuvent apporter à leurs utilisateurs. Plus particulièrement, les gains d'efficience productive : la bonne action, dosée de manière optimale et au bon moment. Cependant, il convient de s'interroger sur les effets de bord de ces algorithmes et sur "la diversité de leur génétique". Le machine learning est souvent au coeur de ces dispositifs d'optimisation. Cette approche repose sur l'historique. Jour après jour les algorithmes essaient de s'affiner à partir des situations, des actions qui ont été menées et des résultats de ces actions. Ainsi dans une même situation, les actions sous-optimales à un instant donné seront progressivement gommées et les résultats maximisés. Le marchine learning fonctionne sur le principe d'un thermostat intelligent que s'adapterait parfaitement à la température extérieure et son évolution future pour apporter au moindre coût le confort thermique aux résidents d'un logement ou d'un bureau selon leur souhait de température optimale.

Nous sommes coutumiers de ces processus de sélection. Les agronomes ont, depuis des années, sélectionné les variétés végétales et les races animales les plus productives, les plus adaptées aux conditions du moment. Cette adaptation a pour conséquence une certaine forme d'appauvrissement de la diversité génétique. C'est ainsi que plus de 2000 platanes d'une grande proximité génétique ont été plantés en bordure du canal du midi. Malheureusement, ils sont aujourd’hui atteints d'une maladie qui semble incurable. Certains esprits, probablement à juste titre, ont considéré qu'avoir planté il y a plusieurs décennies maintenant les arbres les plus performants de l'époque, et donc des arbres d'une grande proximité génétique, a été une erreur. La diversité génétique aurait pu être une meilleure solution en regard de la situation actuelle. On ne refait pas l’histoire, mais on doit s’en inspirer et en tirer les leçons.  

L'analogie entre un algorithme et un arbre est certes loin d'être parfaite. Elle est peut-être même incorrecte. Cependant, nous devons nous interroger sur la possibilité de ces algorithmes à proposer des actions optimales même dans des conditions extrêmes (marginalement observées) ou des situations inattendues. Pour qu'ils soient en mesure de le faire, il faut, compte tenu de leur fonctionnement actuel, qu'ils soient soumis à ces types de situations et en nombre suffisant. C’est ainsi qu'ils apprennent. Cependant, la caractéristique principale de ces conditions est justement leur faible fréquence, voir même leur absence dans l’historique. On peut donc anticiper des réactions algorithmiques inappropriées dans ces conditions marginales. La génétique des algorithmes va jouer aussi un rôle important. Si dans ces conditions tous les algorithmes déployés dans l’ensemble des systèmes agricoles sont identiques, les réponses, bonnes ou mauvaises, seront probablement identiques. Comme les algorithmes doivent être confrontés à une diversité des couples ( contexte, action), leur degré d'apprentissage sera extrêmement limité, insignifiant. Si l'on anticipe, avec le changement climatique, un accroissement de situations inattendues, il pourrait être judicieux de s'assurer que l'ensemble des algorithmes déployés sont suffisamment différents pour proposer une diversité de solutions, certaines bonnes et d'autres moins bonnes, pour ainsi apprendre de cette diversité. Ils devront également être alors en mesure d'échanger leurs résultats pour apprendre plus rapidement les uns des autres, une forme d'apprentissage collectif entre machines. 

Une piste complémentaire consiste à mettre en expérimentation, c’est-à-dire au laboratoire, des situations extrêmes, puis de multiplier les réponses à ses situations. Cela permettra de nourrir les algorithmes d'un ensemble d'informations riches et suffisamment variées pour permettre aux machines à apprendre le mieux possible. Ici aussi, la dimension collective sera primordiale.

Poursuivons quelques instants ! Un second danger peut affecter nos machines : la cybercriminalité ! Un moyen de détruire un système productif est de s'attaquer à son système de pilotage. Certaines intrusions sont difficiles à détecter, par exemple, si le système touché fonctionne encore, mais de manière sous-optimale. Là aussi, la diversité génétique des machines devrait pouvoir jouer un rôle ! La collaboration entre machines pourrait aussi s'avérer particulièrement prometteuse, chacune transmettant ses prédictions à une autre pour s'assurer ainsi de son bon fonctionnement

Aucun commentaire:

Enregistrer un commentaire

Les carnets du blog les plus consultés

Membres