Tout juste sorti de votre école d’ingénieur voire de votre spécialisation en machine learning, votre première impulsion une fois propulsé dans le monde de l’entreprise est de vous imaginer collecter toutes les données de l’entreprise et de les mixer ensuite en un modèle de prévision ultra-sophistiqué multipliant la rentabilité de votre entreprise par dix (voire plus). Vous vous reconnaissez ? Ne vous inquiétez pas, tout le monde est passé par là ; votre premier gros projet de data science sera votre premier bizutage dans ce monde qui courbe malheureusement la plupart du temps l’échine au bon vieux pragmatisme opérationnel.
En effet, mon expérience dans la prévision a su me montrer que les modèles les plus simples étaient presque toujours les meilleurs en pratique. Pourquoi ? Nous allons le voir tout de suite…
I – Les modèles sophistiqués sont très intolérants aux petites variations structurelles
Si vous n’en êtes pas convaincus, essayez. Un modèle raffiné est un modèle qui implicitement amène avec lui des hypothèses sur les données, en somme, un modèle qui porte en lui une opinion beaucoup plus forte. Pour encore préciser : un modèle avancé va prendre plus de risque tout simplement parce que la minimisation concrète du risque dans un contexte inconnu est le choix médian (en supposant que la surestimation a le même impact négatif que la sous-estimation). Vous avez bien lu : il est très souvent difficile de battre un des estimateurs les plus puissants, à savoir la moyenne. Imaginons en effet un jeu dans lequel je doive choisir entre blanc et noir ou rien. Blanc et noir ont respectivement une probabilité d’apparition de 50%. Si je choisis rien, je suis sûr de perdre 50% de ma mise.
Statistiquement, vous allez me dire que tous les choix sont équivalents…statistiquement. Or, la réalité est que les décisions se prennent sur QUELQUES occurrences. Ce n’est pas sur 50000 commandes que je cherche l’équilibre mais là tout de suite ou dans un futur proche. Le choix ici est donc affaire de stratégie relative au risque. Qu’est-ce que le risque ? La probabilité de perdre d’une part mais aussi combien je perd. La sagesse ici dirait en réalité donc de ne pas jouer tout simplement.
Revenons en maintenant à notre modèle. Imaginons que le cas soit plus complexe. Par exemple, prenons un SKU qui semble démontrer une certaine saisonnalité instable avec des chutes chaotiques de ventes sans explication évidente (la « faute à pas de chance » en somme) et une tendance linéaire. Que donnerait d’après vous un réseau de neurones ou un ARIMA ? Il inférerait un pattern qui n’existe pas et prendrait une décision relativement extrême créant une amplitude de risque très forte alors qu’en réalité seule la tendance linéaire est prévisible. Rappelez-vous : le cerveau humain a tendance à surestimer l’existence de motifs dans les données, ses produits aussi. En réalité, une ligne serait un meilleur estimateur. Pragmatiquement même, en diminuant l’amplitude du surstock ou sous-stock, il diminuerait les risques financiers. Introduisez une valorisation de la perte et vous obtenez un optimum pragmatique.
II – Parce que les petites variations autour de la tendance importent peu
Disons le crûment : les petites oscillations n’ont aucune importance. Si elles en ont, un conseil : sous-stockez. Prenez l’occurrence minimale de votre série récente et vous aurez un meilleur estimateur que tout autre. Si elle n’en ont effectivement pas, relisez le paragraphe précédent et considérez ce qui suit.
Supposons que vous vendiez 100 unités d’un article par jour en moyenne. Que votre variance soit de 10 unités ou de 50, vous aurez de fortes chances de revendre ce stock de toutes manières. Si la tendance est claire, en réalité, il n’y a même pas besoin de prévision avancée : prenez la tendance. Il est plus risqué de multiplier par une saisonnalité incertaine que de choisir délibérément de subir un écart de stock contrôlé. Pourquoi ? Parce que la réalité est que ce qui importe n’est non pas de savoir que l’activité va se perpétuer comme hier mais d’anticiper une rupture totale de tendance. Imaginez que votre article passe d’une tendance de 100 à 1000. Aucun modèle du passé ne vous donnera ceci, jamais. Il est donc presque vain de chercher à prédire finement l’avenir et même dangereux. Parce qu’ici je vous ai parlé d’une tendance constante, mais imaginez extrapoler une tendance à la hausse et vous retrouver avec un effondrement des ventes. Que faites-vous de votre stock ? Il vous reste sur les bras.
En définitive donc, ce qui importe est l’intelligence du futur qui passe par une analyse du passé récent et du présent.
III – Parce que vous dépensez un temps précieux…qui pourrait vous servir à maîtriser la simulation décisionnelle
La réalité est donc que vous n’avez pas besoin de data scientist pour prévoir l’activité. J’ai moi-même testé les meilleurs algorithmes et outils commerciaux de prévision liés à la supply chain. Presque toujours, les résultats étaient en masse satisfaisants MAIS s’effondraient sur des petits cas générant des décisions catastrophiques si elles étaient exécutées de manière aveugle quand une simple moyenne augmentait la perte globale mais diminuait les surstocks locaux. Les opérationnels insistaient pourtant pour que je dépense de l’énergie (et la leur en recettes stériles) pour améliorer ce qui ne pouvait pas l’être ou très peu. Ils ne voulaient pas entendre que leurs moyennes étaient moins dangereuses en masse (toujours dans le cadre d’un traitement automatisé sur des centaines de milliers de références). Ils ne voulaient pas entendre que nos décisions influaient davantage que l’historique et qu’en fait la prévision devait être adjointe aux décisions et non agnostique de celles-ci.
Vraiment, cet effort est vain et vous pouvez lire la littérature qui généralement bénéficie de données presque trop belles pour être vraies : les modèles les plus basiques et anciens fonctionnent mieux. Recrutez donc plutôt un statisticien programmeur et vous aurez votre compte.
Gardez plutôt votre data scientist pour générer de l’intelligence du futur. Donnez lui les moyens de modéliser vos décisions, de capter les signaux faibles. Croyez-moi, vous en verrez les résultats !