Probably veut fiabiliser l’IA, avec 9 M$ et des modèles plus petits

Bureau de startup avec tableau de tests IA
Image d'illustration. Probably lève 9 M$ pour fiabiliser l'IA. — ADN

La startup Probably boucle environ 8 M€ (9 M$) pour traquer les erreurs des LLM avec un système de validation déterministe, moins coûteux et plus précis.

En bref

  • Probably lève environ 8 M€ (9 M$)
  • Sa couche de validation bloque les erreurs des LLM
  • Des modèles plus petits suffisent, donc moins de coûts

En IA, la bataille ne se joue pas seulement sur la puissance. Elle se joue aussi sur la fiabilité et sur la facture. C’est là que Probably tente de se faire une place, avec une levée d’environ 8 M€ (9 M$) en seed auprès de Andreessen Horowitz.

Une levée modeste, mais un angle très concret

L’idée de Probably est simple sur le papier, moins simple à exécuter. La startup veut empêcher les hallucinations et les erreurs factuelles des LLM d’arriver jusqu’à l’utilisateur. Peter Elias, son fondateur, vise un niveau de précision de 99,99%, soit le standard qu’on attend de systèmes déterministes, pas d’un modèle génératif.

Et c’est justement le point intéressant. Là où pas mal d’acteurs poussent des modèles toujours plus gros, Probably part du principe qu’il faut surtout revoir l’ingénierie autour du modèle.

Le vrai produit, c’est la couche de contrôle

Son premier produit cible la data science. L’outil doit fournir des réponses rapides à partir de jeux de données complexes, avec une citation et une trace d’audit sur la manière dont la réponse a été construite.

Mais le cœur du système est ailleurs. Peter Elias décrit l’ensemble comme une sorte d’armure logicielle pour la data science. La première réponse du LLM passe dans un validateur déterministe, qui renvoie toute sortie ne correspondant pas au dataset. Point clé, le LLM a été entraîné face à ce validateur, et l’ensemble a été optimisé pour aller vite tout en restant précis.

Résultat ? Une IA moins libre, mais beaucoup plus cadrée. Et, pour des usages métiers, c’est plutôt une bonne nouvelle.

Pourquoi des modèles plus faibles peuvent suffire

Peter Elias explique, en substance, que plus l’ingénierie de contrôle est bonne, moins le modèle a besoin d’être puissant. Il résume ça ainsi : « Plus votre ingénierie d’encadrement est bonne, plus le modèle peut être faible ». En gros, si le contexte est suffisamment affiné, le modèle a moins d’ambiguïté à gérer.

Ce choix permet à Probably d’utiliser un modèle présenté comme quatre classes en dessous des modèles de pointe. Et donc de l’exécuter en local, sur un ordinateur de bureau plutôt que dans un datacenter. À l’heure où le coût des tokens grimpe, ce n’est pas un détail.

Un signal pour les usages sensibles de l’IA

Le timing compte. Beaucoup de clients revoient leurs budgets IA, justement parce que l’inférence coûte cher et que corriger les sorties ajoute encore du coût humain.

Probably ne limite pas son moteur à la data science. La même mécanique pourrait s’étendre à la comptabilité ou aux services médicaux, bref à tous les cas où la précision compte vraiment. Peter Elias glisse aussi que les grands laboratoires d’IA n’ont même pas essayé cette voie, car leur modèle économique ne les pousse pas à réduire le nombre de corrections. C’est une pique, quand même, mais elle dit quelque chose du marché actuel.