BSDigital

Outil de reconnaissance de caractères (OCR)

Comment extraire les éléments d’une image et les analyser, afin d’obtenir une automatisation du processus de saisie ?

BSDigital est une startup qui développe un logiciel à base d’IA qui automatise la saisie des factures scannées.

L’objectif est d’en extraire les éléments comptables (date, fournisseurs, le taux de TVA, produits/services, … ) pour améliorer le processus de saisie.

Solutions / Approches : 

LumenAI a accompagné BSDigital en trois étapes : 

  1. Récupération d’un premier set de données de 10000 factures et mise en place d’algorithmes de machine learning à partir des résultats de leur outil de reconnaissance de caractères (OCR) pour prédire les éléments comptables.
  2. Test d’une approche Deep Learning par analyse des données sources (images) pour palier aux manques de performances de leur outil d’OCR ,
  3. Formation au machine learning et au deep learning à travers 3 jours sur site pour restituer les méthodes testées et les codes fournis.

Résultats : 

Notre solution a mis en évidence les bonnes performance de prédiction de nos algorithmes de machine learning classique.

L’approche en  Deep Learning a permis de former l’équipe technique et de fournir un premier pipeline que l’entreprise pourra réutiliser avec des dataset plus important.