Méthode complète pour développer des systèmes de reconnaissance automatique de documents - Ouest Valorisation

Offre n°986

Méthode complète pour développer des systèmes de reconnaissance automatique de documents

L'innovation

L'innovation consiste en une méthode complète pour développer des systèmes de reconnaissances d’images de documents.
Elle est basée sur un langage de programmation, le langage EPF, qui permet de décrire le contenu graphique, logique et sémantique d’un type de document. Cette description se base sur différents indices visuels : perceptions de l’images à plusieurs résolutions, lignes de texte, résultats d’OCR, filets…

En fonction des besoins, la description d’un document peut prévoir de reconnaitre la structure complète de la page, d’extraire des champs précis, ou d’appeler des reconnaisseurs d’écriture sur des blocs de texte identifiés. A partir de cette description, l’analyseur de document est automatiquement généré par une phase de compilation.

La méthode a pu être appliquée dans des contextes variés : partitions musicales, registres militaires anciens, pages de presse, documents d’archives, courriers manuscrits, flux de documents hétérogènes (factures, prospectus, formulaires, courriers)…
La méthode a été validée à large échelle, sur plus de 700 000 pages de documents.

Ses bénéfices

  • La méthode employée est particulièrement adaptée pour pallier les limites des OCR (Reconnaissance Optique de Caractères) du commerce : analyse de documents manuscrits ; documents à structure complexe ; documents anciens dégradés ; pdf natifs ; etc.

Ses applications

  • Reconnaissance automatique d’images de documents
  • Documents anciens numérisés
  • Flux de documents administratifs
  • Pages de presse
  • Extraction de champs dans des formulaires
  • Documents à structure tabulaire
  • Documents pour les généalogistes
  • Documents pdf nativement numériques
1
Picto fusée
Stade de
développement
  • TRL7 - Pré-Production du prototype industriel
Picto recherche
Équipe
de recherche

INSTITUT DE RECHERCHE EN INFORMATIQUE ET SYSTEMES ALEATOIRES

Picto laboratoire
Laboratoire
de recherche

UMR 6074 - IRISA

Picto idée
Propriété
intellectuelle associée

FR : IDDN.FR.001.030028.002.S.A.2010.000.10400 - déposé le 07/05/2012

Créer une notification

Recevez les prochaines offres qui correspondent à vos besoins.

Conformément à la loi Informatique et Libertés du 06 janvier 1978 modifiée (voir Règlement Général sur la Protection des Données du 25 mai 2018), vous disposez d’un droit de rectification, d’opposition, d’effacement et portabilité de vos données. Vous pouvez exercer ce droit par email à l'adresse dpo@ouestvalorisation.fr. Pour en savoir plus sur notre politique de Gestion des données personnelles, vous pouvez consulter notre politique de confidentialité.

Merci pour l’intérêt que vous portez aux innovations proposées par la SATT Ouest Valorisation.
Nous ne manquerons pas de vous informer, par email, des futures innovations correspondant à votre besoin.
Pour toute autre demande, faites votre demande ICI.

Contactez-nous

Vous avez un projet innovant ? Laissez-nous vous aider à le concrétiser

Parlez-nous de votre projet