Offre n°986
L'innovation consiste en une méthode complète pour développer des systèmes de reconnaissances d’images de documents.
Elle est basée sur un langage de programmation, le langage EPF, qui permet de décrire le contenu graphique, logique et sémantique d’un type de document. Cette description se base sur différents indices visuels : perceptions de l’images à plusieurs résolutions, lignes de texte, résultats d’OCR, filets…
En fonction des besoins, la description d’un document peut prévoir de reconnaitre la structure complète de la page, d’extraire des champs précis, ou d’appeler des reconnaisseurs d’écriture sur des blocs de texte identifiés. A partir de cette description, l’analyseur de document est automatiquement généré par une phase de compilation.
La méthode a pu être appliquée dans des contextes variés : partitions musicales, registres militaires anciens, pages de presse, documents d’archives, courriers manuscrits, flux de documents hétérogènes (factures, prospectus, formulaires, courriers)…
La méthode a été validée à large échelle, sur plus de 700 000 pages de documents.
INSTITUT DE RECHERCHE EN INFORMATIQUE ET SYSTEMES ALEATOIRES
UMR 6074 - IRISA
FR : IDDN.FR.001.030028.002.S.A.2010.000.10400 - déposé le 07/05/2012
Recevez les prochaines offres qui correspondent à vos besoins.
Conformément à la loi Informatique et Libertés du 06 janvier 1978 modifiée (voir Règlement Général sur la Protection des Données du 25 mai 2018), vous disposez d’un droit de rectification, d’opposition, d’effacement et portabilité de vos données. Vous pouvez exercer ce droit par email à l'adresse dpo@ouestvalorisation.fr. Pour en savoir plus sur notre politique de Gestion des données personnelles, vous pouvez consulter notre politique de confidentialité.