Overview

Artifact ID: 49a193510d7cb021f0e33cf2a7d7314bd02c7566
Ticket: 6a3e08659982bd4747ddab13ff302bf075709dd8
Extraction automatique de relevé bancaire depuis PDF
User & Date: bohwaz on 2019-10-05 22:37:41
Changes

  1. icomment:
    Permettre d'uploader un PDF et que les données en soient extraites en utilisant Tabula : [https://github.com/tabulapdf/tabula-java]
    
    Ligne de commande à utiliser :
    java -jar tabula-1.0.3-jar-with-dependencies.jar -g -r -u -p all Fichier.pdf
    
    Pour cela rajouter une directive de configuration pour indiquer le chemin vers le JAR de Tabula: Garradin\TABULA_JAR_PATH
    
    Ensuite Tabula renvoie sur STDOUT un CSV.
    
    Testé la conversion Tabula avec les relevés de compte du Crédit Mutuel : ça marche très bien ! Super pratique !
    
    Renvoyer ce CSV ensuite au module d'import comptable / rapprochement automatique à partir d'un CSV (à implémenter aussi).
    
    Ne pas oublier d'ignorer les lignes qui ne font que répéter les entêtes de colonnes, et les lignes de soldes et autres infos. Règles spécifiques à appliquer selon le PDF de la banque ? Plutôt essayer d'être intelligent et ignorer automatiquement si la colonne débit ou crédit est vide, ou si la colonne date ne contient pas seulement une date valide.
    
    Proposer ensuite à l'utilisateur de visualiser et valider les lignes à ignorer avant import réel.
    
  2. login: "bohwaz"
  3. mimetype: "text/x-fossil-plain"
  4. severity changed to: "Important"
  5. status changed to: "Open"
  6. title changed to:
    Extraction automatique de relevé bancaire depuis PDF
    
  7. type changed to: "Feature_Request"