Ticket UUID: 6a3e08659982bd4747ddab13ff302bf075709dd8
Title: Extraction automatique de relevé bancaire depuis PDF
Status: Open Type: Feature_Request
Severity: Important Priority:
Subsystem: Resolution:
Last Modified: 2019-10-05 22:37:41
Version Found In:
Target version:
User Comments:
bohwaz added on 2019-10-05 20:37:41:
Permettre d'uploader un PDF et que les données en soient extraites en utilisant Tabula : [https://github.com/tabulapdf/tabula-java]

Ligne de commande à utiliser :
java -jar tabula-1.0.3-jar-with-dependencies.jar -g -r -u -p all Fichier.pdf

Pour cela rajouter une directive de configuration pour indiquer le chemin vers le JAR de Tabula: Garradin\TABULA_JAR_PATH

Ensuite Tabula renvoie sur STDOUT un CSV.

Testé la conversion Tabula avec les relevés de compte du Crédit Mutuel : ça marche très bien ! Super pratique !

Renvoyer ce CSV ensuite au module d'import comptable / rapprochement automatique à partir d'un CSV (à implémenter aussi).

Ne pas oublier d'ignorer les lignes qui ne font que répéter les entêtes de colonnes, et les lignes de soldes et autres infos. Règles spécifiques à appliquer selon le PDF de la banque ? Plutôt essayer d'être intelligent et ignorer automatiquement si la colonne débit ou crédit est vide, ou si la colonne date ne contient pas seulement une date valide.

Proposer ensuite à l'utilisateur de visualiser et valider les lignes à ignorer avant import réel.