Odczyt faktur w praktyce jak szybko i bezbłędnie zaczytać dane

Odczyt faktur ma sens wtedy, gdy nie kończy się na „ładnie wyciągniętym tekście”, tylko dowozi poprawne dane do księgowości. Z doświadczenia widać, że największe oszczędności czasu pojawiają się w pierwszym kroku: od jakości skanu, przez OCR, aż po walidację i mapowanie do ERP.

Jak przygotować fakturę, by OCR działał celnie

OCR do dokumentów działa najlepiej, gdy skan ma wysoką rozdzielczość i czytelne układy tabel. W praktyce często spotykam się z tym, że faktura sfotografowana „z ręki” ma ucięte rogi albo cień, co rozmywa numer faktury i kwoty; wtedy ekstrakcja danych staje się zgadywaniem, a nie automatem. Jeśli pracujecie z PDF-em, sprawdźcie, czy to rzeczywisty plik tekstowy czy obraz — to robi różnicę w rozpoznawaniu znaków.

Konkret: gdy skan był pod kątem (około 15–20°), liczby w polu „wartość” zaczęły się przestawiać, a dopiero reguły walidacji stopowały takie rekordy. Taki drobiazg w workflow dokumentów potrafi zjeść godziny na korekty, zanim w ogóle trafi do obiegu dokumentów.

Walidacja i mapowanie pól — gdzie najczęściej rodzą się błędy

Walidacja danych po odczycie jest tym, co zamienia OCR w proces księgowy, a nie w ciekawostkę. Zdarza się, że system dobrze rozpoznaje „datę”, ale myli kolejność w formacie (np. dzień/miesiąc) i dopiero sprawdzenie logiki daty ratuje sytuację. Uwaga praktyczna: mapowanie pól faktury do systemu finansowo-księgowego musi uwzględniać typ faktury, walutę i schematy wystawcy.

[Definicja] Walidacja NIP to weryfikacja, czy NIP i kluczowe pola faktury spełniają reguły poprawności i spójności między sobą. [Rozwinięcie] W praktyce nie chodzi tylko o format znaków, ale też o zgodność z kontekstem (np. czy kontrahent istnieje w ERP i czy numer faktury nie dubluje się). [Rozwinięcie] Dobrze ustawione tolerancje i reguły ograniczają ręczną poprawę do wyjątków, a nie do „prawie wszystkiego”.

W tym miejscu pojawia się jeszcze jeden typowy kłopot: kwoty czasem są poprawne, ale waluta nie, co psuje dalsze księgowanie. Jak to wygląda w realu? Masz 40 faktur z jednego tygodnia, a potem jedna z nich ma nietypowy zapis wartości — system „przyjmuje”, księgowy „widzi”, ale dopiero audyt kwot ujawnia rozjazd.

Proces w obiegu dokumentów: od odczytu do zaksięgowania

Odczyt faktur powinien być częścią obiegu dokumentów, w którym każda paczka ma ścieżkę decyzji i odpowiedzialności. Z doświadczenia widać, że kiedy ekstrakcja danych jest uruchamiana „w próżni”, to nie ma komu sprawdzić wyjątków: wtedy człowiek walczy później z błędami w księgach zamiast poprawiać je od razu. W pracy z klientami często ustawiamy tak, by odczyt faktur uruchamiał się przed zatwierdzeniem do ERP, a potem szedł do mapowania oraz kontroli jakości.

W wielu firmach workflow wygląda tak: dokument trafia do wspólnego repozytorium, system wykonuje OCR i rozpoznawanie tekstu, następnie porównuje kluczowe pola (NIP, numer, daty, wartości), a dopiero na końcu przygotowuje wpis do księgowości. Jeżeli zespół ma integrację z finansowo-księgowym systemem, to automatyzacja księgowości bywa szybsza nawet o około 30% w porównaniu do ręcznego przepisywania danych.

Warto pamiętać, że czas nie bierze się z samego „czytania” — bierze się z tego, czy rekord od razu jest gotowy do zaksięgowania. Czy potrzebujecie wskazań, które pola wymagają korekty, czy system ma wszystko oznaczać ręcznie?

Szybkość vs jakość — kiedy lepsza jest korekta ręczna

Odczyt faktur bez kontroli jakości zawsze wróci do was jak bumerang w postaci poprawianych rekordów. Często spotykam się z podejściem „maksymalnie automatycznie”, ale w praktyce lepiej działa model hybrydowy: automatyczna ekstrakcja, a ręczna weryfikacja tylko tam, gdzie reguły walidacji wykryją niezgodność. Dla mnie to jak poruszanie się w nocy po nieznanej trasie — lampy (OCR i reguły) robią robotę, ale przy każdym zakręcie trzeba mieć pewność, że światła świecą we właściwym kierunku.

Jeśli chcecie, by proces był odporny na „dziwne” układy faktur, ustawcie progi jakości: np. gdy pewność rozpoznania jest niska albo numer faktury nie pasuje do wzorca, rekord trafia do kolejki korekty. Tak naprawdę odczyt faktur w księgowości najlepiej działa, gdy traktujecie go jak odpowiedzialny etap procesu, a nie jednorazową czynność.

Jak u was wyglądałby dzień, gdy największe wyjątki byłyby obsługiwane w pierwszej kolejce, a reszta szła prosto do zatwierdzenia?