fakerechnungen und echte dokumente erkennen mit #ki
#Dokumente erkennen und zu klassifizieren. Mit #lokaler #Ki mit #ollama und #gemma2
Sowas entlastet zum Beispiel Mitarbeiter im #Input-Management und Effizienz und Qualität des #Dokumentenmanagement zum Beispiel bei #Banken und #Versicherungen
Alles #lokal, kein #Internet, kein #Datenschutz Thema.
Fragen ? dann frag! oder frag die #metafinanz
#ollama #gemma2 #lokaleki #genki #AI #genai #insurtech #versicherungen #banken
1. Dokumente und Zielsetzung
- Beispiele:
- Eine gefälschte Rechnung mit verdächtigen Angaben (z. B. Verweis auf ein spanisches Amtsgericht, ungewöhnliche Zahlungsfristen).
- Ein echter Schadensfallbericht nach einem Autounfall, bei dem der Text plausibel und stimmig wirkt.
2. Systemaufbau
- Drei Hauptkomponenten:
- Weboberfläche:
- Ermöglicht das Hochladen der Bilddateien.
- Bildverarbeitung:
- Vorverarbeitung und Extraktion des Textes aus Bildern mittels OCR (Tesseract).
- Textanalyse mit KI:
- Lokaler Einsatz eines KI-Modells (olama) zur Analyse des extrahierten Textes.
3. Prozessablauf
- Bild-Upload:
- Die Dokumente werden über die Weboberfläche hochgeladen.
- Vorverarbeitung und Texterkennung:
- Das Bild wird optimiert und der enthaltene Text wird mittels Tesseract ausgelesen.
- KI-gestützte Analyse:
- Der extrahierte Text wird an das lokale KI-Modell gesendet, das zwei Aufgaben übernimmt:
- Bewertung auf Auffälligkeiten:
- Ein Score wird generiert (höhere Werte deuten auf Unstimmigkeiten hin).
- Klassifikation des Dokuments:
- Bestimmung des Dokumententyps (z. B. Rechnung, Schadensfall, Vertrag).
4. Ergebnisse
- Gefälschte Rechnung:
- Mehrere Unstimmigkeiten (falsche Angaben, ungewöhnliche Zahlungsmodalitäten) führten zu einem hohen Score, der auf Betrugsverdacht hinweist.
- Schadensfallbericht:
- Der Text erschien plausibel und ohne auffällige Merkmale, sodass er korrekt als Schadensmeldung klassifiziert wurde.
5. Fazit
- Das System kombiniert OCR und ein lokales KI-Modell, um Dokumente automatisiert zu analysieren und zwischen echten und gefälschten Dokumenten zu unterscheiden.
- Praktischer Nutzen für Unternehmen, die Dokumente effizient verarbeiten und klassifizieren möchten.