[Bug] OCR: Zeilensegmentierung teilt einzelne handschriftliche Zeilen in zwei Einträge #325

New issue

Closed

opened 2026-05-18 08:20:25 +02:00 by admin-mrrm · 2 comments

admin-mrrm commented

2026-05-18 08:20:25 +02:00

Owner

Beobachtetes Verhalten

Beim Einlesen handgeschriebener Einkaufszettel wird der Inhalt einer einzelnen Zeile vom OCR häufig nicht als zusammengehörig erkannt. Folge: Aus einer Zeile entstehen zwei Listen-Einträge (Over-Segmentation).

Erwartetes Verhalten

Eine handgeschriebene Zeile soll als ein Eintrag in die Einkaufsliste übernommen werden.

Reproduktion

Foto eines handgeschriebenen Einkaufszettels machen (mehrere Zeilen)
In der App OCR-Analyse starten
Im Review-Screen beobachten: einzelne reale Zeilen tauchen als zwei oder mehr Einträge auf

Umgebung

App: mobile (Expo)
Version / Commit: bitte ausfüllen
OS / Device: bitte ausfüllen

Zusätzliche Infos

Vermutliche Ursache: Die Zeilen-Segmentierung (aktuell ocr.py-Pipeline auf dem Server, später on-device per #81) teilt Boxen zu aggressiv: bei Buchstaben mit Unterlängen, Lücken innerhalb eines Worts oder leichter Schräglage entstehen mehrere Bounding-Boxes pro echter Zeile.

Mögliche Stellschrauben:

Stärkere horizontale Dilation vor Contour-Detection (mehr Verschmelzung naher Komponenten)
Mindest-Breite/Vertikal-Overlap-Filter zum Mergen benachbarter Boxen, deren y-Bereich sich überlappt
Optional: Post-Processing das benachbarte Items mit gleichem y-Center wieder zusammenfasst

Verwandt:

#81 (Zeilensegmentierung on-device — technische Migration, dieser Bug ist die Qualitäts-Achse)
#85 Schlusssatz (Erkennungsqualität deutscher Handschrift mit TrOCR-IAM begrenzt — separates Thema)

Mitigation aus Sicht UX: separates Feature-Issue (Vorschau erkannter Zeilen-Boxen mit Split/Merge-Korrektur).

## Beobachtetes Verhalten Beim Einlesen handgeschriebener Einkaufszettel wird der Inhalt **einer einzelnen Zeile** vom OCR häufig nicht als zusammengehörig erkannt. Folge: Aus einer Zeile entstehen **zwei Listen-Einträge** (Over-Segmentation). ## Erwartetes Verhalten Eine handgeschriebene Zeile soll als **ein** Eintrag in die Einkaufsliste übernommen werden. ## Reproduktion 1. Foto eines handgeschriebenen Einkaufszettels machen (mehrere Zeilen) 2. In der App OCR-Analyse starten 3. Im Review-Screen beobachten: einzelne reale Zeilen tauchen als zwei oder mehr Einträge auf ## Umgebung - App: mobile (Expo) - Version / Commit: _bitte ausfüllen_ - OS / Device: _bitte ausfüllen_ ## Zusätzliche Infos **Vermutliche Ursache:** Die Zeilen-Segmentierung (aktuell `ocr.py`-Pipeline auf dem Server, später on-device per #81) teilt Boxen zu aggressiv: bei Buchstaben mit Unterlängen, Lücken innerhalb eines Worts oder leichter Schräglage entstehen mehrere Bounding-Boxes pro echter Zeile. **Mögliche Stellschrauben:** - Stärkere horizontale Dilation vor Contour-Detection (mehr Verschmelzung naher Komponenten) - Mindest-Breite/Vertikal-Overlap-Filter zum Mergen benachbarter Boxen, deren y-Bereich sich überlappt - Optional: Post-Processing das benachbarte Items mit gleichem y-Center wieder zusammenfasst **Verwandt:** - #81 (Zeilensegmentierung on-device — technische Migration, dieser Bug ist die Qualitäts-Achse) - #85 Schlusssatz (Erkennungsqualität deutscher Handschrift mit TrOCR-IAM begrenzt — separates Thema) Mitigation aus Sicht UX: separates Feature-Issue (Vorschau erkannter Zeilen-Boxen mit Split/Merge-Korrektur).

admin-mrrm added this to the v0.5 — On-Device OCR + Infra milestone

2026-05-18 08:20:25 +02:00

admin-mrrm added the

labels

2026-05-18 08:20:25 +02:00

admin-mrrm commented

2026-05-18 08:22:14 +02:00

Author

Owner

Verwandte neue OCR-Issues:

#325 [Bug] Over-Segmentation handschriftlicher Zeilen
#326 feat: Crop vor der Analyse
#327 feat: Zeilen-Boxen-Vorschau mit Korrektur

Alle drei in Milestone v0.5.

**Verwandte neue OCR-Issues:** - #325 [Bug] Over-Segmentation handschriftlicher Zeilen - #326 feat: Crop vor der Analyse - #327 feat: Zeilen-Boxen-Vorschau mit Korrektur Alle drei in Milestone v0.5.

admin-mrrm referenced this issue

2026-05-18 08:22:15 +02:00

feat(ocr): Bildausschnitt (Crop) vor der Analyse wählbar #326

admin-mrrm referenced this issue

2026-05-18 08:22:15 +02:00

feat(ocr): Vorschau erkannter Zeilen-Boxen mit manueller Korrektur (Split/Merge/Ignore) #327

admin-mrrm referenced this issue from a commit

2026-05-19 22:33:59 +02:00

fix(#325): OCR-Zeilen-Merge für übersegmentierte Boxen

admin-mrrm referenced this issue

2026-05-19 22:34:20 +02:00

fix(#325): OCR-Zeilen-Merge für übersegmentierte Boxen #346