[Bug] OCR: Zeilensegmentierung teilt einzelne handschriftliche Zeilen in zwei Einträge #325
Labels
No labels
app/archiv
app/einkaufslisten
app/imap-client
app/wissensbasis
arch-answered
arch-question
area/api
area/auth
area/infra
area/mobile
area/shared
area/ui
area/web
portfolio-status
prio/high
prio/low
prio/medium
roadmap/public
size/l
size/m
size/s
size/xl
size/xs
status/blocked
status/needs-info
type/bug
type/chore
type/docs
type/feature
type/idea
type/refactor
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference
admin-mrrm/mrrmlabapp#325
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Beobachtetes Verhalten
Beim Einlesen handgeschriebener Einkaufszettel wird der Inhalt einer einzelnen Zeile vom OCR häufig nicht als zusammengehörig erkannt. Folge: Aus einer Zeile entstehen zwei Listen-Einträge (Over-Segmentation).
Erwartetes Verhalten
Eine handgeschriebene Zeile soll als ein Eintrag in die Einkaufsliste übernommen werden.
Reproduktion
Umgebung
Zusätzliche Infos
Vermutliche Ursache: Die Zeilen-Segmentierung (aktuell
ocr.py-Pipeline auf dem Server, später on-device per #81) teilt Boxen zu aggressiv: bei Buchstaben mit Unterlängen, Lücken innerhalb eines Worts oder leichter Schräglage entstehen mehrere Bounding-Boxes pro echter Zeile.Mögliche Stellschrauben:
Verwandt:
Mitigation aus Sicht UX: separates Feature-Issue (Vorschau erkannter Zeilen-Boxen mit Split/Merge-Korrektur).
Verwandte neue OCR-Issues:
Alle drei in Milestone v0.5.
Fixed in #346 — merged auf main als
d8b34a4.