feat(mobile): TrOCR-Re-Evaluation auf echten /training_data-Crops #416
Labels
No labels
app/archiv
app/einkaufslisten
app/imap-client
app/wissensbasis
arch-answered
arch-question
area/api
area/auth
area/infra
area/mobile
area/shared
area/ui
area/web
portfolio-status
prio/high
prio/low
prio/medium
roadmap/public
size/l
size/m
size/s
size/xl
size/xs
status/blocked
status/needs-info
type/bug
type/chore
type/docs
type/feature
type/idea
type/refactor
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference
admin-mrrm/mrrmlabapp#416
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Ziel
Die Spike-CER-Messung (0.043 case-folded, #77) lief auf synthetisch gerenderten 20-Crops mit varied fonts/sizes/rotation. Vor Production-Rollout (#82) müssen wir auf echten Einkaufszettel-Crops messen.
Datenquelle
Server-OCR sammelt Korrektur-Sessions im Volume
/training_data(Containerapps/ocr/), perapps/ocr/app/ocr.py:230_save_training_session(). Jede Session hat \n- Original-Crops\n- Korrigierte Ground-Truth-Lines\n\nDamit existiert bereits ein wachsender Real-World-Datensatz.Scope
/training_data/-Sessions (read-only Pull vom prod-alt OCR-Container)measure_cer.py(3 Varianten: TrOCR-int8 / TrOCR-fp32 / Server-Baseline)Definition-of-Done
Referenzen
Real-Data-Eval abgeschlossen
77 echte Crops aus 5 corrected sessions aus
/training_data(prod-alt OCR-Container).EasyOCR-Baseline: CER 0.670 (TrOCR ist besser, aber beide weit unter Brauchbarkeit).
Befund: TrOCR-small-PRINTED kann keine Handschrift. Best-Performers (
BLOCK,SOCKEN,KISSEN,HUT,RUCOLA) sind alles gedruckte Items; Worst-Performers sind handgeschriebene Einkaufszettel-Einträge wo das Modell plausible englische Druckschrift halluziniert (Hund → REHOL,Knoblauch → LABELEL).Konsequenz: v0.5 pivotet auf Fuzzy-Match #415 als Hauptpfad statt On-Device-OCR-Optimierung. Closing-Cascade #77/#81/#82/#414 in den nächsten Comments.
Eval-Skript + Daten auf dev-neu:
/root/ocr-spike/measure_cer_real.py+/root/ocr-spike/real-eval/.