feat: Trainingsdaten-Statistik in der App anzeigen #352
Labels
No labels
app/archiv
app/einkaufslisten
app/imap-client
app/wissensbasis
arch-answered
arch-question
area/api
area/auth
area/infra
area/mobile
area/shared
area/ui
area/web
portfolio-status
prio/high
prio/low
prio/medium
roadmap/public
size/l
size/m
size/s
size/xl
size/xs
status/blocked
status/needs-info
type/bug
type/chore
type/docs
type/feature
type/idea
type/refactor
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference
admin-mrrm/mrrmlabapp#352
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Ziel
Der Nutzer soll sehen können, wie viele OCR-Trainingsdaten schon gesammelt wurden — als Indikator wann ein EasyOCR-Finetune Sinn ergibt.
Hintergrund
Die OCR-Pipeline schreibt nach jedem Scan automatisch ein Trainings-Session-Verzeichnis nach
TRAINING_DATA_DIR(apps/ocr/app/ocr.py:_save_training_session). Korrigierte Crops aus dem Review-Screen landen ebenfalls dort via/ocr/save-training(apps/ocr/app/main.py:126). Bislang gibt es keinen Read-Pfad, der diese Daten zählt oder visualisiert.Scope
OCR-Service
GET /ocr/training-statsliefert:total_sessions— Anzahl Session-Ordner unterTRAINING_DATA_DIRtotal_lines— Summe aller Zeilen aus denlabels.jsoncorrected_lines— Anzahl Zeilen mit gesetztemcorrected-Feld (= manuell überprüft, primäres Trainingsmaterial)last_session_at— Timestamp der jüngsten Sessionoldest_session_at— Timestamp der ältesten SessionAPI (NestJS)
GET /lists/ocr/training-stats(oder ähnlicher Pfad), holt vom OCR-ServiceUI (Web + Mobile)
Out of scope
Akzeptanzkriterien