feat(#352): OCR-Trainings-Statistik mit visuellem Fortschritt #353

Merged
admin-mrrm merged 1 commit from feat/352-training-stats into main 2026-05-19 23:41:04 +02:00
Owner

Closes #352

Summary

  • Neuer OCR-Endpoint /ocr/training-stats aggregiert Sessions/Zeilen/Korrekturen aus TRAINING_DATA_DIR
  • NestJS-Proxy /lists/ocr/training-stats + Zod-Schema im API-Client + useTrainingStats-Hook
  • Web + Mobile: neue Seite OCR-Training in den Einstellungen mit Fortschrittsbalken zum 200-Zeilen-Richtwert

Hintergrund

Das Fine-Tuning des EasyOCR-Modells für deutsche Handschrift ist erst sinnvoll, wenn genug korrigierte Trainingsdaten vorliegen. Die Seite macht den Sammelstand visuell sichtbar, damit ich nicht ständig auf den Server schauen muss.

Test plan

  • OCR: pytest apps/ocr/tests/test_ocr.py apps/ocr/tests/test_main.py
  • API: pnpm --filter @mrrmlab/api test -- ocr.service
  • Typecheck: feature-lists, api-client, web, mobile
  • Smoke: Seite "OCR-Training" in Einstellungen aufrufen (Web + Mobile)
Closes #352 ## Summary - Neuer OCR-Endpoint `/ocr/training-stats` aggregiert Sessions/Zeilen/Korrekturen aus `TRAINING_DATA_DIR` - NestJS-Proxy `/lists/ocr/training-stats` + Zod-Schema im API-Client + `useTrainingStats`-Hook - Web + Mobile: neue Seite **OCR-Training** in den Einstellungen mit Fortschrittsbalken zum 200-Zeilen-Richtwert ## Hintergrund Das Fine-Tuning des EasyOCR-Modells für deutsche Handschrift ist erst sinnvoll, wenn genug korrigierte Trainingsdaten vorliegen. Die Seite macht den Sammelstand visuell sichtbar, damit ich nicht ständig auf den Server schauen muss. ## Test plan - [x] OCR: `pytest apps/ocr/tests/test_ocr.py apps/ocr/tests/test_main.py` - [x] API: `pnpm --filter @mrrmlab/api test -- ocr.service` - [x] Typecheck: feature-lists, api-client, web, mobile - [ ] Smoke: Seite "OCR-Training" in Einstellungen aufrufen (Web + Mobile)
feat(#352): OCR-Trainings-Statistik mit visuellem Fortschritt
All checks were successful
continuous-integration/drone/push Build is passing
continuous-integration/drone/pr Build is passing
f912430971
Sichtbar machen, wie viele Trainingsdaten bereits gesammelt sind, damit
ich abschätzen kann, wann ein Fine-Tuning sinnvoll wird.

- OCR-Service: neuer Endpoint /ocr/training-stats aggregiert Sessions,
  Zeilen, Korrekturen und Zeitstempel aus TRAINING_DATA_DIR (TDD)
- API: NestJS-Proxy /lists/ocr/training-stats inkl. Tests
- API-Client: trainingStats() + TrainingStats-Schema
- Feature-Lists: useTrainingStats-Hook + TrainingStatsContent/Screen
- Web + Mobile: neue Seite "OCR-Training" in den Einstellungen mit
  Fortschrittsbalken zum 200-Zeilen-Richtwert

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
Sign in to join this conversation.
No reviewers
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
admin-mrrm/mrrmlabapp!353
No description provided.