feat(ocr): ONNX-Modell vorbereiten – Export, Quantisierung, Hosting #78

Closed
opened 2026-04-26 09:10:41 +02:00 by admin-mrrm · 1 comment
Owner

Ziel

Das exportierte ONNX-Modell produktionsreif machen: quantisiert, versioniert, per CI gebaut und für den App-Download bereitgestellt.

Abhängigkeit

Setzt #77 voraus (Spike muss abgeschlossen sein).

Aufgaben

Export-Pipeline

  • tools/export-trocr-onnx.py – exportiert und quantisiert alle benötigten Artefakte:
    • encoder_model_quantized.onnx
    • decoder_model_merged_quantized.onnx
    • vocab.json + merges.txt (Tokenizer-Dateien)
  • Ergebnisgröße dokumentieren (Ziel: < 200 MB gesamt)

Hosting

  • Modell-Artefakte im Gitea-Release oder separatem Storage ablegen (nicht im Git-Repo)
  • Versionsstrategie festlegen (Modell-Version unabhängig von App-Version)
  • Download-URL im App-Config hinterlegen

CI/CD

  • Optionaler Drone-Step export-model der bei Bedarf (manuell getriggert) das Modell neu exportiert

Akzeptanzkriterien

  • Modell-Artefakte öffentlich herunterladbar
  • Checksums (SHA256) für Integritätsprüfung vorhanden
  • README unter tools/ erklärt den Export-Prozess
## Ziel Das exportierte ONNX-Modell produktionsreif machen: quantisiert, versioniert, per CI gebaut und für den App-Download bereitgestellt. ## Abhängigkeit Setzt #77 voraus (Spike muss abgeschlossen sein). ## Aufgaben ### Export-Pipeline - [ ] `tools/export-trocr-onnx.py` – exportiert und quantisiert alle benötigten Artefakte: - `encoder_model_quantized.onnx` - `decoder_model_merged_quantized.onnx` - `vocab.json` + `merges.txt` (Tokenizer-Dateien) - [ ] Ergebnisgröße dokumentieren (Ziel: < 200 MB gesamt) ### Hosting - [ ] Modell-Artefakte im Gitea-Release oder separatem Storage ablegen (nicht im Git-Repo) - [ ] Versionsstrategie festlegen (Modell-Version unabhängig von App-Version) - [ ] Download-URL im App-Config hinterlegen ### CI/CD - [ ] Optionaler Drone-Step `export-model` der bei Bedarf (manuell getriggert) das Modell neu exportiert ## Akzeptanzkriterien - [ ] Modell-Artefakte öffentlich herunterladbar - [ ] Checksums (SHA256) für Integritätsprüfung vorhanden - [ ] README unter `tools/` erklärt den Export-Prozess
Collaborator

Done-by-spike #77: ONNX-Modelle (Encoder + Decoder + Decoder-with-past) exportiert + int8-quantisiert + im Mobile-Bundle integriert. Hosting via Asset-Bundle (76 MB) statt CDN — Spike-Outcome favoured Bundle.

Done-by-spike #77: ONNX-Modelle (Encoder + Decoder + Decoder-with-past) exportiert + int8-quantisiert + im Mobile-Bundle integriert. Hosting via Asset-Bundle (76 MB) statt CDN — Spike-Outcome favoured Bundle.
Sign in to join this conversation.
No project
No assignees
2 participants
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
admin-mrrm/mrrmlabapp#78
No description provided.