-
v0.6.6-rc6
Stablereleased this
2026-06-07 11:54:22 +02:00 | 128 commits to main since this releaserc5 zeigte am Phone 'embedder: loading' und blieb dort hängen. 'loading' fasste bisher zwei sequenzielle Schritte zusammen: AutoTokenizer.from_pretrained (HF-Tokenizer-Download via transformers.js) und InferenceSession.create (ONNX-Parse). rc6 splittet das in 'loading-tokenizer' / 'loading-session' damit der Bottleneck auf dem Gerät sichtbar wird. Parallel: erster echter Maestro-E2E-Flow (phase1-indexing-smoke), den scripts/maestro-pi.sh auf dem rpi5+Phone fährt — er drückt den Debug-Button und wartet bis 'embedder: ready' erscheint (timeout 3min). Damit kann jeder zukünftige RC autonom verifiziert werden.
Highlights
- feat(embedding): EmbeddingStatus split 'loading' → 'loading-tokenizer' + 'loading-session' (#122). Debug-Bar rendert jetzt 'embedder: loading tokenizer' bzw. 'loading session' — entlarvt welcher der zwei Schritte auf dem Gerät hängt (Tokenizer-Fetch von HF vs. ONNX-Compile).
- feat(e2e): phase1-indexing-smoke.yaml — neuer Maestro-Flow der den Debug-Index-Button drückt und auf 'embedder: ready' wartet. Läuft via scripts/maestro-pi.sh, kein clearState (cached ONNX bleibt auf disk → 30s statt 3min auf Re-Runs). Erlaubt autonome Fix-Verifikation ohne menschliche Lesung.
- Test-getrieben: 1 neuer embedding-service.spec Test prüft loading-tokenizer → loading-session → ready Reihenfolge.
Downloads
-
Source code (ZIP)
1 download
-
Source code (TAR.GZ)
1 download
-
mrrmlab--e8a14fb.apk
6 downloads ·
2026-06-07 12:12:59 +02:00 · 151 MiB