• v0.6.6-rc6 7cd934d914

    v0.6.6-rc6
    All checks were successful
    continuous-integration/drone/push Build is passing
    continuous-integration/drone/tag Build is passing
    Stable

    admin-mrrm released this 2026-06-07 11:54:22 +02:00 | 128 commits to main since this release

    rc5 zeigte am Phone 'embedder: loading' und blieb dort hängen. 'loading' fasste bisher zwei sequenzielle Schritte zusammen: AutoTokenizer.from_pretrained (HF-Tokenizer-Download via transformers.js) und InferenceSession.create (ONNX-Parse). rc6 splittet das in 'loading-tokenizer' / 'loading-session' damit der Bottleneck auf dem Gerät sichtbar wird. Parallel: erster echter Maestro-E2E-Flow (phase1-indexing-smoke), den scripts/maestro-pi.sh auf dem rpi5+Phone fährt — er drückt den Debug-Button und wartet bis 'embedder: ready' erscheint (timeout 3min). Damit kann jeder zukünftige RC autonom verifiziert werden.

    Highlights

    • feat(embedding): EmbeddingStatus split 'loading' → 'loading-tokenizer' + 'loading-session' (#122). Debug-Bar rendert jetzt 'embedder: loading tokenizer' bzw. 'loading session' — entlarvt welcher der zwei Schritte auf dem Gerät hängt (Tokenizer-Fetch von HF vs. ONNX-Compile).
    • feat(e2e): phase1-indexing-smoke.yaml — neuer Maestro-Flow der den Debug-Index-Button drückt und auf 'embedder: ready' wartet. Läuft via scripts/maestro-pi.sh, kein clearState (cached ONNX bleibt auf disk → 30s statt 3min auf Re-Runs). Erlaubt autonome Fix-Verifikation ohne menschliche Lesung.
    • Test-getrieben: 1 neuer embedding-service.spec Test prüft loading-tokenizer → loading-session → ready Reihenfolge.
    Downloads