NLI: Hypothese-Template-A/B (Folge zu #251) #253
Labels
No labels
app/archiv
app/einkaufslisten
app/imap-client
app/wissensbasis
arch-answered
arch-question
area/api
area/auth
area/infra
area/mobile
area/shared
area/ui
area/web
portfolio-status
prio/high
prio/low
prio/medium
roadmap/public
size/l
size/m
size/s
size/xl
size/xs
status/blocked
status/needs-info
type/bug
type/chore
type/docs
type/feature
type/idea
type/refactor
No milestone
No project
No assignees
2 participants
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference
admin-mrrm/mrrmlabapp#253
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Kontext
Nach Kalibrierung in #251 erreichen korrekte NLI-Top-Scores nur 0.30–0.44. Threshold sitzt jetzt bei 0.30 — Spielraum nach oben begrenzt. Hypothese-Template ist mutmaßlich zu generisch (#251, Ursache 2).
Aktuell:
Ziel
A/B-Test zwei (oder mehr) Templates parallel, max-Score pro Label nehmen. Wenn signifikant höher → Default switchen.
Kandidaten
Diese E-Mail ist eine ${label}-Mail.Die Kategorie dieser E-Mail ist ${label}.Hierbei handelt es sich um eine ${label}.Diese E-Mail enthält eine Rechnung/Diese E-Mail kündigt eine Lieferung an) — eigene PR-PhaseVorgehen (TDD)
nliClassifier.classifyWithTemplates(text, labels, templates[])— gibt max-Score pro Label zurückapps/api/.tmp/nli-debug.jsonl): vergleiche Top-Score-Verteilung Template-A vs B vs max-A-BOut of Scope
Abhängigkeit
Gehört zu #251 (geschlossen). Daten liegen in
apps/api/.tmp/nli-debug.jsonl.PM-Housekeeping (Convention-Falle): Fix wurde am 2026-05-20 via PR #359 (Merge
e1d1869) aufmaingemerged. Das Issue blieb offen weil der Merge-Title nurfeat(#253):/fix(253):enthielt, nichtCloses #253.NLI Template-A/B (classifyWithTemplates) implementiert.
Schließe manuell als verifiziert-implementiert. Konvention ist dokumentiert in
convention_commit_close_keywords.md; CI-Guard ist als arch-question #406 in Bearbeitung.