NLI-Threshold zu konservativ — 27% plausible Mails fallen durch #268
Labels
No labels
app/archiv
app/einkaufslisten
app/imap-client
app/wissensbasis
arch-answered
arch-question
area/api
area/auth
area/infra
area/mobile
area/shared
area/ui
area/web
portfolio-status
prio/high
prio/low
prio/medium
roadmap/public
size/l
size/m
size/s
size/xl
size/xs
status/blocked
status/needs-info
type/bug
type/chore
type/docs
type/feature
type/idea
type/refactor
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference
admin-mrrm/mrrmlabapp#268
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Während der Kalibrierungs-Session (60 unique Mails, NLI-Only-Mode) zeigt die Threshold-Analyse, dass 27% der Mails im 0.25-0.30-Band liegen, mit plausiblen Top-Labels (Zahlung, Rechnung, Konto). Mit aktuellem Threshold 0.30 werden diese verworfen.
Beispiel aus dem aktuellen Live-Lauf:
Alle drei wären zutreffend, werden aber unter 0.30 verworfen.
Auswertung:
Fix:
NLI_CONFIDENCE_THRESHOLD0.30 → 0.25 senken. Erhöht Hit-Rate von 38% auf ~65%.