admin-mrrm/mrrmlabapp

NLI-Threshold zu konservativ — 27% plausible Mails fallen durch #268

New issue

Closed

opened 2026-05-14 22:22:26 +02:00 by admin-mrrm · 0 comments

admin-mrrm commented

2026-05-14 22:22:26 +02:00

Owner

Während der Kalibrierungs-Session (60 unique Mails, NLI-Only-Mode) zeigt die Threshold-Analyse, dass 27% der Mails im 0.25-0.30-Band liegen, mit plausiblen Top-Labels (Zahlung, Rechnung, Konto). Mit aktuellem Threshold 0.30 werden diese verworfen.

Beispiel aus dem aktuellen Live-Lauf:

Konto@0.273 (vermutlich Bank-Mail)
Zahlung@0.282 (vermutlich Zahlungsbestätigung)
Rechnung@0.279 (vermutlich Rechnung)

Alle drei wären zutreffend, werden aber unter 0.30 verworfen.

Auswertung:

Score-Range	Anteil
≥0.45 (very conf)	5%
0.30–0.45 (hit)	33%
0.25–0.30 (miss)	27%
<0.25 (low)	35%

Fix: NLI_CONFIDENCE_THRESHOLD 0.30 → 0.25 senken. Erhöht Hit-Rate von 38% auf ~65%.

Während der Kalibrierungs-Session (60 unique Mails, NLI-Only-Mode) zeigt die Threshold-Analyse, dass 27% der Mails im 0.25-0.30-Band liegen, mit plausiblen Top-Labels (Zahlung, Rechnung, Konto). Mit aktuellem Threshold 0.30 werden diese verworfen. Beispiel aus dem aktuellen Live-Lauf: - Konto@0.273 (vermutlich Bank-Mail) - Zahlung@0.282 (vermutlich Zahlungsbestätigung) - Rechnung@0.279 (vermutlich Rechnung) Alle drei wären zutreffend, werden aber unter 0.30 verworfen. Auswertung: | Score-Range | Anteil | |---|---| | ≥0.45 (very conf) | 5% | | 0.30–0.45 (hit) | 33% | | 0.25–0.30 (miss) | 27% | | <0.25 (low) | 35% | **Fix:** `NLI_CONFIDENCE_THRESHOLD` 0.30 → 0.25 senken. Erhöht Hit-Rate von 38% auf ~65%.

admin-mrrm referenced this issue from a commit

2026-05-14 22:22:38 +02:00

fix(mobile,#268): NLI-Confidence-Threshold von 0.30 auf 0.25 senken

admin-mrrm referenced this issue from a pull request that will close it,

2026-05-14 22:22:48 +02:00

fix(mobile,#268): NLI-Threshold 0.30 → 0.25 #269

admin-mrrm closed this issue

2026-05-14 22:25:58 +02:00

admin-mrrm referenced this issue from a commit

2026-05-14 22:38:50 +02:00

chore(api): Analyze-Script Range-Labels dynamisch aus Konstanten ableiten

admin-mrrm referenced this issue

2026-05-14 22:39:09 +02:00

chore(api): Analyze-Script Range-Labels dynamisch #289

admin-mrrm referenced this issue

2026-05-14 23:14:50 +02:00

NLI: Label-spezifische Hypothesen statt generisches Template #290

admin-mrrm referenced this issue

2026-05-14 23:21:38 +02:00

feat(mobile,#290): label-spezifische NLI-Hypothesen #291

admin-mrrm referenced this issue

2026-05-14 23:51:49 +02:00

NLI: Subject-Weighting im Premise (2× prepend) für besseren Score-Anker #292

admin-mrrm referenced this issue

2026-05-14 23:55:36 +02:00

feat(mobile,#292): NLI Subject-Weighting (Lever 2) #293

admin-mrrm referenced this issue

2026-05-15 00:15:33 +02:00

NLI: Subject-Weighting im Premise (2× prepend) für besseren Score-Anker #292

admin-mrrm referenced this issue

2026-05-15 00:29:01 +02:00

feat: Sender→Label Memory für Online-Tag-Learning #294

admin-mrrm referenced this issue from a commit

2026-05-15 01:03:07 +02:00

feat(#294): Sender→Label Memory für Online-Tag-Learning

admin-mrrm referenced this issue

2026-05-15 01:03:31 +02:00

feat(#294): Sender→Label Memory — Online-Feedback-Loop für Mail-Tags #295

Sign in to join this conversation.

No milestone

No project

No assignees

1 participant

Notifications

Due date

The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference

admin-mrrm/mrrmlabapp#268

No description provided.