fix(mobile,#268): NLI-Threshold 0.30 → 0.25 #269

Merged
admin-mrrm merged 1 commit from fix/268-nli-threshold-025 into main 2026-05-14 22:25:58 +02:00
Owner

Summary

  • NLI_CONFIDENCE_THRESHOLD: 0.30 → 0.25
  • Tests: Boundary-Test auf 0.25 verschoben, Fallback-Tests auf 0.20 abgesenkt
  • Analyze-Script-Konstante mitgezogen

Kalibrierungs-Basis

Live-Lauf 117 Entries / 60 unique Mails:

Range Anteil
≥0.45 5%
0.30-0.45 33%
0.25-0.30 27% (jetzt nutzbar)
<0.25 35%

Hit-Rate: 38% → ~65%. Die 0.25-Zone enthält durchweg plausible Top-Labels (Zahlung/Rechnung/Konto).

Closes #268

## Summary - `NLI_CONFIDENCE_THRESHOLD`: 0.30 → 0.25 - Tests: Boundary-Test auf 0.25 verschoben, Fallback-Tests auf 0.20 abgesenkt - Analyze-Script-Konstante mitgezogen ## Kalibrierungs-Basis Live-Lauf 117 Entries / 60 unique Mails: | Range | Anteil | |---|---| | ≥0.45 | 5% | | 0.30-0.45 | 33% | | 0.25-0.30 | **27%** (jetzt nutzbar) | | <0.25 | 35% | Hit-Rate: 38% → ~65%. Die 0.25-Zone enthält durchweg plausible Top-Labels (Zahlung/Rechnung/Konto). Closes #268
fix(mobile,#268): NLI-Confidence-Threshold von 0.30 auf 0.25 senken
All checks were successful
continuous-integration/drone/push Build is passing
continuous-integration/drone/pr Build is passing
d9bcd465f5
117-Entry-Debug-Log (60 unique Mails) zeigt 27% im 0.25-0.30-Band mit
plausiblen Top-Labels (Zahlung/Rechnung/Konto). Hit-Rate steigt von
38% auf ~65%.

Analyze-Script und Tests entsprechend angepasst.

Closes #268

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
Sign in to join this conversation.
No reviewers
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
admin-mrrm/mrrmlabapp!269
No description provided.