feat(#253): NliClassifier.classifyWithTemplates — max-Score über Templates #359

Merged
admin-mrrm merged 1 commit from feat/253-nli-template-ab into main 2026-05-20 07:41:36 +02:00
Owner

Bezug zu #253.

Was

Neue Methode classifyWithTemplates(snippet, candidates, templates[]) auf NliClassifier. Scoret jeden Label gegen alle Templates und nimmt den Max-Score. classify() delegiert jetzt darauf mit dem Default-Template.

Was nicht

Das eigentliche A/B-Measurement gegen apps/api/.tmp/nli-debug.jsonl (~34 Mails) ist nicht Teil dieses PRs — die Datei liegt nur lokal beim User. Folge-Schritt: Messung laufen lassen, bei +0.05 avg Top-Score den Default switchen oder dual-template im Produktiv-Pfad nutzen.

Tests

5 neue Specs in nli-classifier.spec.ts:

  • max-Score pro Label über Templates
  • Forward-Passes = templates × candidates
  • empty templates → Default-Fallback
  • empty candidates → kein Model-Load
  • sortiert by descending max

Alle 11 nli-classifier-Tests grün, full mobile-Suite (59) ebenfalls.

Bezug zu #253. ## Was Neue Methode `classifyWithTemplates(snippet, candidates, templates[])` auf NliClassifier. Scoret jeden Label gegen alle Templates und nimmt den Max-Score. `classify()` delegiert jetzt darauf mit dem Default-Template. ## Was nicht Das eigentliche A/B-Measurement gegen `apps/api/.tmp/nli-debug.jsonl` (~34 Mails) ist nicht Teil dieses PRs — die Datei liegt nur lokal beim User. Folge-Schritt: Messung laufen lassen, bei +0.05 avg Top-Score den Default switchen oder dual-template im Produktiv-Pfad nutzen. ## Tests 5 neue Specs in nli-classifier.spec.ts: - max-Score pro Label über Templates - Forward-Passes = templates × candidates - empty templates → Default-Fallback - empty candidates → kein Model-Load - sortiert by descending max Alle 11 nli-classifier-Tests grün, full mobile-Suite (59) ebenfalls.
feat(#253): NliClassifier.classifyWithTemplates — max-Score über Templates
All checks were successful
continuous-integration/drone/push Build is passing
continuous-integration/drone/pr Build is passing
d1d382210c
Neue Methode scoret jeden Label gegen mehrere Hypothese-Templates und
nimmt den Max-Score. Erlaubt A/B-Tests verschiedener Wordings ohne
Änderung am Produktiv-Pfad. classify() delegiert auf den Default.

5 neue Tests in nli-classifier.spec.ts (alle 11 grün, full mobile-Suite 59).

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
Sign in to join this conversation.
No reviewers
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
admin-mrrm/mrrmlabapp!359
No description provided.