refactor(254): cleanSnippet behält Geldbeträge #257

Merged
admin-mrrm merged 1 commit from refactor/254-clean-snippet-keep-prices into main 2026-05-14 16:17:19 +02:00
Owner

Summary

Adressiert #254. Zwei Regexes in cleanSnippet() entfernt, die Euro-/Currency-Beträge aus dem NLI-Input strippten:

.replace(/[€$£¥]\s*[\d,.]+/g, '')   // entfernte '€ 12,50'
.replace(/\d+[,.]?\d*\s*€/g, '')   // entfernte '55,88 €'

Kalibrierungs-Beispiel L40: Beleg für Ihre Zahlung an Shop Apotheke B.V.: 55,88 € EUR wurde zu Shop Apotheke B.V.: EUR — NLI verlor das stärkste Rechnung-Signal und wählte fälschlich Sendung (0.269).

parseTags() strippt weiterhin Currency aus Llama-Output (Schutz gegen Werbung: 50€ als Tag-Vorschlag) — das ist eine andere Stelle.

Test plan

  • Mobile: 36/36 grün (4 neue cleanSnippet-Tests, decken €-Suffix, €-Prefix, EUR-textuell, Long-String-Cap ab)
  • Typecheck mobile grün
  • Smoke nach Bundle-Refresh: PayPal-Beleg-Mail durch Kategorisierung schicken → mit Beträgen im Snippet sollte Rechnung-Score steigen

Closes #254.

## Summary Adressiert #254. Zwei Regexes in `cleanSnippet()` entfernt, die Euro-/Currency-Beträge aus dem NLI-Input strippten: ```ts .replace(/[€$£¥]\s*[\d,.]+/g, '') // entfernte '€ 12,50' .replace(/\d+[,.]?\d*\s*€/g, '') // entfernte '55,88 €' ``` Kalibrierungs-Beispiel L40: `Beleg für Ihre Zahlung an Shop Apotheke B.V.: 55,88 € EUR` wurde zu `Shop Apotheke B.V.: EUR` — NLI verlor das stärkste Rechnung-Signal und wählte fälschlich Sendung (0.269). `parseTags()` strippt weiterhin Currency aus Llama-Output (Schutz gegen `Werbung: 50€` als Tag-Vorschlag) — das ist eine andere Stelle. ## Test plan - [x] Mobile: 36/36 grün (4 neue cleanSnippet-Tests, decken €-Suffix, €-Prefix, EUR-textuell, Long-String-Cap ab) - [x] Typecheck mobile grün - [ ] Smoke nach Bundle-Refresh: PayPal-Beleg-Mail durch Kategorisierung schicken → mit Beträgen im Snippet sollte Rechnung-Score steigen Closes #254.
refactor(254): cleanSnippet behält Geldbeträge — €-Strings sind Rechnung-Signal
All checks were successful
continuous-integration/drone/push Build is passing
continuous-integration/drone/pr Build is passing
01d7625ab4
Kalibrierung in #251 zeigte: cleanSnippet strippte "55,88 €" aus PayPal-
Belegen, womit das stärkste Rechnung-Signal verloren ging. Beispiel L40:
"Beleg für Ihre Zahlung an Shop Apotheke B.V.: 55,88 € EUR" wurde zu
"Shop Apotheke B.V.: EUR", NLI wählte fälschlich Sendung (0.269).

Die zwei verantwortlichen Regexes entfernt:
- /[€$£¥]\s*[\d,.]+/g  → entfernte "€ 12,50"
- /\d+[,.]?\d*\s*€/g   → entfernte "55,88 €"

Restliches Cleanup (URLs, HTML-Entities, Trenner) bleibt unverändert.
parseTags()-Filter strippt weiterhin Currency aus Llama-Output (Schutz
gegen "Werbung: 50€" als Tag-Vorschlag).

Mobile: 36/36 grün (4 neue cleanSnippet-Tests).

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
Sign in to join this conversation.
No reviewers
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
admin-mrrm/mrrmlabapp!257
No description provided.