2023–2025 · 50+ A/B-Tests DACH Abgeschlossen ✓

6–12% Spendensteigerung durch KI-Segmentierung —
validiert über 50+ A/B-Tests.

Ausgangshypothese
Prädiktive KI-Selektion bei Bestandsspendern führt zu messbarer Spendensteigerung — konsistent über viele Kampagnen und Organisationen.
Die Zahlen
6–12%
Spendensteigerung (Durchschnitt)
bis 40%
In spezifischen Segmenten
50+
Validierte A/B-Tests
3
Test-Gruppen pro Experiment
Das Standard-Test-Setup

Für jedes Experiment werden drei Gruppen definiert und parallel bespielt:

A
Nur KI-Selektion — Kontakte die nur die KI empfiehlt, nicht die bisherige Methode.
B
Nur bisherige Methode — Kontakte die die bisherige Selektion empfiehlt, nicht die KI. Die Kontrollgruppe.
A∩B
Schnittmenge — Kontakte die beide Methoden empfehlen. Oft der robusteste Vergleichspunkt.

Wichtig: Beide Selektionen werden unabhängig erstellt — KI weiß nicht was die bisherige Methode gewählt hat und umgekehrt.

Was wir gelernt haben
01

Konsistenz über viele Tests ist wichtiger als einmaliger Peak

Ein einzelner Test mit +40% könnte Zufall sein. 50+ Tests mit konsistent 6–12% sind ein echter Effekt. Wir zeigen den Durchschnitt, nicht den Peak.

02

Reaktivierung zeigt den stärksten Effekt

Innerhalb der 50+ Tests zeigt die Reaktivierungs-Selektion den höchsten Uplift (+47% Response). Andere Segmente liegen im 6–12% Bereich.

03

Datenqualität ist die wichtigste Voraussetzung

Tests mit unbereinigten Daten (fehlendes Kanal-Tracking, inkonsistente Zahlungswege) zeigen keinen Uplift. Das Modell braucht saubere Inputs.

04

3-Gruppen-Setup ist Pflicht für valide Ergebnisse

Nur KI vs. bisherige Methode reicht nicht. Die Schnittmenge (A∩B) zeigt oft welcher Teil des Uplifts auf die Datenauswahl zurückgeht und welcher auf das Modell.

Dieses Experiment hat uns weitergebracht. Welches Problem willst du als nächstes lösen?

Gespräch buchen → Alle Experimente