Estimands

Statistische Beratung: Estimands

(Seite im Aufbau)

Nehmen Sie Kontakt zu ACOMED statistik auf (Tel.: 0341/3910195, E-Mail: info@acomed-statistik), wenn Sie Unterstützung bei der Konzeption, Planung und Analyse Ihrer Studie bzgl. Estimands benötigen.

Folgende Links sind hilfreich. Die Dokumente, insbesondere das Schulungsmaterial, sind unserer Meinung nach auch für Nicht-StatistikerInnen gut verständlich.

  • ICH Guideline EP9 (Statistical principles for clinical trials, hier: keine Informationen zum Thema Estimands): Link
  • Addendum on estimands and sensitivity analysis: Link
  • Schulungsmaterial der ICH zum Thema Estimands: Link

Warum wurden Estimands eingeführt?

Bei der Untersuchung der Wirksamkeit von Behandlungen wird in klinischen Studien von einer idealen Situation ausgegangen: Die Patienten sind der Behandlung bzw. der Beobachtung ausgesetzt, ohne dass im zeitlichen Verlauf Abweichungen auftreten. Derartige Ereignisse ("intercurrent events") sind aber häufig zu beobachten:

  • unzureichende Therapietreue (adherence),
  • eine Unterbrechung der Beobachtung,
  • ein Abbruch der Behandlung aufgrund eines Erfolgs,
  • ein Abbruch oder eine Unterbrechung der Behandlung aufgrund fehlender Wirkung, Nebenwirkungen oder organisatorischen Gründen,
  • die zwischenzeitliche Behandlung mit einem anderen, bekannterweise wirksamen Medikament (rescue-medication),
  • Eintreten einer anderen, schwereren Erkrankung,
  • Tod des Patienten,
  • u.v.a.m.


Es ist aufwändig, diese Ereignisse in die statistische Analyse einzubinden. Ein zentraler Ansatzpunkt ist zunächst das Intended-to-treat-Prinzip: Alle randomisierten Patienten werden in die Analyse aufgenommen. Häufig wird das Prinzip etwas aufgeweicht: Alle randomisierten Patienten mit mindestens 1 Behandlung werden in die Analyse aufgenommen. Die bisherigen Strategien mit den oben erwähnten Abweichungen reichen vom Ignorieren, Ausschluss der betroffenen Patienten bis hin zum Durchführen zahlreicher Sensitivitätsanalysen unter verschiedenen Annahmen. Dies führt dazu, dass statistische Analysen nicht das eigentliche Ziel der Studie adressieren sowie fehlerhafte Schlussfolgerungen gezogen werden können. Schwierig ist die Situation auch aus Sicht der Behörden, die für jede Studie neue Lösungsvorschläge der Sponsoren beurteilen müssen. Von daher war ein strukturierter, systematischer Ansatz nötig.


Mit der Einführung der Estimands wird dem Vorgehen nun ein solcher strukturierter Rahmen gegeben.

Intercurrent events

ToDo: Abbildung
















Estimands

Diese Fragen werden bei dem Estimand Konzept (ICH E9(R1) Addendum, finale Version vom 30. Januar 2020) adressiert. Dieses Addendum stellt einen strukturierten Rahmen für die Verknüpfung von Studienzielen (Ziel der Schätzung: Was soll geschätzt werden?) mit einem geeigneten Studiendesign, der Studiendurchführung sowie Instrumenten für die Analyse (Schätzmethode: Wie soll geschätzt werden?) vor.

Unter einem Estimand versteht man die präzise Beschreibung des Behandlungseffekts in Blick auf die klinische Fragestellung, die durch die klinische Fragestellung beschrieben wird. Es fasst auf dem Level bestimmter Populationen zusammen, wie sich das Behandlungsergebnis für dieselben Patienten unter verschiedenen, zu vergleichenden Behandlungsbedingungen darstellt. Diese Definition hilft aus unserer Sicht noch nicht, wenn es um die konkrete Ausgestaltung bei der Studienplanung geht. Klarer wird es, wenn man auf (1) die Attribute, die zur Etablierung eines Estimands beitragen, und (2) die Strategien, die zur Adressierung der oben genannten Abweichungen dienen, eingeht.

Im Protokoll ist ein primärer Estimand und ggf. weitere, sekundäre Estimands zu spezifizieren. Bei der Konzeption von Estimands sind festzulegen:

  • Attribute (Population, Treatment/Behandlungsmethoden, Endpunkt, Intercurrent event, Ergebnis auf Populationslevel),
  • Strategien zur Beschreibung der klinischen Frage angesichts von Ereignissen
  • Umgang mit fehlenden Werten.

Estimands Attribute

  • Population
  • Treatment/Behandlungsmethoden
  • Endpunktvariable
    Diese könnte - dasselbe Ziel betreffend - z. B. für ein Estimand eine kontinuierlich skalierte Variable sein (change vs. baseline), für ein anderes Estimand eine binär skalierte Variable (Response j/n).
  • Spezifikation wie Ereignisse, die die Messung oder ihre Interpretation beeinflussen (intercurrent events), behandelt werden.
    Z. B. könnte das Auftreten einer Notfallmedikation unabhängig vom späteren Verlauf als "Non-Response" zählen. 
  • Zusammenfassung der Ergebnisse auf Populationslevel
    z. B. baseline-adjustierter Mittelwertunterschied des change vs. baseline für ein Estimand, baseline adjustierter Responseunterschied für ein anderen Estimand

Estimands: fehlende Werteel

Das ICH E9 (R1) Addendum fordert eine genauere Definition dessen, was als "fehlende Werte" bezeichnet wird. Fehlende Werte stellen - auch unabhängig vom Estimands-Konzept - eine Limitation der Daten dar, die im Protokoll ansatzweise und im SAP detailliert festgelegt und bei der statistischen Analyse berücksichtigt werden muss. Fehlende Werte treten nicht nur monoton nach einem bestimmten Zeitpunkt vor Studienende bis zum Studienende auf, sondern auch vereinzelt (nicht monoton), z.B. wenn ein Proband eine geplante Visite nicht wahrnehmen kann oder wenn einzelne Angaben fehlen.


Der Umgang mit fehlenden Werten sollte bereits bei der Studienplanung in Abhängigkeit der (1) Art des Fehlens (MAR - missing at random: Das Fehlen lässt sich auf bekannte Variablen zurückführen und damit beschreiben - die Werte können so geeignet ersetzt (s.u.) werden; MNAR - missing not at random: Das Fehlen lässt sich nicht auf bekannte Variablen zurückführen), (2) vom Muster fehlender Daten (monoton, nicht monoton) und möglichst (3) dem Grund für die fehlenden Werte spezifiziert werden.

Umgang mit fehlenden Werten bedeutet praktisch das Ersetzen fehlender Werte (Imputation). Hierbei wird meist eine multiple Imputation gewählt, d.h. fehlende Werte werden mehrfach aus einer geeignet gewählten Zufallsstichprobe ersetzt, und je Ersetzung wird die Studie analysiert. Am Ende werden die einzelnen Ergebnisse "gemittelt".


Die Zufallsstichprobe kann z. B. entsprechend folgender Ansätze konstruiert werden:

referenzbasierte Imputation: Das Ersetzen erfolgt unter der MAR-Annahme, d. h. es werden Datenlagen ähnlicher Patienten (gleiches Alter, Geschlecht, Ausgangswerte) aus der Kontrollgruppe imputiert.

  • jump-to-reference (J2R): Diese Annahme impliziert, dass die Ergebnisse für Patienten aus der Behandlungsgruppe nach dem Studienausstieg aus der Stichprobe der Probanden aus der Kontrollgruppe gewonnen werden.
  • copy reference (CR): Diese Annahme impliziert, dass die Ergebnisse nach dem Studienausstieg allmählich zu denen der Probanden in der Kontrollgruppe übergehen.
  • copy increment from reference (CIR): Diese Annahme impliziert, dass die Ergebnisse nach dem Studienausstieg einen zeitlichen Verlauf aufweisen, der dem der Kontrollgruppe entspricht, aber die Wirkung der Behandlung bis zum Zeitpunkt des Studienausstieg bis zum Ende der Studie anhält (z.B. wie man es von einer Behandlung erwarten könnte, die nach dem Studienausstieg eine dauerhafte Wirkung hat)


worst-case Analyse: ersetze fehlende Werte durch die schlechtesten Werte (bei Outcome Response)

ToDo. Abbildung

Strategien im Umgang mit Intercurrent Events

Im ICH E9(R1) Addendum werden Strategien zur Beschreibung der interessierenden klinischen Frage in Bezug auf Intercurrent events vorgestellt (die Namen der Strategien dienen nur der Übersichtlichkeit, ihre Verwendung ist nicht obligatorisch):


Treatment policy
Das Auftreten des Intercurrent events ist irrelevant für die Definition des interessierenden Behandlungseffekts, d.h. der Wert der Zielvariable wird unabhängig davon verwendet, ob das Intercurrent event aufgetreten ist oder nicht. Das Intercurrent event wird als Teil der zu vergleichenden Behandlungen betrachtet, was dem in der ICH E9 definierten Intention-to-treat (ITT) Prinzip entspricht.
[Voraussetzung für die Verwendung dieser Strategie: „alle“ Daten nach dem Auftreten des Intercurrent events müssen vorhanden sein. Im Allgemeinen kann diese Strategie nicht für terminale Intercurrent events (z.B. Tod) angewendet werden, da keine Werte für die Zielvariable nach dem Intercurrent event vorhanden sind.](Das Estimand entsprechend Treatment policy wird im Rahmen von Zulassungen häufig von den Behörden gewünscht).


Hypothetical:
Man stellt sich vor, dass das Intercurrent event nicht auftreten würde. Es sind viele mögliche hypothetische Szenarien denkbar, aber nicht alle sind für die Entscheidungsfindung im Bereich der Regulierung interessant. So kann es z.B. von Bedeutung sein, die Wirkung einer Behandlung unter anderen Bedingungen als denen der durchführbaren Studie zu untersuchen (z.B. wenn keine Notfallmedikamente verfügbar sind). 
Erhobene Daten nach einem Intercurrent event werden als nicht sinnvoll betrachtet und daher nicht für die Analyse verwendet. Stattdessen werden Werte basierend auf prä-spezifizierten Annahmen geschätzt bzw. imputiert, z.B. können Werte „ähnlicher“ Probanden der gleichen Behandlungsgruppe verwendet werden.


Composite:
Das Auftreten des Intercurrent events wird als Komponente der Variablen hinzugefügt bzw. in den Endpunkt integriert. Besonders relevant, wenn das Ereignis selbst das aussagekräftigste Ergebnis ist, das beobachtet werden kann, z.B.: Tod, Notfallmedikamente, Unterbrechung der Behandlung aufgrund fehlender Wirksamkeit oder aufgrund Adverse events. Die Strategien müssen sich nicht auf dichotome Endpunkte beschränken, d.h. wenn die Ergebnisse in einer Skala oder einem Punktestand gemessen werden, könnten die Probanden, bei denen das Intercurrent event auftritt, einen schlechten Wert erhalten. Die Strategien sind besonders nützlich für den Umgang mit terminalen Ereignissen (wie dem Tod). Sie können auch sehr nützlich für sekundäre Estimands sein. Das Intercurrent event markiert das Ende der Datenerhebung.
[z.B. Intercurrent event „Notfallmedikamente“ wird in den Endpunkt integriert: ein „Responder“ wird definiert als ein Proband mit positivem Behandlungseffekt zum Zeitpunkt Z und keine Einnahme von Notfallmedikamenten bis zu diesem Zeitpunkt. Nach der Einnahme der Notfallmedikation wird der Patient als "Non-Responder" gezählt, unabhängig vom Behandlungseffekt].


While on treatment (häufig für Safety Analysen verwendet):
Die Strategien können sich auf die Definition des Endpunkts auswirken, z.B. indem der interessierende Beobachtungszeitraum auf den Zeitraum zwischen Baseline und dem Auftreten des Intercurrent events beschränkt wird. Die in der Strategie verwendete Terminologie hängt von dem interessierenden Intercurrent event ab: z.B. " while on treatment”, “while alive”, etc. Es interessieren nur die Daten, welche vor dem Auftreten des Intercurrent events (z.B.: Tod) erhoben wurden [Bemerkung: häufige Messzeitpunkte erforderlich]. Besondere Vorsicht ist geboten, wenn das Auftreten des Intercurrent events zwischen den zu vergleichenden Behandlungen unterschiedlich ist, da es schwierig ist, eine für Schlussfolgerungen zuverlässige Schätzung abzuleiten, wenn die Nachbeobachtungszeiten zwischen den Gruppen unterschiedlich sind.


Principal stratum:
Beschränkung der interessierenden Population auf die Schicht / das Stratum von Probanden, bei denen das Intercurrent event nicht aufgetreten (oder aufgetreten) ist, z.B. könnte man Probanden, bei denen keine Adverse Events aufgetreten sind, die zum Abbruch der Behandlung geführt hätten, als interessierende Population betrachten [Bemerkung: bei der Planung schwer abzuschätzen, auf wie viele Probanden dies zutreffen wird]. Die klinische Fragestellung, die von Interesse ist, bezieht sich nur auf den Behandlungseffekt innerhalb dieser Schicht / dieses Stratums. 
[Es ist im Allgemeinen nicht möglich, diese Probanden im Vorfeld der Studie direkt zu identifizieren, da das Auftreten des Intercurrent events nicht perfekt vorhergesagt werden kann.]


Die vorgestellten Strategien können allein oder in Kombination angewandt werden, um eine Vielzahl von verschiedenen Intercurrent events zu adressieren. Die Wahl der Strategien sollte Gegenstand einer multidisziplinären Diskussion sein, insbesondere zwischen Sponsoren, Klinikern, Statistikern und Regulierungsbehörden. Die Beschreibung der bevorzugten Strategie für den Umgang mit jedem Intercurrent event sollte im Studienprotokoll genau festgelegt werden, ebenso wie die Gründe für diese Wahl.

Beispiel 1r Titel

Für Studien mit der Indikation Schmerz, aber auch darüber hinaus, ist folgender Artikel (open access) lesenswert:

Cai, X., Gewandter, J. S., He, H., Turk, D. C., Dworkin, R. H., & McDermott, M. P. (2020). Estimands and missing data in clinical trials of chronic pain treatments: advances in design and analysis. Pain, 161(10), 2308–2320. https://doi.org/10.1097/j.pain.0000000000001937: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7508757/pdf/nihms-1596883.pdf

Beispiel 2l

Neuer Text

Share by: