FormalPara Zum Beitrag

Leuzinger-Bohleber M, Hautzinger M, Keller W, Fiedler G, Bahrke U, Kallenbach L et al (2019) Psychoanalytische und kognitiv-behaviorale Langzeitbehandlung chronisch depressiver Patienten bei randomisierter oder präferierter Zuweisung. Ergebnisse der LAC-Studie. Psyche – Z Psychoanal 73(02):77–105

FormalPara Erwiderung

Leuzinger-Bohleber M et al (2019) Was sagt die LAC-Depressionsstudie nun wirklich aus? Erwiderung auf die methodenkritischen Betrachtungen. https://doi.org/10.1007/s00278-019-00388-8

Psychodynamische und kognitiv-behaviorale Psychotherapien bieten theoretisch unterschiedlich fundierte, jedoch ähnlich wirksame Behandlungen für unterschiedliche psychische Störungen an. Kürzlich vorgelegte Daten aus einer Studie zum Vergleich von psychoanalytischer Therapie (PAT) und kognitiver Verhaltenstherapie (KVT) bei chronischer Depression legen eine vergleichbare Wirksamkeit nahe, aber die Studie weist methodische Probleme auf. Was zeigt die Studie „Langzeittherapie bei chronischen Depressionen“ (LAC-Depressionsstudie) wirklich?

Mit großem Interesse haben wir daher die erneute Publikation (Leuzinger-Bohleber et al. 2019a) der Ergebnisse der Studie gelesen. Bislang haben die Autoren die regelmäßig veröffentlichten „Tranchen“ des sicherlich beträchtlichen Datensatzes dieses Forschungsprojektes lediglich im kleinen Kreis diskutiert. Da dieses Mal auch in Medien für interessierte Laien (Padberg 2019) darüber berichtet wurde und die Studie als Beleg für eine vergleichbare Effektivität von PAT und KVT verwendet wird, würden wir gern die Gelegenheit wahrnehmen, diese zu kommentieren. Es ist lobenswert, dass die Autoren mit der LAC-Depressionsstudie einen Vergleich der Effekte von Langzeitpsychotherapien verschiedener theoretischer Ausrichtungen bei chronischer Depression vorgelegt haben. Die enorme Anstrengung, ein solches Projekt über einen Zeitraum von über 10 Jahren durchzuführen, muss gewürdigt werden. Die naturalistische Ausrichtung des Versuchsdesigns eignet sich besonders, die Versorgungssituation in Deutschland abzubilden. Diverse, zumeist psychoanalytisch ausgerichtete Verbände beteiligten sich als Sponsoren an der Finanzierung. Die Ergebnisse der LAC-Depressionsstudie dürften jedoch zumindest aus psychoanalytischer Sicht enttäuschend gewesen sein. Folgendes lässt sich aus den bisherigen Publikationen der LAC-Depressionsstudie ableiten:

  • Die PAT und die KVT reduzieren depressive Symptome und erzielen ähnliche Remissionsraten.

  • Die KVT erreicht, unabhängig davon, welchen Messzeitpunkt man betrachtet, die gleichen Effekte mit weniger Behandlungssitzungen.

  • Die angenommenen Symptomverläufe und Unterschiede zwischen den Versuchsgruppen zeigten sich so nicht, ließen sich aber mit dem vorliegenden Versuchsdesign ohnehin nicht nachweisen.

  • Die Patientenpräferenz bei PAT spielt keine Rolle. Mit adäquater statistischer „power“ hätte sich womöglich ein umgekehrter Effekt gezeigt.

Von diesen ernüchternden Aussagen abgesehen, fanden sich bei der genaueren Durchsicht einiger der Publikationen und des dazugehörigen Versuchsprotokolls teils gravierende Unstimmigkeiten, die die zentralen Aussagen der Studie in Zweifel ziehen. Diese ergeben sich aus der unzureichenden Umsetzung des Studienprotokolls, aus einem zur Beantwortung der Hypothesen stellenweise wenig geeigneten Versuchsdesign sowie aus zweifelhaften Umdeutungen der Ergebnisse.

Versuchsprotokoll als grobe Richtlinie bei der Studiendurchführung

Die diversen Publikationen zur LAC-Depressionsstudie variieren stark in ihrer Beschreibung der Therapiedosis und widersprechen sich. So gab das vorab publizierte Versuchsprotokoll (Beutel et al. 2019) an, die geplante KVT-Intervention gemäß dem Manual von Beck (Beck und Rush 1979) zu gestalten, das 25 bis 45 Sitzungen umfasste. In diesen Bereich sollte bei durchschnittlich 32,5 Sitzungen ± 9 Sitzungen der überwiegende Teil der Therapieverläufe liegen. Zwar konnte dieser Zeitraum durch Interventionen für chronische Depressionen wie „cognitive behavioral analysis system of psychotherapy“ (CBASP) oder achtsamkeitsbasierte kognitive Therapie („mindfulness based cognitive therapy“, MBCT) ergänzt werden, doch das Protokoll macht keine Vorschriften zur Dauer dieser Ergänzungen. Bei Beutel et al. – nicht jedoch im Originalprotokoll des Jahres 2012 – ist die Rede davon, dass „Langzeittherapien zwischen 60 und 80 Sitzungen“ vorgesehen waren und in der KVT-gruppe regulär eine, „in Krisen und bei Bedarf jedoch bis zu zwei Sitzungen“ pro Woche erbracht werden sollten. Dies dürfte bei einer einigermaßen gängigen Sitzungsfrequenz in der KVT kaum innerhalb eines Jahres erreichbar gewesen sein, wenn man Feiertage und Urlaube berücksichtigt und nicht von Patienten ausgeht, die konstant in Krisen geraten oder einen erhöhten Therapiebedarf anmelden.

In der Diskussion der Ergebnisse bei Leuzinger-Bohleber et al. (2019a) wiederum wird in vorwurfsvollem Ton angemerkt, dass die KVT-Therapeuten sich nicht an das Protokoll gehalten haben, weil sie keine 60 Sitzungen im ersten Jahr anboten. Demgegenüber sollen die Psychoanalytiker das Versuchsprotokoll berücksichtigt und „nicht mehr als 80 Sitzungen“ angeboten haben. Bereits rein rechnerisch dürfte die Hälfte der Psychoanalytiker bei durchschnittlich 80,4 Sitzungen ± 27,8 Sitzungen die vorgesehene Behandlungsdauer teils ganz beträchtlich überschritten haben. Bei allem Verständnis für die Frustration bei dieser Datenlage: Die regelrechte „Schuldumkehr“ in Sachen Protokollverletzungen wirft viele Fragen auf. Wurde das Versuchsprotokoll nachträglich geändert? Wurden Therapeuten, die die Sitzungsdauer überschritten, benachrichtigt? Warum wurde/wurden die Behandlungsadhärenz mithilfe des „Comparative Psychotherapy Process Scale“ (CPPS)-Rating rigoros überprüft, nicht aber so basale Parameter wie die Sitzungszahl? Es ist außerdem nicht nachvollziehbar, warum bei der Registrierung der Studie (http://www.isrctn.com/ISRCTN91956346) die Operationalisierte Psychodynamische Diagnostik 2 (OPD-2) noch als „primäres Ergebnismaß“ angegeben wurde, in keinem Ergebnisbericht aber, ähnlich wie das Beck-Depressions-Inventar (BDI) und das Quick Inventory of Depressive Symptomatology, Clinician Rating (QIDS-C), auch als solches dargestellt wird. Primäre Ergebnismaße sind in klinischen Studien unverzüglich zu berichten. In der LAC-Depressionsstudie scheint die Vergleichbarkeit bereits im ersten Behandlungsjahr nicht gegeben zu sein, was in diesem Fall sehr zuungunsten der PAT interpretiert werden muss.

Gravierende Unterschiede in Dosis und Wirkung

Aus diesem angeblichen Verstoß gegen das Studienprotokoll seitens der „Konkurrenz“ wurde in der Diskussion der Ergebnisse geschlossen, dass „kaum Aussagen über das Verhältnis von Dosis und Therapie“ zu machen seien. Dabei ist das Gegenteil der Fall: Durch einen Verzicht auf die künstliche Verlängerung der KVT, die ohnehin dem naturalistischen Versuchsdesign widersprochen hätte, sowie die Überschreitung der Sitzungszahl bei der PAT stellt sich viel deutlicher eine Überlegenheit der KVT heraus. Bezüglich der Reduktion psychopathologischer Symptome lässt sich dies, wie in Tab. 1 ersichtlich, leicht darstellen, wenn die angegebenen Mittelwertsunterschiede an der Sitzungszahl relativiert werden. Die KVT-Patienten berichteten relativ zur Sitzungszahl eine um den Faktor 2,6 bis 3 stärkere Symptomreduktion als PAT-Patienten. Dieser Unterschied vergrößerte sich nach 3 Jahren Behandlungsdauer eher noch. Zwar liegen uns keine Rohdaten zu Dosis und Wirkung vor, doch würde uns eine genauere Auswertung sehr interessieren.

Tab. 1 Mittelwertsunterschiede nach einem bzw. 3 Jahren für kognitive Verhaltenstherapie (KVT) und Psychoanalyse (PAT) relativ zur Sitzungsanzahl

Außerdem zeigte sich der größte Unterschied in der Effektivität nach 3 Jahren zwischen den beiden PAT-Gruppen zugunsten der randomisierten Gruppe, was der aufgestellten Unterschiedshypothese sogar eher widerspricht. Angesichts der ansonsten minimalen Unterschiede bei den Behandlungseffekten springt dies geradezu ins Auge – berichtet wird es aber nicht. Dies spiegelt sich auch in den Remissionsraten wider: Es sind 79 % in der Dreijahresmessung bei randomisierten KVT-Patienten und 55 % bei Patienten in der PAT-Präferenzgruppe nicht trivial.

Eine schnelle, effektive Linderung von Symptomen ist sicher ein wichtiger Bestandteil einer erfolgreichen Psychotherapie. Zusätzlich wurden in der LAC-Depressionsstudie mithilfe der OPD‑2 Veränderungen in der psychischen Struktur gemessen, die die PAT in besonderem Ausmaß herbeiführe. Der Behandlungserfolg psychodynamischer Therapien scheint zumindest teilweise von diesen Veränderungen abzuhängen, obwohl andere Studien darauf hinweisen, dass dieser Effekt sich nicht auf die psychodynamischen Therapien beschränkt (Huber et al. 2017). Die in mehreren Arbeiten (Kaufhold et al. 2019; Leuzinger-Bohleber et al. 2019b) berichteten, bei PAT-Patienten häufiger auftretenden Strukturveränderungen in der OPD werden auf die „spezifische therapeutische Fokussierung“ der PAT zurückgeführt. Sie scheinen die Vermutung zu stützen, dass der Erfolg der PAT zumindest teilweise auf diese Veränderungen zurückgeht. Auch hier überrascht, dass die Behandlungsgruppe, nicht aber die – insbesondere in der PAT-Gruppe stark variierende – Anzahl der Sitzungen als Prädiktor für die Anteile der Strukturveränderungen herangezogen wurde. Im ersten Behandlungsjahr, in dem die Sitzungszahl noch nicht völlig auseinandergeht, kommt es ja zu ähnlich starken strukturellen Veränderungen. Relativiert an der Sitzungszahl könnte sich jedoch auch hier die KVT als effektivere Methode zeigen. Der behauptete Mediationseffekt dürfte sich so jedoch nicht belegen lassen.

Ungeeignetes Versuchsdesign und fehlende Power

Eine weitere wichtige Einschränkung besteht hinsichtlich der für die Studie errechneten und später erreichten Stichprobengröße. So wurde der Grenzwert für einen bedeutsamen Unterschied zwischen den Behandlungsformen im Studienprotokoll mit d = 0,5 festgelegt. Diese Effektgröße erscheint unbegründet und viel zu hoch. Die existierende Literatur spricht bereits seit Jahrzehnten von minimalen oder nichtvorhandenen Unterschieden zwischen den Effekten kognitiver und psychodynamischer Methoden (Luborsky et al. 2006), sodass bereits beim Studiendesign ein „equivalence“ oder „non-inferiority design“ hätte naheliegen müssen. Fraglich ist daher z. B., warum nicht zumindest der sensitivere Grenzwert von d = 0,2 gewählt wurde, der mit plausibler Argumentation als Grenzwert für tatsächlich vernachlässigbare Behandlungsunterschiede angesehen werden sollte (Rief und Hofmann 2019). Ein nicht wesentlich größerer Effekt wäre vermutlich für Gruppenunterschiede zwischen den randomisierten und selbst gewählten Therapien zu erwarten gewesen: Hier wäre die Annahme eines Placeboeffekts von etwa d = 0,28 (Hróbjartsson und Gøtzsche 2001) plausibler gewesen. In diesem Zusammenhang reflektieren die Autoren darüber hinaus die erreichte Stichprobenzahl und fügen an:

Diese geringe Stichprobengröße … mag zu einem statistisches [sic] Artefakt geführt haben, sodass mögliche Unterschiede unentdeckt geblieben sein könnten.

Die erreichte Stichprobengröße betrug bereits im ersten Untersuchungsjahr (T4, Zeitpunkt der ersten Hauptanalyse) lediglich n = 185 anstatt der geplanten 240 Teilnehmer (beachte und sogar 360 Teilnehmer nach Berücksichtigung von Drop-outs laut Protokoll). Somit ist die Vermutung eines möglichen statistischen Artefakts im Konjunktiv nicht nötig. Vielmehr ist es faktisch nicht möglich, mit der erreichten Studiengröße einen (bereits liberal gewählten) Behandlungsunterschied reliabel abzubilden. Diese wichtige Einschränkung sollte in der gesamten Interpretation der Ergebnisse berücksichtigt werden. Ein statistisches Artefakt wäre ein falsch-positives Ergebnis, die hier berichteten nichtsignifikanten Unterschiede sind keine Artefakte, sondern waren angesichts der Stichprobengröße zu erwarten.

Auch die bei Leuzinger-Bohleber et al. (2019c) behauptete Präferenz chronisch depressiver Menschen für eine PAT sollte methodenkritisch reflektiert werden: Ist es wirklich so verwunderlich, dass bei der Rekrutierung, die hauptsächlich in psychoanalytisch ausgerichteten Einrichtungen stattfand, eine Präferenz für PAT entstand? Trotz sicherlich sorgfältig durchgeführter Aufklärung nach standardisierten Informationsmaterialien ist ein Rosenthal-Effekt nicht unwahrscheinlich. Auch die persönlichen Erklärungsmuster der Patienten für ihre Depression dürften einen Einfluss gehabt haben (Tompkins et al. 2017) – eine über berufspolitisch günstige Interpretationen hinausgehende Literaturrecherche wäre hier sachdienlich gewesen.

Resümee

Die berufspolitische Brisanz dieser Studie ist den Autoren bewusst: Die PAT steht aufgrund fehlender Hinweise auf die Kosteneffektivität unter starkem Legitimationsdruck. Auch stabile Langzeiteffekte lassen sich bei der KVT nachweisen (Bockting et al. 2015). Trotzdem ist es der Psychotherapieforschung im Allgemeinen und der psychoanalytischen Forschung im Speziellen sicher nicht dienlich, wenn wissenschaftliche Standards verfehlt und ungünstige Ergebnisse im Nachhinein mit viel Interpretation und selektivem Berichten verzerrt dargestellt werden. Eine Gleichwertigkeit der Behandlungsansätze lässt sich aus den Daten nicht ableiten. Dies wird an einigen Stellen in Ad-hoc-Hypothesen lediglich behauptet.

Da verschiedene zentrale Aussagen auf fehlinterpretierten und unklaren Ergebnissen beruhen, die zudem auch in den populären Medien wiedergegeben werden, ist trotzdem eine umfassende Korrektur des oben genannten Beitrags oder zumindest eine transparente Diskussion der methodischen Schwachpunkte angebracht. Gespannt erwarten wir weitere Publikationen zur LAC-Depressionsstudie und hoffen, dass unsere Anmerkungen rezipiert werden.

Fazit für die Praxis

  • Eine große, naturalistische Vergleichsstudie zwischen Psychoanalyse (PAT) und kognitiver Verhaltenstherapie (KVT) bei chronischer Depression weist an entscheidenden Stellen methodische Probleme auf. Sie eignet sich nicht als Beleg für die gleiche Effektivität von KVT und PAT.

  • Stellt man die Behandlungseffekte relativ zur Sitzungszahl dar, stellt sich die KVT in dieser Studie als wesentlich effektiver in der Behandlung chronischer Depression heraus: Sie benötigt ein Viertel der Sitzungen (57 statt 234) für die gleichen Behandlungsergebnisse. Dies gilt vermutlich auch für Veränderungen in der „unbewussten Konfliktstruktur“.

  • Die Effekte unterschiedlicher Therapiemethoden sollten nur als „ähnlich“ bezeichnet werden, wenn sie in angemessen großen Stichproben mit vergleichbaren Sitzungszahlen ähnliche Effekte hervorrufen.