Arbeitsmaterialien

Auf dieser Seite erhalten Sie Informationen zu den Themen

  1. Klassifikation klinischer Studien
  2. Bewertung klinischer Studien
  3. GRADE-Ansatz

1. Klassifikation klinischer Studien

Bei der Klassifikation von Studien (oder Publikationen) kann man entweder eine Einteilung des Studiendesigns oder direkt eine Zuordnung zu Evidenzstufen vornehmen. Eine solchermaßen grobe Klassifikation ersetzt aber nicht die detaillierte Bewertung der Studien.

Klassifikation des Studiendesigns

Die Begriffe zur Bezeichnung klinischer Studiendesign sind vielfältig und teilweise unscharf definiert. Sie werden daher oft widersprüchlich oder falsch verwendet. Eine detaillierte Klassifizierung und einheitliche Benennung von Studiendesigns kann mit Algorithmen vorgenommen werden (z. B. nach Seo et al., 2016).

 

Das richtige Einsortieren klinischer Studiendesign setzt Methodenwissen (insbesondere aus der klinischen Epidemiologie) voraus. In EbM-Kursen wird hierzu Grundwissen vermittelt. Über das Studiendesign allein lässt sich die interne Validität einer Studie jedoch nicht hinreichend bestimmen.

Zuordnung zu Evidenzstufen

Evidenzhierarchien hatten traditionell eine große Bedeutung für die EbM. Heute sieht man Evidenzstufen deutlich kritischer, da sie die Bewertung von Studien scheinbar vereinfachen („Schubladendenken“), obwohl die Validität einer Studie multidimensional ist. Dennoch sind Evidenzhierarchien für einfache Zwecke ein durchaus hilfreiches Werkzeug, mit dem sich Evidenz systematisch sortieren lässt.
Bei Interventionen muss zwischen randomisiert kontrollierten (RCTs) und nicht randomisiert kontrollierten Studien unterschieden werden. Von der großen Gruppe der Kohortenstudien abzugrenzen sind Fall-Kontroll-Studien und Studien ohne Vergleichsgruppe. Das Oxford Centre for Evidence-based Medicine hat 2011 seine Einteilung von Evidenzstufen überarbeitet. Dieses Schema (OCEBM Levels of Evidence Version 2) mit 5 Evidenzstufen wird häufig verwendet und lässt sich vereinfacht so übersetzen:

  • Evidenzstufe 1: Systematische Übersichtsarbeit von randomisiert kontrollierten Studien
  • Evidenzstufe 2: Randomisierte kontrollierte Studie oder Beobachtungsstudie mit dramatischem Effekt
  • Evidenzstufe 3: Nicht randomisierte kontrollierte Kohortenstudie
  • Evidenzstufe 4: Fallserien, Fall-Kontroll-Studien, oder historisch kontrollierte Studien
  • Evidenzstufe 5: Pathophysiologisch-mechanistische Argumente

Da systematische Übersichtsarbeiten im engeren Sinne jedoch keine Primär-Evidenz sind, sondern existierende Evidenz aus Studien zusammenfassen, wird diese Evidenzstufe teilweise (z. B. im Rahmen der GRADE-Methodik) nicht verwendet.
Sehr gebräuchlich ist daher weiterhin die Version 1 der Oxforder Evidenzhierarchie, in der stärker zwischen Kohorten- und Fall-Kontroll-Designs unterschieden wurde, dafür aber die systematischen Übersichtsarbeiten von RCTs noch auf derselben Stufe wie RCTs standen:

  • Evidenzstufe 1: Randomisierte kontrollierte Studie oder Beobachtungsstudie mit dramatischem Effekt
  • Evidenzstufe 2: Nicht-randomisierte kontrollierte Kohortenstudie
  • Evidenzstufe 3: Fall-Kontroll-Studien
  • Evidenzstufe 4: Fallserien
  • Evidenzstufe 5: Pathophysiologisch-mechanistische Argumente

Auch der Gemeinsame Bundesausschuss (G-BA) verwendet in seiner Arbeit die ‚klassische‘ fünfstufige Evidenzhierarchie (OCEBM Levels of Evidence Version 1), wobei allerdings alle retrospektiven Studien der Evidenzstufe 3 zugeordnet werden (siehe G-BA-Verfahrensordnung).

2. Bewertung klinischer Studien

In der Bewertung klinischer Studien (Critical Appraisal) kommt der internen Validität regelhaft die höchste Bedeutung zu. Andere Aspekte von Studien(-publikationen) wie externe Validität (auch als Übertragbarkeit bezeichnet), Qualität der Berichterstattung (siehe Reporting Guidelines) und statistische Präzision sollten hiervon klar abgegrenzt werden. Im Folgenden werden verschiedene Instrumente vorgestellt, die dazu dienen, klinische Studien hinsichtlich ihrer internen Validität (= Risiko für Bias) zu bewerten.

Randomisiert kontrollierte Studien

Drei klassische Aspekte der internen Validität von randomisiert kontrollierten Studien (RCTs) wurden schon 1996 von Jadad empfohlen: Verdeckte Gruppenzuteilung, Verblindung und Intention-to-treat-Analyse. Die Cochrane Collaboration hat den Jadad-Score sinnvoll erweitert, so dass heute das Cochrane Risk-of-Bias Tool als Standard zu Bewertung von RCTs gilt. Eine detaillierte Beschreibung dieses Instruments findet sich in Kapitel 8 des Cochrane Collaboration Handbook. Erfasst werden hiermit 7 Aspekte:

  • Erzeugung der Zufallsreihenfolge
  • Verdeckung der Gruppenzuteilung
  • Verblindung von Probanden und Behandlern
  • Verblindung von Endpunkterhebern
  • Vollständigkeit der Daten zum Endpunkt
  • Nicht-selektives Berichten der Ergebnisse
  • Sonstiges

Nicht-randomisierte kontrollierte Studien

Die Bewertung von nicht-randomisierten Studien (Non-RCTs) ist deutlich komplizierter im Vergleich zu RCTs. Entscheidend ist das Verzerrungspotenzial, das durch ungleich verteilte Störvariablen (Confounder) erzeugt wird. Abzuraten ist von früher gebräuchlichen Bewertungsinstrumenten, wie z.B. der Newcastle-Ottawa-Skala oder MINORS. Stattdessen werden Instrumente wie ROBINS-I oder auch RoBANS empfohlen, die folgende Aspekte von Bias erfassen:

  • Auswahl der Studienteilnehmer
  • Umgang mit Störvariablen (Confounding)
  • Erfassung der Intervention (oder Exposition)
  • Verblindung von Endpunkterhebern
  • Vollständigkeit der Daten zum Endpunkt
  • Nicht-selektives Berichten der Ergebnisse

Studien zur diagnostischen Genauigkeit

Studien zur diagnostischen Genauigkeit sollten mit dem Instrument QUADAS-2 bewertet werden. Es geht darum, die folgenden Aspekte von Bias zu prüfen:

  • Auswahl der Studienteilnehmer (Spectrum Bias)
  • Verwendung eines adäquaten Referenzstandards (Verifikationsbias)
  • Verblindung zwischen Indextest(s) und Referenzstandard
  • Vollständigkeit der Daten
  • Nicht-selektives Berichten der Ergebnisse

Bewertung systematischer Übersichtsarbeiten

Systematische Übersichten (und Meta-Analysen) wurden in Vergangenheit meist mit dem Oxman-Guyatt-Index oder AMSTAR bewertet. Seit 2017 kann AMSTAR-2 als das Standardinstrument angesehen werden. Die folgenden Aspekte sind demnach entscheidend, damit eine systematische Übersicht eine hohe interne Validität aufweist:

  • Prospektive Planung
  • Adäquate Literatursuchen
  • Nachvollziehbarer Ausschluss von Studien
  • Bewertung des Verzerrungspotenzial der eingeschlossenen Studien
  • Adäquate Metaanalyse-Methoden
  • Berücksichtigung des Verzerrungspotenzials im Reviewfazit
  • Prüfung des möglichen Einflusses von Publikationsbias

Bewertung weiterer Studiendesigns

Für Studien ohne Vergleichsgruppe (Fallserien und Fallberichte) existieren nur wenige Bewertungsinstrumente, da diese Evidenz eine ohnehin nur sehr geringe interne Validität aufweist und aufgrund der fehlenden Vergleichsgruppe keine Schätzung von Interventionseffekten erlaubt.

Insgesamt hilfreich zur Bewertung klinischer Studien ist das Manual, das von Cochrane-Deutschland und der AWMF (Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften) erstellt wurde (Manual "Bewertung des Biasrisikos in klinischen Studien").

    

3. Der GRADE-Ansatz

GRADE steht für „Grading of Recommendations, Assessment, Development and Evaluation“. Die GRADE-Methodik erlaubt vor allem in der Leitlinienarbeit eine standardisierte Bewertung der Evidenz und Einstufung der Empfehlungsstärke.

Die GRADE-Arbeitsgruppe startete im Jahr 2000 als informelle Kollaboration von Menschen, die bestehende Bewertungssysteme in der Gesundheitsversorgung verbessern wollten. Die GRADE-Arbeitsgruppe hat es sich zum Ziel gesetzt, einen sinnvollen und transparenten Ansatz für die Bewertung der Qualität der Evidenz und die Ableitung der Stärke einer Empfehlung zu entwickeln. Viele internationale Organisationen – so auch die WHO – nutzen GRADE. Insbesondere in der Erstellung von systematischen Reviews und Leitlinien wird GRADE oft verwendet.

Eine detaillierte Beschreibung des GRADE-Ansatzes ist im J Clin Epidemiol publiziert (Link); eine deutsche Übersetzung dieser Serie ist in der ZEFQ erschienen (Link). Das GRADE-Zentrum in Freiburg bietet regelmäßig Kurse zu GRADE an.


Mehr EbM-Basics?

Nur einen Moment..
Wird geladen