EbM-Glossar
Das Glossar des DNEbM ist ein fortlaufendes Projekt mit dem Ziel, Begriffe der EbM besser verständlich zu machen. Verbesserungsvorschläge werden an die DNEbM-Geschäftsstelle erbeten.
- Einleitung
- Begriffe A-Z
- Glossar als PDF-File (Version von September 2006)
-
Glossar als HTML-File (Version von September 2006)
Einleitung
Ein Wort in eigener Sache
Liebe Nutzer des Glossars,
das vorliegende Glossar des Deutschen Netzwerks Evidenzbasierte Medizin ist ein fortlaufendes Projekt mit dem Ziel, technische Begriffe der evidenzbasierten Medizin besser verständlich zu machen und damit EbM Interessierten den Einstieg zu erleichtern und EbM Anwendern eine Vertiefung der Kenntnisse zu ermöglichen. Das Glossar soll kontinuierlich um weitere Begriffe erweitert werden. Dazu brauchen wir Ihre Unterstützung!
Anregungen zu weiteren Begriffen und Definitionen, die aus Ihrer Sicht in das Glossar aufgenommen werden sollen, können Sie gerne an uns senden.
Regina Kunz, email: RKUnz@uhbs.ch
(Arbeitsgruppe Glossar im DNEbM e. V.)
Begriffe
A 
Absolute Risikoreduktion (ARR)
Absolute Risikozunahme (ARI, absolute risk increase)
Ausschlusskriterien
B 
Behandlungsgruppe (Interventionsgruppe, Verumgruppe)
Beobachtervariabilität (observer variability)
Beobachtungsgleichheit (consistency of observation)
Bias (systematischer Fehler)
C 
Carry-over-Effekt
Confounding
control event rate (CER; Ereignisrate in der Kontrollgruppe)
Critical Appraisal
Critically Appraised Topic (CAT)
Cross-over-Design
D 
Diskrete Variablen
Dichotome Variable
E 
Entscheidungsbaum (decision tree)
Effektmaß
Effectiveness (Wirksamkeit unter Alltagsbedingungen)
Efficacy (Wirksamkeit unter Idealbedingungen)
Einschlusskriterien
Evidenz (evidence)
Evidenz-basierte Medizin (Evidence-Based Medicine, EbM)
Experimentalgruppe
experimental event rate (EER; Ereignisrate in der experimentellen Gruppe)
Externe Validität (Übertragbarkeit, Anwendbarkeit)
F 
G 
Gewichtete mittlere Differenz (Weighted Mean Difference, WMD)
H 
Hawthorne-Effekt/Hawthorne-Experiment
Heterogenität/Homogenität
Homogenität
Hypothese
Hypothesengenerierung
I 
Innere Validität
Intention-to-treat-Analyse
Intervention
Interventionsgruppe
Inzidenz
K 
Klinische Studie
Kohorte
Kohortenstudie
Konfidenzintervall (Vertrauensbereich, confidence interval – CI)
Kontinuierliche/stetige Variablen
Kontrollgruppe
L 
M 
Matched-Pairs-Technik
Matching („Anpassung“)
Meta-Analyse
N 
Nachtest-Wahrscheinlichkeit einer Erkrankung (post-test probability)
Negativer prädikativer Wert
Nullhypothese
Number Needed to Treat (NNT)
Number Needed to Harm (NNH)
O 
Odds ( Chance)
Odds Ratio (OR, Chancenverhältnis)
Outcomes (Ergebnis, Endzustand)
P 
p-Wert
Parallelgruppen-Studie
Per-Protocol Analyse
Plazebo
Positiver prädiktiver Wert
Power (statistische Trennschärfe)
Prädiktion
Prädiktoren/Risikofaktoren (Unterschied zu Risikomarker s.u.)
Prävalenz
Primärliteratur
Publikationsbias (publication bias)
R 
Randomisierte kontrollierte Studie (RCT)
Randomisierung
Referenzstandard (Goldstandard)
Relative Risikoreduktion (RRR)
Relatives Risiko (RR)
Responder
Responserate
Risiko (Rate, Ereignisrate)
Risikomarker
Risikofaktor
Risikostratifikation
S 
Score
Sekundärliteratur
Sensitivität (richtig positive Rate eines Tests)
Sensitivitätsanalyse
Spezifität (richtig-negative Rate eines Tests)
Standardabweichung
Statistische Signifikanz
Stichprobe
Stichprobenfehler
Stratifizierung
Studiendesign
Surrogatendpunkte (intermediäre Endpunkte)
Systematischer Fehler
Systematischer Review (Synonym: Systematische Übersicht)
T 
Test, statistische (statistische Signifikanz)
Test, Signifikant (Signifikanztest)
U 
Umschläge, verschlossene (sealed envelopes)
V 
Validität (innere Validität, Glaubwürdigkeit)
Verblindung
Verdeckte Zuordnung (concealment of allocation)
Vortest-Wahrscheinlichkeit einer Erkrankung (pre-test probability)
W 
Wahrscheinlichkeitsverhältnis (Likelihood Ratio = LR)
Z 
Zufallszahlen (random numbers)
Glossar als HTML-File (Version vom Oktober 2006)
A B C D E F G H I K L M N O P R S T U V W Z
A 
Absolute Risikoreduktion (ARR)
Effektmaß für dichotome Endpunkte*; beschreibt die absolute Differenz der Rate an ungünstigen Ereignissen in der experimentellen Gruppe (E) im Vergleich zur Kontrollgruppe (K), wenn die experimentelle Behandlung wirksam ist (ARR = K – E). Der Kehrwert der ARR ergibt die Number Needed to Treat* (1/ARR = NNT).
Absolute Risikozunahme (ARI, absolute risk increase)
Beschreibt die absolute Differenz der Rate an ungünstigen Ereignissen in der experimentellen Gruppe (E) im Vergleich zur Kontrollgruppe (K), wenn die experimentelle Behandlung schlechter ist (ARI = |K - E| ). Der Kehrwert der ARI ergibt die Number Needed to Harm (1/ARI = NNH).
Ausschlusskriterien
Bei klinischen und epidemiologischen Studien wird die Studienpopulation über explizite Ausschluss- und Einschlusskriterien* definiert. Ausschlusskriterien beschreiben negativ formulierte Eigenschaften, die potentielle Kandidaten von einer Studienteilnahme ausschließen. Sie leiten sich zum großen Teil aus der klinischen oder epidemiologischen Studienfragestellung ab (z.B. Ausschluss von besonderen Risikopatienten), zum Teil auch aus ethischen und rechtlichen Vorgaben. Letztere kommen vor allem bei Interventionsstudien zum Tragen.
B 
Behandlungsgruppe (Interventionsgruppe, Verumgruppe)
Der Anteil an der Studienpopulation in einer kontrollierten Interventionsstudie, der die zu untersuchende Behandlung/Intervention erhält; die Resultate der Behandlungsgruppe werden mit denen der Kontrollgruppe verglichen, um Aussagen über Größe und Richtung von Interventionserfolgen zu erhalten. S. auch Kontrollgruppe; Interventionsgruppe; Experimental Event Rate; Randomisierung; randomisierte kontrollierte Studie.
Beobachtervariabilität (observer variability)
Schwankungen von Mess- oder Untersuchungsergebnissen, die mit der Person des Beobachters in Zusammenhang stehen. Sie ist umso größer, je geringer die Reliabilität des verwendeten Messinstruments ist (z.B. Auskultation von Herztönen); Befunderhebung und/oder -interpretation sind ggfs. beeinflussbar durch die subjektive Wahrnehmung, Erfahrung und Ausbildung, evtl. auch durch Wunschdenken des Untersuchers. Es werden unterschieden: 1. Die Intraobserver-Variabilität bezeichnet die Schwankungen der Ergebnisse, wenn eine Person den gleichen (unveränderten) Untersuchungsgegenstand mehrfach untersucht. 2. Die Interobserver-Variabilität bezeichnet die Schwankungen der Ergebnisse, wenn mehrere Personen denselben Untersuchungsgegenstand untersuchen.
Beobachtungsgleichheit (consistency of observation)
Anforderung an die Durchführung von kontrollierten Studien, alle Studienteilnehmer gleichartig zu beobachten, um Ergebnisverzerrungen durch unterschiedliche Beobachtungsmodalitäten zu verhindern. S. auch Bias.
Bias (systematischer Fehler)
Tendenz der Studienergebnisse, systematisch von den „wahren“ Ergebnissen abzuweichen. Bias führt entweder zu einer Über- oder Unterschätzung der wahren Wirkung einer Maßnahme oder Exposition. Die Ursachen dafür liegen vor allem im Design und der Durchführung der Studie und führen zu systematischen Unterschieden zwischen den Vergleichsgruppen, z.B. bei der Auswahl der Teilnehmer (Selektionsbias), der Erhebung der Endpunkte (measurement bias oder Messungsbias) oder dem Verlust von Teilnehmern in der Studie (attrition bias oder Verschleiß-Bias). Ergebnisse aus Studien mit geringem Risiko für Bias werden als valide angesehen.
C 
Carry-over-Effekt
Störender Effekt in Interventionsstudien mit Cross-Over-Design, wenn die Behandlung der 1. Phase über das Ende dieser Phase hinaus und in die zweite Phase hinein wirkt. So kann das Ergebnis der Behandlung in der 2. Phase beeinflusst und der Vergleich verzerrt werden. Zur Vermeidung dieses Effekts kann vor die 2. Studienphase eine so genannte Wash-out-Phase gesetzt werden, in der die Wirkungen vorangegangener Therapien abklingen.
Confounding
Confounding liegt vor, wenn ein Faktor (Confounder), der nicht direkt Gegenstand der Untersuchung ist, sowohl mit der Intervention/Exposition als auch mit der Zielgröße assoziiert ist und dadurch bei Aussagen über die Beziehung zwischen Intervention/Exposition und Zielgröße „Verwirrung“ stiftet. Häufige Confounder sind z.B. Alter, Geschlecht oder Nikotingenuss. Confounding lässt sich durch ein entsprechendes Studiendesign (z.B. Randomisierung oder Matching) oder durch die Anwendung bestimmter statistischer Verfahren bei der Analyse (Stratifizierung, multivariate Analyse) kontrollieren.
control event rate (CER; Ereignisrate in der Kontrollgruppe)
Anteil der Teilnehmer in der Kontrollgruppe, die in einem definierten Zeitraum ein Ereignis oder einen Endpunkt erleiden. Die Ereignisrate in der Kontrollgruppe wird zur Berechnung der absoluten Risikoreduktion und relativen Risikoreduktion benötigt.
Critical Appraisal
In der evidenzbasierten Medizin kritische Bewertung von wissenschaftlichen Studien mit dem Ziel, zu entscheiden, ob diese geeignet sind, zur Lösung eines spezifizierten Problems aus der medizinischen Versorgung (z.B. beste Behandlungsform für den eigenen Patienten) beizutragen; geprüft werden: 1. Validität; 2. klinische Relevanz; 3. Übertragbarkeit auf den gegebenen Entscheidungskontext. S. auch Bias.
Critically Appraised Topic (CAT)
In der evidenzbasierten Medizin (EbM) ein nach EbM-Methodik gelöstes Problem, das die als präzise formulierte Fragestellung, eine kurze Beschreibung der Informationsrecherche, die strukturierte Kurzfassung einer geeigneten, kritisch bewerteten Studie und die aus den Ergebnissen abgeleitete klinische Schlussfolgerung enthält; unter didaktischen Gesichtspunkten eignet sich die Erstellung von CATs zum Erlernen und Vertiefen der EbM-Methoden. Im Internet stehen freie Programme, so genannte CAT-Maker, zur Verfügung. Wenn eine CAT-Sammlung als Informationsquelle weiter verwendet werden soll, sind 3 Probleme zu bedenken: 1. CATs können fehlerhaft sein, ein Peer Review ist daher unverzichtbar. 2. CATs geben meist nur eine einzige Quelle zum klinischen Problem wieder und sind fast nie repräsentativ für die gesamte, zum Thema publizierte Literatur. 3. je nach Thema veralten CATs schnell.
Cross-over-Design
In Cross-over-Studien wird die Wirksamkeit zweier Behandlungsformen verglichen, indem diese zeitlich versetzt den gleichen Probanden verabreicht werden. Die typische Cross-over-Studie hat mindestens zwei Studienphasen. In der ersten Studienphase erhalten die Probanden des ersten Studienarmes zunächst Therapie A, die Probanden des zweiten Studienarmes Therapie B. Nach einer definierten Behandlungsdauer wird zur 2. Studienphase gewechselt: Studienarm eins erhält nun Therapie B und Studienarm zwei Therapie A. Die Wirksamkeit der Therapien kann am Ende der Studie sowohl im Intra- als auch im Intergruppenvergleich bestimmt werden.
D 
Diskrete Variablen
Diskrete Variablen weisen im Gegensatz zu kontinuierlichen Variablen nur eine begrenzte Zahl eindeutig voneinander abgrenzbarer Zuständen auf (z.B. Augenfarbe: blau, grau, braun, grün). Eine Sonderform sind dichotome Variablen, die lediglich zwei Alternativen aufweisen, z.B. Raucher/Nichtraucher, lebend oder tot, Test-positiv oder Test-negativ.
Dichotome Variable
E 
Entscheidungsbaum (decision tree)
Darstellung von Entscheidungsregeln, welche die logische Abhängigkeit von hierarchisch angeordneten Ereignissen in Form eines Baumdiagramms veranschaulicht. Die Wahlknoten an den Astverzweigungen sind mit einer bestimmten (angenommenen oder bekannten) Wahrscheinlichkeit für den Nutzen der Intervention versehen. Von diesen gehen weitere Äste mit neuen Ergebnissen und entsprechenden Wahrscheinlichkeiten ab. Die Wahrscheinlichkeit des Nutzens einer Maßnahme kann so abgeleitet werden, die Validität der Aussage ist aber natürlich abhängig von der Güte der eingesetzten Informationen. Entscheidungsbäume sind Entscheidungshilfe zur Visualisierung komplexer Abhängigkeitsstrukturen, Identifizierung aller Entscheidungsmöglichkeiten und deren Ergebnisse sowie Lösung von Wahrscheinlichkeitsaufgaben.
Effektmaß
Maßzahl, um die Stärke eines Effekts zu quantifizieren. Gebräuchliche Effektmaße für dichotome Endpunkte sind das relative Risiko (RR) oder die Odds Ratio* (OR), gebräuchliche Effektmaße für kontinuierliche* Endpunkte sind in Einzelstudien die standardisierte mittlere Differenz (SMD) und in Meta-Analysen die gewichtete mittlere Differenz (weighted mean difference, WMD).
Effectiveness (Wirksamkeit unter Alltagsbedingungen)
Beschreibt die Wirksamkeit einer Maßnahme unter Routinebedingungen. Im Gegensatz zur Efficacy („Wirksamkeit unter Idealbedingungen“) untersuchen Effectiveness-Studien die Frage: Wirkt die Maßnahme unter den Bedingungen der Routineversorgung?
Efficacy (Wirksamkeit unter Idealbedingungen)
Beschreibt die Wirksamkeit einer Maßnahme unter Idealbedingungen. Efficacy-Studien zeichnen sich durch hohe innere Validität aus, die Ergebnisse sind jedoch möglicherweise nur bedingt auf die Routineversorgung übertragbar.
Einschlusskriterien
Bei klinischen und epidemiologischen Studien wird die Studienpopulation über explizite Einschluss- und Ausschlusskriterien definiert. Einschlusskriterien beschreiben positiv formulierte Eigenschaften, die die potentiellen Studienteilnehmer erfüllen müssen. Sie leiten sich einerseits ab aus der klinischen oder epidemiologischen Studienfragestellung, andererseits aus rechtlichen und ethischen Vorgaben. Typische Einschlusskriterien sind das Vorliegen einer bestimmten Erkrankung, gegebenenfalls spezifiziert nach Schweregrad, bisherigem Verlauf und Vorbehandlungen; Zugehörigkeit zu einer definierten Altersgruppe; … Bei der Rekrutierung von Studienteilnehmern wird zunächst die Erfüllung der Einschlusskriterien festgestellt, in einem zweiten Schritt wird überprüft, ob Ausschlusskriterien die Studienteilnahme verbieten.
Evidenz (evidence)
Der Begriff „Evidenz“ im Kontext der Evidenzbasierten Medizin leitet sich vom englischen Wort „evidence“ = Nach-, Beweis ab und bezieht sich auf die Informationen aus klinischen Studien, die einen Sachverhalt erhärten oder widerlegen.
Evidenz-basierte Medizin (Evidence-Based Medicine, EbM)
Unter Evidenz-basierter Medizin (EbM) oder evidenzbasierter Praxis im engeren Sinne versteht man eine Vorgehensweise des medizinischen Handelns, individuelle Patienten auf der Basis der besten zur Verfügung stehenden Daten zu versorgen. Diese Technik umfasst die systematische Suche nach der relevanten Evidenz in der medizinischen Literatur für ein konkretes klinisches Problem, die kritische Beurteilung der Validität der Evidenz nach klinisch-epidemiologischen Gesichtspunkten; die Bewertung der Größe des beobachteten Effekts sowie die Anwendung dieser Evidenz auf den konkreten Patienten mit Hilfe der klinischen Erfahrung und der Vorstellungen der Patienten. Ein verwandter Begriff ist die evidenzbasierte Gesundheitsversorgung („Evidence-Based Health Care“), bei der die Prinzipien der EbM auf alle Gesundheitsberufe und alle Bereiche der Gesundheitsversorgung, einschließlich Entscheidungen zur Steuerung des Gesundheitssystems, angewandt werden.
Experimentalgruppe
experimental event rate (EER; Ereignisrate in der experimentellen Gruppe)
Anteil der Teilnehmer in der experimentellen Gruppe einer klinischen Studie, die in einem definierten Zeitraum ein Ereignis oder einen Endpunkt erleiden. Die Ereignisrate (Risiko) in der experimentellen Gruppe wird zur Berechnung der absoluten Risikoreduktion und relativen Risikoreduktion benötigt.
Externe Validität (Übertragbarkeit, Anwendbarkeit)
Beschreibt die Übertragbarkeit von Studienergebnissen auf die Patienten in der Routineversorgung, d.h. auf Patienten, die nicht an der Studie teilgenommen haben (s.a. Validität).
F 
Fall-Kontroll-Studie
Retrospektive Beobachtungsstudie, bei der eine Gruppe von Personen mit einer Zielerkrankung („Fällen“) und eine Gruppe von Personen ohne die Erkrankung („Kontrollen“) auf das Vorhandensein von Expositionsfaktoren (Risiko- oder protektive Faktoren) verglichen werden.
G 
Gewichtete mittlere Differenz (Weighted Mean Difference, WMD)
Effektmaß für kontinuierliche Endpunkte (s. Effektmaß), die auf derselben Skala gemessen werden (z.B. Größe) zur Beschreibung des Gesamteffekts, wenn Studien in Meta-Analysen gepoolt werden. Dabei erhalten die Einzelstudien ein unterschiedliches Gewicht, um wichtige Studieninformationen, wie z.B. Größe der Studie oder Präzision des Effekts, zu berücksichtigen.
H 
Hawthorne-Effekt/Hawthorne-Experiment
Phänomen, dass in Studien allein durch die Tatsache, dass Probanden vermehrte Aufmerksamkeit erfahren, Effekte erzeugt werden können. Erkenntnis stammt von einem kontrollierten sozialwissenschaftlichen Experiment, mit dem 1927 in den Hawthorne-Werken (USA) überprüft werden sollte, inwieweit eine Verbesserung der äußeren Arbeitsbedingungen (Ergonomie, Lichtverhältnisse, Pausenzeiten, Länge des Arbeitstages) die Produktivität von Arbeiterinnen steigern kann. Vor, während und nach der Versuchsreihe fanden intensive Besprechungen mit den Probandinnen statt. Die Leistungen der Arbeiterinnen mit geänderten Arbeitsbedingungen wurden mit den Leistungen einer Kontrollgruppe verglichen. Überraschenderweise stieg die Produktivität in beiden Gruppen an, d.h. auch in der Kontrollgruppe, die nur vermehrte Aufmerksamkeit, aber keine verbesserten Arbeitsbedingungen erfuhr.
Heterogenität/Homogenität
In systematischen Reviews oder Meta-Analysen bezeichnet Homogenität (Heterogenität), inwieweit die in den eingeschlossenen Studien gefundenen Effekte ähnlich (homogen) oder verschieden (heterogen) sind. Mit statistischen Heterogenitätstests kann festgestellt werden, ob die Unterschiede zwischen den Studien größer sind, als zufallsbedingt zu erwarten wäre. Als Ursachen für Heterogenität kommen Unterschiede in den Patientencharakteristika, Intervention oder Endpunkte zwischen den Studien in Frage, was aus klinischer Sicht beurteilt werden muss. Die Durchführung einer Meta-Analyse aus heterogenen Studien ist problematisch.
Homogenität
Hypothese
Aussage, Behauptung, oder Theorie, deren Zutreffen oder Nicht-Zutreffen mit Hilfe einer Studie oder eines Experimentes geprüft werden soll.
Hypothesengenerierung
Prozess des Ableitens von Hypothesen*, die in einer Studie oder mithilfe eines Experimentes überprüft werden können. Überprüfbare Hypothesen werden aus theoretischen Ableitungen, zufälligen oder systematischen Beobachtungen oder Pilotstudien gewonnen.
I 
Innere Validität
s. Validität
Intention-to-treat-Analyse
Analyse-Technik, bei der die Patienten nach ihrer ursprünglichen Gruppenzuteilung analysiert werden, unabhängig davon, ob sie die zugeordnete (intendierte) Therapieform vollständig, partiell oder gar nicht erhalten haben, oder ob sie in die alternative Behandlungsgruppe übergewechselt sind.
Intervention
In klinischen Studien Bezeichnung für die Maßnahme, deren Wirksamkeit untersucht werden soll. Interventionsstudie; Kontrollgruppe; Risikoreduktion.
Interventionsgruppe
Inzidenz
Die Inzidenz beschreibt die in einem bestimmten Zeitraum neu aufgetretene Anzahl an Krankheitsfällen in einer definierten Population. S. auch Prävalenz.
K 
Klinische Studie
Unscharf definierter Begriff für eine Studie, in der eine Intervention an einer Gruppe von Patienten untersucht wird. Oberbegriff für unterschiedliche Studientypen, z.B. nicht kontrollierte, kontrollierte und randomisierte klinische Studien.
Kohorte
Gruppe von Personen mit gemeinsamen Charakteristika (z.B. Alter, Geschlecht, Gesundheitszustand), die in klinischen und epidemiologischen Studien beobachtet werden (s. Kohortenstudie); Einteilung: 1. geschlossene Kohorte: Alle Probanden werden zum gleichen Zeitpunkt in die Beobachtung eingeschlossen und verbleiben dort bis zum Eintritt des Zielereignisses oder bis zum Ende der Studie. 2. offene Kohorte: Personen werden nach und nach in die Beobachtung aufgenommen und/oder scheiden nach einer definierten Beobachtungsdauer wieder aus der Studie aus. 3. Sonderform Geburtskohorte: enthält alle Personen einer umschriebenen Region, die im gleichen, meist eng definierten Zeitraum geboren wurden.
Kohortenstudie
Vergleichende Beobachtungsstudie, in der Personen (Kohorte) mit bzw. ohne eine Intervention/Exposition (zu der sie nicht von dem Studienarzt zugeteilt wurden) über einen definierten Zeitraum beobachtet werden, um Unterschiede im Auftreten der Zielerkrankung festzustellen. Kohortenstudien können prospektiv oder retrospektiv durchgeführt werden.
Konfidenzintervall (Vertrauensbereich, confidence interval – CI)
Bereich, in dem der „wahre“ Wert einer Messung (Effektgröße) mit einer bestimmten Wahrscheinlichkeit erwartet werden kann (üblicherweise 95% 95%-Konfidenzintervall). Die Effektgröße kann dabei z.B. ein Therapieeffekt, ein Risiko oder die Sensitivität eines diagnostischen Tests sein. Das Konfidenzintervall beschreibt die Unsicherheit über die Zuverlässigkeit der Aussage zur Effektgröße. Die Breite des Konfidenzintervalls hängt u.a. von der Zahl der in die Studie eingeschlossenen Patienten ab und wird mit zunehmender Patientenzahl enger, d.h. die Effektgröße kann präziser geschätzt werden.
Kontinuierliche/stetige Variablen
Im Gegensatz zu diskreten Variablen können kontinuierliche Variablen theoretisch eine unendlich große Zahl von Werten entlang eines Kontinuums annehmen. Körpergröße, Gewicht und viele Laborwerte sind kontinuierliche Variablen.
Kontrollgruppe
Anteil an der Studienpopulation in einer kontrollierten Interventionsstudie, der die zu untersuchende Behandlung/Intervention nicht erhält, aber ggfs. mit einer Plazebointervention oder einer Standardbehandlung versorgt wird; die Resultate der Kontrollgruppe werden mit denen der Behandlungsgruppe verglichen, um Aussagen über Größe und Richtung von Interventionserfolgen zu erhalten.
Behandlungsgruppe; Control Event Rate; Randomisierung; Hawthorne-Experiment
L 
Likelihood Ratio
s. Wahrscheinlichkeitsverhältnis*
M 
Matched-Pairs-Technik
Verfahren zur Herstellung von möglichst strukturgleichen Untersuchungsgruppen in kontrollierten klinischen und epidemiologischen Studien. „Strukturgleich“ bezieht sich auf alle Faktoren, die einen wesentlichen Einfluss auf die Zielgröße der Studie haben können. Für jedes Individuum der Untersuchungsgruppe wird ein in möglichst vielen Einflussfaktoren (Matchingkriterien) entsprechendes Individuum in die Kontrollgruppe aufgenommen. Häufig verwendete Matchingkriterien sind Alter, Geschlecht, Ethnizität, Schweregrad der Erkrankung, Komorbidität und Risikofaktoren.
Matching („Anpassung“)
Bestreben, zwei Untersuchungsgruppen möglichst vergleichbar zu machen. Dabei sollten alle Merkmale beachtet werden, die einen wesentlichen Einfluss auf die Zielgröße der Studie haben.
Beim Matching nach Häufigkeiten werden die Merkmalsträger in den zu vergleichenden Gruppen ausgezählt (Frequency Matching). z.B. sollen in einer Studie zur koronaren Herzkrankheit in beiden Gruppen gleich hohe Anteile von Frauen, Rauchern, Diabetikern oder Hypertonikern vertreten sein um eine systematische Verzerrung der Ergebnisse zu verhindern.
Beim individuellen Matching sollen für jedes Individuum der Untersuchungsgruppe ein oder mehrere, den Matchingkriterien entsprechende, Individuen in die Kontrollgruppe aufgenommen werden. S.auch „Matched-Pairs-Technik“.
Meta-Analyse
Statistisches Verfahren, um die Ergebnisse mehrerer Studien, die die gleiche Frage bearbeiten, quantitativ zu einem Gesamtergebnis zusammenzufassen und dadurch die Aussagekraft (Genauigkeit der Effektschätzer) gegenüber Einzelstudien zu erhöhen. Meta-Analysen werden mit zunehmender Häufigkeit in systematischen Reviews eingesetzt. Allerdings beruht nicht jede Meta-Analyse auf einem systematischen Review.
N 
Nachtest-Wahrscheinlichkeit einer Erkrankung (post-test probability)
Beschreibt die Wahrscheinlichkeit über das Vorliegen einer Erkrankung unter Berücksichtigung der Ergebnisse eines diagnostischen Tests. Bei Tests mit hoher Testgenauigkeit ändern sich die geschätzten Nachttest-Wahrscheinlichkeiten beträchtlich gegenüber den Vortest-Schätzungen.
Negativer prädikativer Wert
Anteil der Personen mit negativem Testergebnis, bei denen die gesuchte Krankheit tatsächlich nicht vorliegt. Dieser Wert hängt von der Prävalenz der Erkrankung in der untersuchten Gruppe ab.
Nullhypothese
Bei der Durchführung statistischer Signifikanztests wird die Hypothese aufgestellt, dass zwischen den verschiedenen Gruppen einer Studie kein Unterschied besteht. Aus statistischer Sicht ist z.B. eine Behandlung wirksam, wenn man durch den statistischen Test die Nullhypothese, dass es zwischen den Ergebnissen der experimentellen und der Kontrollgruppe keinen Unterschied gibt, verwerfen kann (s. auch statistische Signifikanz).
Number Needed to Treat (NNT)
Klinisch intuitives Effektmaß für dichotome Endpunkte, um die Auswirkung einer Behandlung zu beschreiben. Gibt die Anzahl an Patienten wieder, die behandelt werden müssen, um 1 zusätzliches ungünstiges Ereignis zu verhindern. Die NNT wird als 1/ARR (s. a. absolute Risikoreduktion) berechnet.
Number Needed to Harm (NNH)
Klinisch intuitives Effektmaß für dichotome Endpunkte, um die ungünstigen Auswirkung einer Behandlung zu beschreiben. Gibt die Anzahl an Patienten wieder, bei deren Behandlung mit einem zusätzlichen Fall unerwünschter Ereignisse/einer Komplikation gerechnet werden muss. Die NNT wird als 1/ARI (s. a. absolute Risikozunahme) berechnet.
O 
Odds ( Chance)
Beschreibt in einer Gruppe das Verhältnis zwischen der Anzahl von Teilnehmern mit einem Endpunkt und der Anzahl von Teilnehmern ohne diesen Endpunkt. Wenn also 30 von 100 Teilnehmern den Endpunkt entwickeln (und 70 nicht), beträgt die Odds oder 0.42 (siehe auch Risiko).
Odds Ratio (OR, Chancenverhältnis)
Effektmaß für dichotome Daten. Bezeichnet das Verhältnis (Ratio) der Odds, dass ein Ereignis oder Endpunkt in der experimentellen Gruppe eintritt, zu der Odds, dass das Ereignis in der Kontrollgruppe eintritt. Eine OR von 1 bedeutet, dass zwischen den Vergleichsgruppen kein Unterschied besteht. Bei ungünstigen Endpunkten zeigt eine OR < 1, dass die experimentelle Intervention wirksam ist, um die Odds für das Auftreten dieser ungünstigen Endpunkte zu senken (s. auch relatives Risiko).
Outcomes (Ergebnis, Endzustand)
Übergeordneter Begriff für die Auswirkungen von therapeutischen oder präventiven Maßnahmen und anderen Expositionen.
P 
p-Wert
p-Werte (p von probability) beschreiben die Wahrscheinlichkeit, dass der beobachtete (oder ein noch extremerer) Effekt einer Studie aufgetreten sein könnte, wenn die Nullhypothese richtig und der Effekt auf das Spiel des Zufalls zurückzuführen ist. Je kleiner der Wert, desto deutlicher spricht das beobachtete Ergebnis gegen die Nullhypothese. Es ist eine Konvention, dass ein p-Wert gleich oder kleiner 0.05 als statistisch signifikant angesehen wird. Wenn die Signifikanz von Effekten interpretiert wird, sollten p-Werte immer im Zusammenhang mit Konfidenzintervallen verwendet werden.
Parallelgruppen-Studie
Klassisches Design von kontrollierten Interventionsstudien, bei denen die Studienarme zeitlich parallel laufen (s. auch Cross-over-Studie).
Per-Protocol Analyse
Auswertungsmethode für (randomisierte kontrollierte) Interventionsstudien. Die Ergebnisse der Studienteilnehmer werden nur dann in der Auswertung berücksichtigt, wenn die Behandlungen (Verum- oder Kontrollbehandlung) protokollgemäß durchgeführt wurden. Die Per-Protocol Analyse erlaubt die Abschätzung des Wirkungspotentials einer Behandlungsform unter optimalen Bedingungen. Nachteil der Per-Protocol Analyse ist, dass das Randomisierungschema durchbrochen wird. Damit ist die Strukturgleichheit der zu vergleichenden Gruppen nicht mehr gegeben und es besteht die Möglichkeit systematisch verzerrter Ergebnisse. Per-Protocol Analysen werden vor allem in Interventionsstudien der Phasen I und II eingesetzt, um das therapeutische Potential und optimale Dosierungen für eine Behandlungsform zu finden. Das Gegenteil einer Per-Protocol Analyse ist die Intention-to-Treat Analyse.
Plazebo
In einer pragmatischen Definition ein meist zu Studienzwecken eingesetztes „Schein-Medikament“ ohne pharmakologisch aktive Substanz. Das Placebo darf hinsichtlich seiner äußeren Eigenschaften nicht von der aktiven Behandlung (dem Verumpräparat) unterscheidbar sein, wenn es seinen Zweck erfüllen soll.
Positiver prädiktiver Wert
Anteil der Personen mit positivem Testergebnis, bei denen die gesuchte Krankheit auch tatsächlich vorliegt. Dieser Wert hängt von der Prävalenz der Erkrankung in der untersuchten Gruppe ab.
Power (statistische Trennschärfe)
Die Fähigkeit einer Studie, einen tatsächlich vorhandenen Unterschied statistisch signifikant (s. statistische Signifikanz*) nachzuweisen und die Nullhypothese zu verwerfen, wenn sie tatsächlich falsch ist. Der Nachweis bezieht sich auf a priori festgelegte Unterschiede in den Endpunkten („Outcomes“) von Therapie- und Kontrollgruppe. Da die Power u.a. entscheidend vom Stichprobenumfang abhängt, kann der allgemein übliche Wert von 80% nur durch eine ausreichend große Stichproben sichergestellt werden.
Prädiktion
Vorhersage, dass mit einer beschreibbaren Wahrscheinlichkeit ein Zustand oder ein Ereignis eintreten wird.
Prädiktoren/Risikofaktoren (Unterschied zu Risikomarker s.u.)
Zustände, Merkmale oder Ereignisse, deren Vorhandensein oder Ausprägung die Vorhersage erlauben, dass ein bestimmter Zustand oder ein bestimmtes Zielereignis eintreten wird. Beispiele für Prädiktoren im Bereich Medizin sind genetische Merkmale, die zum Auftreten bestimmter Erkrankungen prädisponieren oder Risikofaktoren wie Diabetes für das Auftreten eines Herzinfarkts. Der Begriff Risikomarker wird oft verwendet, um eine Assoziation ohne gesicherte Kausalität auszudrücken, während der Begriff Risikofaktor häufig eine Kausalität impliziert. Die Nomenklatur ist hier jedoch nicht einheitlich. Wie gut sich Outcomes aus Prädiktoren voraussagen lassen, wird in der Epidemiologie mithilfe von Regressionsanalysen ermittelt.
Prävalenz
Die Prävalenz beschreibt den Anteil Erkrankter an der Gesamtzahl einer definierten Population zu einem bestimmten Zeitpunkt. S. auch Inzidenz.
Primärliteratur
Publikationen, in denen Wissenschaftler ihre eigenen bzw. die Ergebnisse ihrer Forschungsgruppe (Primärforschung) veröffentlichen. S. Sekundärliteratur.
Publikationsbias (publication bias)
Systematischer Fehler (Bias) aufgrund einer selektiven Publikationspraxis, bei der Studien mit positiven und signifikanten Ergebnissen eine größere Chance haben, publiziert zu werden als Studien mit negativen und nicht-signifikanten Resultaten. Ein systematischer Review oder eine Meta-Analyse, die sich ausschließlich auf publizierte Studien stützt, läuft Gefahr, den Effekt der untersuchten Intervention zu überschätzen.
R 
Randomisierte kontrollierte Studie (RCT)
Eine experimentelle Studie, bei der die Patienten nach einem Zufallsverfahren (mit verdeckter Zuordnung) auf die Therapie- bzw. die Kontrollgruppe verteilt (Randomisierung) und auf das Auftreten der festgelegten Endpunkte in den einzelnen Gruppen nachbeobachtet werden.
Randomisierung
Verfahren, das eine zufällige Verteilung der Patienten auf eine Therapie- und eine Kontrollgruppe bewirkt (s.a. randomisierte kontrollierte Studie). Dies kann durch (computergenerierte) Zufallszahlen oder andere Mechanismen erreicht werden. Damit soll sicher gestellt werden, dass alle Teilnehmer die gleiche Chance haben, der einen oder anderen Gruppe zugeordnet zu werden und es wahrscheinlich ist, dass sich (bei ausreichender Studiengröße) bekannte wie unbekannte Risiko- und Prognosefaktoren ausgeglichen auf die beiden Gruppen verteilen. Wenn sich zwischen den beiden Gruppen in den Endpunkten ein Unterschied zeigt, kann dieser tatsächlich der experimentellen Intervention zugeordnet werden.
Referenzstandard (Goldstandard)
Bei der Erfassung der Testgenauigkeit („accuracy“) von diagnostischen Tests gilt als Referenzstandard das Verfahren, das die derzeit beste zur Verfügung stehende Methode beschreibt und an dem neue bzw. alternative Methoden gemessen werden.
Relative Risikoreduktion (RRR)
Die relative Senkung der Rate an ungünstigen Ereignissen in der experimentellen Gruppe (E) einer Studie im Vergleich zur Kontrollgruppe. Sie wird wie folgt berechnet: (s.a. absolute Risikoreduktion). Beispiel: Das Risiko für eine gastro-intestinale Blutung auf einer Intensivstation beträgt ohne Behandlung (Kontrollgruppe) 10% oder 0.10, bei Prophylaxe mit H2 -Blockern (E) 7% oder 0.07: Die RRR beträgt = 0.3 oder 30%.
Relatives Risiko (RR)
Effektmaß für dichotome Variablen. Das relative Risiko in einer Therapiestudie bezeichnet das Verhältnis zwischen des Risikos in der experimentellen Gruppe und dem Risiko in der Kontrollgruppe. Ein relatives Risiko von 1 bedeutet, dass zwischen den Vergleichsgruppen kein Unterschied besteht (s. auch absolute Risikoreduktion, relative Risikoreduktion und Odds Ratio). Bei ungünstigen Ereignissen zeigt ein RR < 1, dass die experimentelle Intervention wirksam ist, um das Auftreten von ungünstigen Ereignissen zu senken.
Responder
1. Personen, die auf eine spezifische Behandlung (z.B. Medikamente) in der erwünschten Weise reagieren, z.B. Anteil an Patienten mit diabetischer Proteinurie, die auf ACE-Hemmer mit dem erwarteten Rückgang der Proteinurie reagiert (vergl. auch Therapieversager).
2. Personen einer Studienpopulation, die sich aktiv an der Studie, z.B. durch Rücksenden eines ausgefüllten Fragebogens, beteiligen.
Responserate
1. Anteil von Patienten, die auf eine Behandlung mit dem angestrebten Ergebnis reagieren (z.B. Rückgang der Tumorgröße).
2. Anteil der Studienpopulation , der sich aktiv an der Studie, z.B. einer Umfrage, beteiligt. Schicken beispielsweise die Hälfte der angeschriebenen Personen in einem Survey einen Fragebogen zurück, beträgt die Responserate 50%. Die Responserate sagt nichts über die Gültigkeit der Antworten aus – z.B. ob der Fragebogen korrekt ausgefüllt wurde. Je höher die Responserate in einer Studie ist, desto valider sind die Ergebnisse zu bewerten. Bei niedrigen Responseraten besteht immer die Gefahr von systematisch verzerrten Ergebnissen – da Charakteristika der nicht-antwortenden Studienpopulation möglicherweise in Beziehung zur Untersuchungsgröße der Studie stehen.
Risiko (Rate, Ereignisrate)
Der Anteil von Personen in einer Gruppe, bei denen ein bestimmter Endpunkt auftritt. Wenn z.B. in einer Gruppe von 100 Personen 30 einen bestimmten Endpunkt entwickeln (und bei 70 Personen das Ereignis nicht auftritt), ist das Risiko (oder die Ereignisrate) oder 0.3 oder 30% (s. auch Odds).
Risikomarker
Merkmal, welches auf ein erhöhtes Risiko für eine Krankheit oder ein negatives Outcome hinweist, ohne selber kausal an der Entstehung beteiligt zu sein bzw. den Krankheitsverlauf zu beeinflussen. Die Beseitigung eines Risikomarkers verringert nicht das Krankheitsrisiko oder das Risiko eines ungünstigen Verlaufs. Ein typisches Beispiel für Risikomarker sind HLA-Antigene wie z.B. HLA-B-27 für die Entwicklung eines Morbus Bechterew.
Risikofaktor
s. Prädiktoren
Risikostratifikation
Aufteilung („Schichtung“) einer Studienpopulation in mehrere Untergruppen (Strata) in Abhängigkeit vom Risikostatus der Probanden. Die Risikostratifikation wird verwendet, um die Verzerrung von Studienergebnissen durch unterschiedliche Risikoexposition der Studienteilnehmer zu vermeiden. z.B. ist bei vielen Krebserkrankungen ein fortgeschrittenes Krankheitsstadium ein bekannter Risikofaktor für ungünstige Behandlungsergebnisse (= schlechte Prognose). Daher werden die Auswertungen in Therapiestudien nach Krankheitsstadium stratifiziert, was eine Verzerrung der Gesamtergebnisse durch den Einschluss von Probanden mit unterschiedlichen Prognosen vermeidet und eine präzise Aussage zur Wirksamkeit innerhalb der jeweiligen Risikogruppe sicherstellt.
S 
Score
Punktwert, der aus der Erfassung einer Anzahl von Einzelinformationen in einem definierten Erfassungssystem nach einem festgelegten Algorithmus gebildet wird. Ein bekanntes Beispiel ist der APGAR-Score zur schnellen und systematischen Erfassung des Vitalzustands eines Neugeborenen nach der Geburt. Für Atmung, Herztätigkeit, Hautfarbe, Muskeltonus und Reflexe werden je 0 bis 2 Punkte vergeben und bilden aufsummiert den APGAR-Score. Ein APGAR-Score von 6 oder weniger zeigt einen behandlungsbedürftigen Zustand des Neugeborenen an.
Sekundärliteratur
Publikationen, in denen über die Werke anderer berichtet wird. Die Literaturübersicht, zu der auch systematische Übersichtsarbeiten und Meta-analysen gehören, ist eine Sonderform der Sekundärliteratur. Literaturübersichten fassen die wissenschaftlichen Erkenntnisse aus mehreren Einzelveröffentlichungen (Primärliteratur) zusammen.
Sensitivität (richtig positive Rate eines Tests)
Anteil der test-positiven Personen unter allen Erkrankten einer Stichprobe, d.h. die Wahrscheinlichkeit, mit einem diagnostischen Test die Kranken auch als krank zu identifizieren. Eine hohe Sensitivität wird angestrebt, wenn eine Erkrankung mit hoher Sicherheit ausgeschlossen werden soll. S. auch Spezifität.
Sensitivitätsanalyse
Analyseverfahren, das feststellt, wie stabil sich eine Modellrechnung oder eine Meta-Analyse gegenüber Schwankungen der Eingangsparameter oder Veränderungen in der Berechnungsmethodik verhält. In gesundheitsökonomischen Modellrechnungen werden in einer Sensitivitätsanalyse mögliche Unterschiede in den Eingangsparametern (leichter versus schwerer Krankheitsschweregrade, gute versus schlechte Compliance, grosser versus kleiner Behandlungseffekt) in ihren Auswirkungen auf die Endergebnisse untersucht und beschrieben.
Signifikanztest (Statistische Signifikanz)
Spezifität (richtig-negative Rate eines Tests)
Anteil der Test-negativen Personen unter allen Nicht-Erkrankten einer Stichprobe, d.h. die Wahrscheinlichkeit, mit einem diagnostischen Test Nicht-Erkrankte korrekt zu identifizieren. Eine hohe Spezifität wird angestrebt, wenn eine Erkrankung mit großer Sicherheit bestätigt werden soll.
Standardabweichung
Maß für die Streuung von Messwerten um den Durchschnittswert.
Statistische Signifikanz
Ein statistisch signifikantes Ergebnis einer Studie ist ein Ergebnis, das gegen die Nullhypothese spricht. Die Aussage basiert auf einem statistischen Test, der zur Prüfung einer vorab festgelegten Hypothese mit vorab festgelegter Irrtumswahrscheinlichkeit durchgeführt wird. Statistische Signifikanz darf nicht mit klinischer Relevanz gleich gesetzt werden (s. auch p-Wert).
Stichprobe
Teilmenge der Gesamtpopulation, über die mit einer Studie eine Aussage gemacht werden soll. In der Stichprobe werden Daten erhoben, anhand derer Schlussfolgerungen für die gesamte Population gezogen werden. (z.B. sollen von einer Studie über 200 Diabetiker mit Nierenbeteiligung Rückschlüsse gezogen werden auf alle Diabetiker mit Nierenbeteiligung.) Um valide Aussagen für die gesamte Population zu erhalten, muss die Stichprobe 1. ausreichend groß sein, um den Stichprobenfehler klein zu halten und 2. repräsentativ für die gesamte Population sein. damit sie Strukturgleichheit mit der Population aufweist, für die die Aussage gemacht werden soll. Idealerweise wird dies durch eine zufällig gezogene Stichprobe erreicht.
Stichprobenfehler
Unsicherheit der Schätzung in einer Stichprobe. Jedes Merkmal einer Stichprobe liegt in der Gesamtpopulation mit einer "wahren Häufigkeit“ oder in einer „wahren Größe“ vor. Da die Stichprobe nur einen Teil der Population umfasst, ist damit zu rechnen, dass die Schätzung von Häufigkeit oder Größe des Merkmals in der Stichprobe von der Häufigkeit oder Größe der Gesamtpopulation abweicht. Diese Abweichung wird als Stichprobenfehler bezeichnet. Der Stichprobenfehler ist umso größer, je kleiner die Stichprobe ist und je seltener das zu messende Merkmal in der Population vorkommt. Das Ausmaß des Stichprobenfehlers lässt sich durch Angabe des Konfidenzintervalls um den Punktschätzer beschreiben.
Stratifizierung
Aufteilung einer Stichprobe oder Untersuchungspopulation in verschiedene Schichten (Strata) in Abhängigkeit von der Ausprägung eines interessierenden Merkmals. Häufig verwendete Stratifizierungsmerkmale sind Alter, Krankheitsschweregrad, Geschlecht oder Ethnizität. Mit stratifizierten Ergebnisauswertungen kann man Ergebnisse für interessierende Subgruppen erhalten oder Confounding kontrollieren.
Studiendesign
Struktur einer problemgeleiteten, systematischen Beobachtung zur Beantwortung einer spezifischen Fragestellung (Studie). Das Studiendesign hängt von der Fragestellung ab und z.B. auch davon, ob es sich um ein qualitatives oder ein quantitatives Problem handelt. Bei qualitativen Forschungsfragen kommen unterschiedliche Methoden zum Einsatz: z.B. qualitative Interviews, Fokusgruppen; Literatur- oder Quellenanalysen. Bei quantitativen Fragestellungen (z.B. Häufigkeiten von Erkrankungen, Zusammenhang von Exposition und Outcome, Wirksamkeit einer Therapie) kommen Methoden der klinischen Epidemiologie oder der empirischen Sozialforschung zum Einsatz: Bei Beobachtungsstudien (z.B. Kohortenstudien; Fall-Kontroll-Studien; Querschnittsstudien oder ökologischen Studien) beschränkt sich die Tätigkeit der Wissenschaftler auf das Erheben und Auswerten von Daten. Bei Interventionsstudien (z.B. randomisierten kontrollierten Studien) wird von den Forschern eine Maßnahme (z.B. Behandlung, Aufklärungskampagne, Versorgungsform) gezielt eingesetzt, um in der Studienpopulation bestimmte Outcomes zu beeinflussen.
Surrogatendpunkte (intermediäre Endpunkte)
Endpunkte, die selbst nicht von unmittelbarer Bedeutung für die Patienten sind, aber stellvertretend für wichtige Endpunkte stehen können (z.B. Blutdrucksenkung als Surrogatparameter für Vermeidung eines Schlaganfalls). Surrogatendpunkte sind oft physiologische oder biochemische Marker, die sich relativ schnell und einfach messen lassen und denen eine Vorhersagefunktion für spätere klinische Ereignisse zugestanden wird. Voraussetzung für zuverlässige Aussagen über die Wirksamkeit einer Behandlung ist ein enger kausaler Zusammenhang zwischen Surrogatparameter und dem eigentlichen Endpunkt. Für die allermeisten Surrogatparameter ist ein kausaler Zusammenhang nicht belegt, was den Nutzen von Surrogatparametern für die Vorhersagekraft von klinisch relevanten Endpunkten in Frage stellt. So haben z.B. in einer Studie mit antiarrhythmisch wirkenden Medikamenten (CAST-Studie) die geprüften Antiarrhythmika gefürchtete Herzrhythmusstörungen (Surrogat) verhindert – mittelfristig traten aber, im Vergleich zu den Kontrollgruppen, vermehrt Todesfälle (klinisch relevanter Endpunkt) auf.
Systematischer Fehler
s. Bias
Systematischer Review (Synonym: Systematische Übersicht)
Sekundärforschung, bei der zu einer klar formulierten Frage alle verfügbaren Primärstudien systematisch und nach expliziten Methoden identifiziert, ausgewählt und kritisch bewertet und die Ergebnisse extrahiert und deskriptiv oder mit statistischen Methoden quantitativ (Meta-Analyse) zusammengefasst werden. Nicht jeder systematische Review führt zu einer Meta-Analyse.
T 
Test, statistische (statistische Signifikanz)
U 
Umschläge, verschlossene (sealed envelopes)
Unzuverlässige Methode der verdeckten randomisierten Zuordnung der Probanden zu Interventions- und Kontrollgruppe in RCTs. Für jeden einzelnen Studienteilnehmer liegt die Gruppenzuordnung in einem verschlossenen, undurchsichtigen Umschlag vor. Erst nach Überprüfung der Einschlusskriterien und Einwilligung des Probanden in die Studienteilnahme wird ein Umschlag geöffnet und die Gruppenzuordnung abgelesen. Die Methode ist sehr manipulationsanfällig, da die Reihenfolge, in der die Umschläge geöffnet werden, nicht zuverlässig kontrolliert werden kann. Die Umschlagsmethode sollte daher nur dann angewandt werden, wenn eine zentrale Randomisierung nicht praktikabel ist, z.B. bei Studien in Notfallsituationen.
V 
Validität (innere Validität, Glaubwürdigkeit)
Innere Validität bezeichnet das Ausmaß, mit dem die Ergebnisse einer Studie die „wahren“ Effekt einer Intervention/Exposition wiedergegeben werden, d.h. frei von systematischen Fehlern (Bias) sind. Die innere Validität beruht auf der Integrität des Studiendesigns und ist Voraussetzung für die Anwendbarkeit der Studienergebnisse in der Routineversorgung (s. auch externe Validität).
Verblindung
Geheimhaltung der Gruppenzuordnung (Therapie oder Kontrolle) vor Patienten, Studienärzten, Pflegepersonal und Auswertern, die an einer Studie teilnehmen. Damit soll verhindert werden, dass durch das Wissen um die Gruppenzugehörigkeit die Therapieantwort der Patienten, das Verhalten der Ärzte oder die Bewertung der Ergebnisse beeinflusst wird. In einfach-blinden Studien wissen nur die Patienten nicht über ihre Zuordnung Bescheid, in doppel-blinden Studien bleibt die Zuordnung Patient und behandelndem Arzt verborgen. Die Verblindung von Ärzten und Patienten ist nicht immer durchführbar (z.B. beim Vergleich von chirurgischen mit medikamentösen Verfahren), wobei eine Verblindung der Endpunkt-Auswerter in der Regel möglich ist (s. auch Bias).
Verdeckte Zuordnung (concealment of allocation)
Methodisches Verfahren zum Schutz vor Selektionsbias. Geheimhaltung der randomisierten Zuteilungsfolge zu Therapie- oder Kontrollgruppe bis zum Zeitpunkt des Studieneinschlusses und der Zuordnung des Patienten zu einer Studiengruppe (s. auch Bias).
Vortest-Wahrscheinlichkeit einer Erkrankung (pre-test probability)
Schätzung der Wahrscheinlichkeit einer Erkrankung vor der Durchführung eines Tests. Sie beruht im Allgemeinen auf der Prävalenz* der Erkrankung in einem bestimmten Umfeld (z.B. Normalbevölkerung, Primär-, Sekundärversorgung, im Krankenhaus, in der eigenen Praxis). Sind diese Informationen nicht verfügbar, müssen sie gegebenenfalls geschätzt werden.
W 
Wahrscheinlichkeitsverhältnis (Likelihood Ratio = LR)
Das Verhältnis der Wahrscheinlichkeit, dass ein positives (oder negatives) Testergebnis bei einer Person mit der Erkrankung auftritt zur Wahrscheinlichkeit, dass dieses positive (oder negative) Testergebnis bei einer Person ohne diese Erkrankung auftritt. Die LR ermöglicht eine Aussage darüber, wie stark sich durch das Testergebnis die Wahrscheinlichkeit für oder gegen das Vorliegen einer Erkrankung ändert (Nachtestwahrscheinlichkeit).
Z 
Zufallszahlen (random numbers)
In der klinischen Forschung dienen Zufallszahlen zur Bildung von Stichproben oder zur zufälligen Zuteilung von Probanden zur Interventions- oder Kontrollgruppe (Randomisierung). Echte Zufallszahlen werden z.B. beim Münzwurf, Würfeln oder Roulette erzeugt. In der Praxis wird meist auf Pseudozufallszahlen zurückgegriffen, d. h. auf scheinbar zufällige Zahlen, die nach einem festen, reproduzierbaren Verfahren erzeugt werden. Obwohl nicht wirklich zufällig, haben sie ähnliche statistische Eigenschaften wie echte Zufallszahlenfolgen. (Pseudo-) Zufallszahlen können gedruckten Tabellen entnommen oder von Computerprogrammen erzeugt werden.
A B C D E F G H I K L M N O P R S T U V W Z




mehr Informationen 
