Versorgungsdatenanalysen

Was können wir aus ihnen lernen?

Do, 03.12.2020

Versorgungsdaten (engl. claims data) gewinnen in der heutigen Zeit stetig an Bedeutung, da sie eine umfassende Datenquelle darstellen, welche zu herkömmlichen Methodiken häufig komplementär ist.

Eine Studie deutscher Versorgungsdaten zur wirtschaftlichen Belastung durch ANCA-assoziierte Vaskulitiden (AAV) (Hier gelangen Sie zur Publikation), einer Gruppe von potenziell lebensbedrohlichen, seltenen Autoimmunerkrankungen, wurde kürzlich unter der Ko-Autorenschaft von SKC publiziert. Doch warum sind Analysen von Versorgungsdaten so wichtig? Was können wir aus ihnen lernen?

Als Versorgungsdaten werden die Daten zur Abrechnung und Erstattung von Leistungen der derzeit 105 gesetzlichen Krankenversicherungen (GKV) bezeichnet, welche in Deutschland in pseudonymisierten Datenbanken unterschiedlicher Größe verwaltet werden. Die Identifizierung von Patienten einer bestimmten Erkrankung erfolgt dabei anhand ihrer Diagnose nach ICD-10-GM Kodierung. Diese Kodierung wurde in unabhängigen Untersuchungen als verlässlich evaluiert. Neben demographischen Daten (Alter, Geschlecht, Wohnregion) sind ebenfalls Informationen zur Verschreibung von Arzneimitteln, ambulanten und stationären Behandlungen sowie zur Morbidität und Mortalität vorhanden. Versorgungsdaten repräsentieren dabei sog. „real-world data".

Im Vergleich zu klinischen Studien oder Register-basierter Datenerhebung greifen Versorgungsdatenbanken auf eine deutlich größere Kohorte von i.d.R. mehreren Millionen versicherten Personen zurück, was eine detaillierte und verlässliche retrospektive Datenerhebung gerade im Fall von seltenen Leiden (engl. orphan diseases) zulässt. Direkten Zugriff auf die Datenbanken erhält man aufgrund von datenschutzrechtlichen Bestimmungen allerdings nicht. Üblicherweise wird nach eingehender Prüfung des jeweiligen Forschungsvorhabens eine Genehmigung erteilt und die damit verbundenen Analysen der Daten vorgenommen. Dem Antragssteller werden schließlich nur die vollständig anonymisierten Ergebnisse dieser Analysen zur weiteren Verwendung übermittelt.

Die o.g. Studie basiert auf Analysen der InGef-Versorgungsdatenbank, welche insgesamt rund 6,3 Millionen Versicherte aus etwa 60 regional sowie national operierenden GKV beinhaltet. Neben Untersuchungen zur Hospitalisierung der AAV-Patienten quantifiziert die Studie die Kosten dieser Erkrankung für ambulante sowie stationäre Aufwendungen, Medikamente und Krankengeldzahlung für das deutsche Gesundheitssystem. Basierend auf diesen Daten erhöht ein AAV-Patient die Gesundheitskosten im ersten Jahr nach Diagnose um ein Vielfaches im Vergleich zu einer entsprechend altersadjustierten Person der deutschen Allgemeinbevölkerung. Das gewonnene Verständnis für die wirtschaftliche Belastung ermöglicht eine deutliche Verbesserung der Transparenz und Effizienz der Gesundheitsversorgung.

Aufgrund der Vielzahl von den in den Versorgungsdaten erfassten Merkmalen entsteht eine Fülle von möglichen Analysefragen. Diese gehen weit über die ökonomischen Gesichtspunkte einer Erkrankung hinaus, da auch umfassende Untersuchungen zur Morbidität von Patienten erfolgen können. Die Gestaltung der Fragstellung wird jedoch durch das Fehlen von detaillierten klinischen Daten, wie zu Lebensqualität oder Laborbefunden limitiert. Im Gegensatz zur InGef-Datenbank, welche umfassend validiert wurde, sind besonders kleine bzw. nur auf einer GKV basierende und ausschließlich regional arbeitende Datenbanken nicht repräsentativ für die deutsche Allgemeinbevölkerung. In diesem Zusammenhang wurde schon häufig die Organisation und öffentliche Verfügbarkeit einer einzigen, deutschlandweiten Versorgungsdatenbank gefordert. Schließlich unterliegt die Nutzung der Versorgungsdaten einer Latenz von etwa 2 Jahren, bis diese bereitgestellt werden.

Analysen deutscher Versorgungsdaten sind gewinnbringend und zuverlässig und sollten für vielfältige Fragestellungen in Betracht gezogen werden. Sie sind zudem sehr wertvoll als Informationsquelle in der Forschung sowie zur Unterstützung von politischen sowie ökonomischen Entscheidungsprozessen rund um das deutsche Gesundheitswesen, wobei die zugrunde liegende Datenbank aber mit Bedacht gewählt werden sollte.

Quellen:

Hellmich et al. 2020 "Die wirtschaftliche Belastung durch ANCA-assoziierte Vaskulitiden in Deutschland – eine Versorgungsdatenstudie", DOI: 10.1055/a-1275-1636
Neubauer et al. 2016 "Access, use, and challenges of claims data analyses in Germany", DOI: 10.1007/s10198-016-0849-3
Kreis et al. 2016 "Status and perspectives of claims data analyses in Germany – A systematic review", DOI: 10.1016/j.healthpol.2016.01.007
Andersohn & Walker 2016 "Characteristics and external validity of the German Health Risk Institute (HRI) Database", DOI: 10.1002/pds.3895
Carnarius et al. 2018 "Diagnosenkodierung in deutschen Arztpraxen aus klassifikatorischer Sicht: Eine retrospektive Studie mit Routinedaten", DOI: 10.1055/s-0043-125069
www.gkv-spitzenverband.de/
www.ingef.de/

Versorgungsdaten­analysen

Was können wir aus ihnen lernen?

Versorgungsdatenanalysen