BLOG

ROMmelen in de GGZ

ROMmelen in de GGZ

Routine Outcome Monitoring of kortweg ROM is het instrument in de GGZ waarin we trachten het effect van onze behandelingen te meten. Laat ik u direct zeggen: ik ben een enorme voorstander van ROM.

De meerwaarde van ROM is evident. Bij goed gebruik worden we transparant en laten we zien hoe effectief onze ggz-behandelingen zijn. Idealiter profiteren cliënten (keuze ondersteunend), behandelaren (kwaliteit van zorg) en zorgverzekeraars (selectieve inkoop) hiervan. Het is dan ook goed dat de GGZ, bij monde van de branchevereniging, achter deze ontwikkeling staat.

Effect

ROM helpt ook om de kosten van de GGZ terug te dringen. Immers, ROM kan behulpzaam zijn om te bepalen of de behandeling nog effectief is of dat het grootste effect behaald is. In dat laatste geval kan de behandelaar – in overleg met de cliënt - besluiten om de behandeling af te sluiten. ROM helpt dus om “gepast gebruik” inhoud en vorm te geven.

Toch is het implementeren van ROM minder eenvoudig dat lijkt. Laat ik een voorbeeld geven.

Depressie

Om te leren van ROM is er een benchmark gestart op het gebied van depressie. Zes zorgaanbieders namen hieraan deel. Uit de benchmark bleek dat er grote verschillen optraden in de effectiviteit. Nader onderzoek liet zien dat deze verschillen in belangrijke mate werden veroorzaakt door de keuze van het meetinstrument. Dus, wil je als zorgaanbieder een hoger effect hebben, dan hoef je slechts een instrument te kiezen dat meer sensitief is voor de gewenste verbetering en je scoort hoger. Dit leert ons dat ROM (nog) niet het ideale instrument is waar ik in mijn inleiding zo vurig naar verlangde.

Ondertussen worden de ROM gegevens transparant gepresenteerd in een mooie database waaruit iedereen informatie kan putten. Ondanks de disclaimer van  Stichting Benchmark in de GGZ (SBG), welke zegt dat de informatie nog niet tot conclusies mag leiden, leidt deze informatie tot onterechte negatieve beeldvorming naar alle partijen. Ik heb daarom aangedrongen de gegevens uit de database te halen en zo snel mogelijk naar informatie toe te gaan die wel vergelijkbaar is. Helaas wil het bestuur van de SBG niet op mijn verzoek ingaan. Ik denk dat ze bang zijn dat hiermee aangetoond wordt dat de ROM in deze fase in geen enkel opzicht gebruikt mag worden totdat de validiteit van het instrument is aangetoond.

Want naast de diversiteit van de meetinstrumenten, spelen nog andere zaken die opgelost moeten worden. Bijvoorbeeld dat verschillende zorgaanbieders soms verschillende cliëntengroepen met verschillende zorgzwaarte behandelen, de zogenaamde casemix discussie. Ook dit probleem is niet opgelost.

Beperkingen

Ik hoop dat ieder die ROM gebruikt zich bewust is van de beperkingen die ROM nog in zich draagt en ik verwacht dat verzekeraars de huidige ROM niet misbruiken in het proces van selectieve inkoop. Het bestuur van de SBG roep ik nogmaals op om alle onbetrouwbare gegevens uit de dataset te verwijderen, zodat we –in vertrouwen- kunnen werken aan de doorontwikkeling van de ROM. Doet ze dat niet, dan blijft het ROMmelen in de GGZ.

Jeroen Muller
Vice-voorzitter NIP

4 Reacties

om een reactie achter te laten

Frank Conijn

27 november 2014

Uitgaande van een correcte weergave van de praktijk door dhr. Muller ben ik het helemaal met hem eens. Maar zijn stuk komt mogelijk wat verwarrend over omdat hij een aantal termen door elkaar haalt -- in navolging van veel anderen.

ROM = routine outcome monitoring. Dat wil niets anders zeggen dan dat bij *alle* (planbare) patiënten gemeten wordt wat de effectiviteit van de behandeling is. Dat is een goed en nodig principe, want als de zorgaanbieder zelf mag kiezen welke patiënten wel en niet in de statistieken opgenomen worden is elke uitkomstindicator in principe onbetrouwbaar.

Waar dhr. Muller het eigenlijk over heeft is ziektelastassessment (generieke term voor de gehele zorg). In casu de inaccuratesse van de resultaten daarvan omdat er verschillende assessmentmethoden (meetinstrumenten) gebruikt worden. Dat kan inderdaad niet. Zorgaanbieders dienen landelijk uniforme methoden te gebruiken.

Ook schrijft hij: "Ik denk dat ze bang zijn dat hiermee aangetoond wordt dat de ROM in deze fase in geen enkel opzicht gebruikt mag worden totdat de validiteit van het instrument is aangetoond." Daar had 'accuratesse' moeten staan. Die wordt bepaald door de reproduceerbaarheid, validiteit en responsiviteit.

Verder gebruikt hij -- ook weer in navolging van anderen, vooral in de GGZ -- de term 'casemix'. Een duidelijkere term daarvoor is (inderdaad) zorgzwaarte, of ziektelast c.q. -ernst bij aanvang. Dat een assessment daarvoor moet corrigeren is evenwel evident.

Dus inhoudelijk ben ik het helemaal met hem eens. Als men echter niet dezelfde definities hanteert praat men al snel langs elkaar heen.

Wil men nog eens nalezen hoe assessments klinimetrisch gezien in elkaar zouden moeten zitten, inclusief uitleg van de verschillende termen, dan kan dat op https://gezondezorg.org/uitkomstassessment.

Jan Alberts

28 november 2014

Een inhoudelijk punt: psychometrische vragenlijsten zijn in de eerste plaats bedoeld om psychodiagnostiek te plegen. Een score op een lijst is daarmee niet zomaar vertaalbaar naar behandeleffect. Het gebruik van één lijst is natuurlijk sowieso uit den boze bij gedegen testdiagnostiek (unus testis nullus testis). Daarnaast dienen de scores op vragenlijsten altijd geinterpreteerd te worden. Een hoge score op een depressieschaal kan niet zonder meer één op één vertaald worden naar een depressieve stoornis, zelfs niet als dat op meerdere testen naar voren komt. Het is daarom in voorkomende gevallen juist professioneel om bij verschillende patienten verschillende lijsten te gebruiken om iets te 'monitoren'. Zo is een al te doorzichtige lijst bij een bepaalde groep patienten vragen om hoge of juist zeer lage scores, of patroon van dimensies, los van de ernst van de pathologie. Daar moet je als clinicus kennis van hebben, op bedacht zijn en aandacht voor hebben.
Het ROMmen (lees: beleidsmakers/ verzekeraars) dreigt hetzelfde te doen met psychologische tests als hoe men met DSM omgaat: oneigenlijk gebruik, daar ongefundeerd conclusies aan verbinden en beleid op maken. Dat holt de professionaliteit en kwaliteit eerder uit dan dat ze ze vooruit helpen zou.

Martijn Heijdra

28 november 2014

Net als de heer Conijn ben ik het helemaal eens met Muller. Wat ik niet begrijp Conijn's discussie over de gebruikte terminologie en definities. Ik ben het met hem eens dat het zeer wel enselijk is om gelijke termen en definities te hanteren als we praten over de ROM en eigenlijk binnen de zorg algemeen.
Het maakt het in deze tijden lastig dat de verschillende instanties, expertgroepen en landelijk organisaties c.q. belanggroepen verschillende termen gebruiken.
In dat licht zou je juist verwachten dat we moeten blijven praten in termen van 'casemix' (wat overigens niet gelijk is aan zorgzwaarte zoals de heer Conijn aangeeft), 'ROM' en 'validiteit'.
Dit zijn namelijk landelijk veel gebruikte termen die tevens aansluiten op de terminologie van SBG. Dat kan van 'accuratesse' en 'ziektelastassessment' niet gezegd worden.

Frank Conijn

28 november 2014

@Jan Albers:
U stelt: "Een hoge score op een depressieschaal kan niet zonder meer één op één vertaald worden naar een depressieve stoornis." Dat zou goed kunnen zijn, dat is geheel aan uw beroepsgroep om te bepalen. Maar dan heeft u het over kwalitatief-diagnostisch gebruik van vragenlijsten.

Waar ik het over heb is kwantitatief gebruik. Zoals daar in de fysiotherapie -- die samen met de curatieve GGZ al ettelijke jaren de voorlopers zijn in het klinische gebruik van vragenlijsten -- de rug-, schouder- en heup 'disability questionnaires' zijn. Zuiver en alleen gericht op het kwantificeren van de pijn/hinder/beperkingen, ongeacht de diagnose.

Wellicht bestaan zulke vragenlijsten niet in de GGZ, maar dan is wellicht de Universele Ziektelastschaal, of een door u aan te passen versie daarvan, een mogelijkheid. Zie https://gezondezorg.org/ziektelastmeting.

@Martijn Heijdra:
De term accuratesse ('accuracy') is in Nederland geïntroduceerd door prof.ir. De Vet, die zich al jarenlang daarmee bezighoudt en inmiddels hoogleraar klinimetrie is aan de VU. Van haar zijn ook de componenten reproduceerbaarheid, validiteit en responsiviteit afkomstig.

Waarbij validiteit toch echt maar een component is. Zonder voldoende reproduceerbaarheid kan een assessmentmethode nog zo valide zijn, maar is hij nog steeds niet accuraat.

De term ziektelastassessment heb ik zelf geïntroduceerd, omdat we in de fysieke geneeskunde ook medisch-technische meetmethoden hebben. Zoals een te hoog cholesterolgehalte. Dat geeft in principe geen klachten (totdat het mogelijk te laat is), dus daarbij is ziektelastmeting middels een vragenlijst niet bruikbaar.

Daarbij wordt de deelterm ziektelast in de fysieke geneeskunde al enkele jaren gebruikt. Zo pleitte minister Schippers kort na haar aantreden ervoor om behandeling van aandoeningen zonder (volgens haar) echte ziektelast, zoals kalknagels, uit de basisverzekering te halen.

Verder is ROM toch echt iets anders dan ziektelastassessment. Je kunt dat assessment bij slechts enkele patiënten doen of bij allemaal. Dat bepaalt of er sprake is van ROM of niet. De term is in de GGZ -- die hem het eerst gebruikte in Nederland -- gelijkgeschakeld met ziekelastmeting, maar dat is dus niet correct.

En ik zou voorstellen dat we wel elkaars goede maar niet elkaars verwarrende gewoonten overnemen. In de GGZ is wellicht voor iedereen duidelijk wat ermee bedoeld wordt, in de fysieke geneeskunde is dat bepaald niet zo. Ik krijg zelfs de indruk dat men denkt dat met rommen het gebruik van vragenlijsten bij psychische aandoeningen bedoeld wordt. Dat zou helemaal een slechte zaak zijn.

Tot slot over de term casemix, dat wil ik anders uitleggen. Weliswaar middelen de verschillen in ziektelast bij aanvang zich uit als men de groepsgemiddelden per zorgaanbieder als uitkomstmaat neemt, maar daarvoor moeten de zorgaanbieders wel gelijke patiëntenbestanden hebben.

Dat is in de fysieke geneeskunde regelmatig niet het geval. Moeilijke kankergevallen worden naar het Antonie van Leeuwenhoek gestuurd, makkelijkere gevallen blijven in de niet-gespecialiseerde ziekenhuizen, om maar een voorbeeld te noemen.

Naast dat de letterlijke vertaling ervan ook het verwisselen van cases kan betekenen, is de bijbehorende werk- of zienswijze dus niet geschikt voor alle zorgsectoren. We zouden daarom de term toch niet moeten gebruiken, als we dezelfde taal willen blijven spreken in zorgland.

Top