Op diverse plekken in Nederland wordt in ziekenhuizen en andere zorginstellingen gewerkt aan algoritmen die moeten helpen bij het verbeteren van de kwaliteit van zorg, zoals heropname na ontslag, infectierisico, etc. Als deze algoritmen worden ingezet, dan zullen de voorspellingen van deze algoritmen zonder twijfel van invloed zijn op het ziektebeloop van patiënten. Dat kan ten goede zijn maar het kan ook verkeerd uitpakken. Wat is er nodig om veilig gebruik te kunnen maken van algoritmen in het algemeen? En wat ben je als zorginstelling verplicht te doen als je zelf algoritmen ontwikkelt?
De nieuwe Europese regels voor medische hulpmiddelen en in vitro diagnostica (MDR/IVDR, verordeningen (EU) 2017/745&746), die respectievelijk mei 2020 en 2022 van kracht zijn, stellen dat software in in veel gevallen niet meer mag worden ingedeeld in de lichtste risicoklasse van medische hulpmiddelen (klasse 1). Dat betekent dat deze software – en dus ook algoritmen – niet meer door de leverancier van een CE-markering mag worden voorzien, voordat ze mag worden gebruikt voor patiëntenzorg maar dat geïnvesteerd moet worden in een toetsing door een aangemelde instantie (notified body). Het is natuurlijk de vraag of deze vernieuwing in MDR en IVDR op zich gaan zorgen voor veilige algoritmen, want de specifieke eigenschappen van algoritmen als medisch hulpmiddel zijn op veel punten anders dan die van de meeste andere medische hulpmiddelen. Dat neemt niet weg dat zelf ontwikkelende instellingen vaak met de vraag kampen wat nu precies nodig is voor het gebruik van hun algoritmen. Door middel van het schrijven van deze reeks artikelen probeer ik te begrijpen wat een instelling moet doen om een zelf ontwikkeld algoritme veilig te mogen gebruiken voor patiëntenzorg.
CONCLUSIE
Zorginstellingen hebben volgens de nieuwe medical device regulation (MDR) de mogelijkheid zelf medische hulpmiddelen te vervaardigen en gebruiken zonder dat een CE-markering nodig is. Dat mag alleen als er geen alternatief op de markt is met gelijkwaardige prestaties. De algoritmes moeten ook voldoen aan de algemene veiligheids- en prestatie-eisen zoals genoemd in bijlage 1 van de MDR en het hulpmiddel moet beter zijn dan de markt. De kans is reëel dat er de komende jaren steeds meer algoritmen te koop zijn die even goed worden als zelf vervaardigde algoritmen, zodat uiteindelijk alleen gebruik kan worden gemaakt van zelfgemaakte algoritmen als zij zijn voorzien van een CE-markering. Samenwerking tussen zorginstellingen biedt de mogelijkheid om zelf ontwikkelde algoritmen te voorzien van een CE-keurmerk terwijl de kosten hiervan worden gedeeld. De MDR houdt geen rekening met moderne vormen van machine learning zoals transferlearning en decentralized federated learning. Daarnaast is niet duidelijk omschreven of een algoritme een update mag krijgen zonder dat het hele CE-markeringsproces opnieuw mag worden doorlopen. In een volgend artikel wordt ingegaan op de eisen in bijlage 1 van de MDR en op het benodigde kwaliteitsmanagementsysteem.
inleiding
Tot de nieuwe MDR en IVDR van kracht zijn kunnen we als zorginstelling nog naar hartenlust onze eigen algoritmisering toepassen op de zorg. Algoritmen die door instellingen worden vervaardigd vallen ten hoogste onder risicoklasse I van de oude/huidige MDD, ofwel richtlijn 93/42/EEG, betreffende medische hulpmiddelen. We hebben ons natuurlijk te houden aan alle wetgeving die verantwoordelijkheden in de zorg beschrijven, zoals de WABG, de WKKGZ en de wet BIG. Data van een zorginstelling mag in die zorginstelling gebruikt worden voor kwaliteitsverbetering. Kwaliteitsverbeterprojecten kunnen op basis van deze data worden opgezet en uitgevoerd, eventueel met zelf vervaardigde algoritmen. De vraag is natuurlijk wat er gebeurt als het mis gaat.
Vernieuwing van MDR/IVDR
De huidige richtlijnen over medische hulpmiddelen werden nog in de EEG in 1990 en 1993 vastgelegd en sindsdien is op het gebied van techniek, digitalisering en organisatie natuurlijk veel veranderd. Voor 2007 viel software niet onder de MDD. In 2007 is daar verandering in gekomen met het vijfde amendement op de MDD. Vanwege de opkomst van medische software en de impact die deze software op klinische uitkomsten kon hebben, werd – na een uitgebreide principiële discussie over de juridische definitie van software – besloten medische software ook te beschouwen als medisch hulpmiddel of diagnosticum, als deze software impact heeft op patiëntenuitkomsten. Volgens de toenmalige classificatieregels viel software als niet-invasief hulpmiddel bijna altijd onder risico klasse I, wat inhoudt, dat de leverancier zelf de CE-markering mag aanbrengen na voldaan te hebben aan een beperkte set eisen. Sindsdien werd de MDD niet meer aangepast. Diverse schandalen met implantaten hebben vernieuwing van deze Europese regelgeving versneld. De nieuwe MDR en IVDR verplichten fabrikanten van medische hulpmiddelen en medische diagnostica veel dwingender dan voorheen de kwaliteit van nieuwe hulpmiddelen te evalueren en kwaliteitscontrole uit te voeren, ook nadat de hulpmiddelen op de markt zijn verschenen. Alle medische hulpmiddelen worden daarnaast geregistreerd in een nieuwe Europese hulpmiddelendatabase (Eudamed). Tenslotte worden de classificatieregels aangepast, zodat medische software veel minder dan voorheen in klasse I valt, maar eerder in klasse IIa of hoger. Dat betekent dat medische software moet worden goedgekeurd door een aangemelde instantie (‘notified body’). Deze veranderingen zullen grote impact hebben op de administratieve belasting van zowel leveranciers van medische software als instanties die controle uitoefenen. Er wordt dan ook gevreesd dat goedkeuringsprocessen zullen stagneren, zodra de verordeningen van kracht zijn. Aan de andere kant is iedereen het er over eens dat de vernieuwing noodzakelijk is. Hoewel software integraal onderdeel is van de MDR en nu ook een strengere keuring krijgt, reist wel de vraag of de verordening recht doet aan algoritmen. Hieronder wordt nader ingegaan op een aantal belangrijke aspecten van de MDR.
Uitgangspunten, artikelen en bijlagen
De MDR en IVDR hebben grofweg dezelfde opbouw. De MDR begint met 101 overwegingen. De overwegingen zijn de uitgangspunten die in de daaropvolgende wetteksten worden geformaliseerd. De overwegingen worden gevolgd door 123 artikelen – de daadwerkelijke regels – en sluit af met 17 bijlagen. De bijlagen bevatten aanvullingen, die eventueel in de loop der tijd gemakkelijker aangepast kunnen worden. Één en ander vult 175 pagina’s. Er wordt nauwgezet beschreven wat er allemaal nodig is voordat een medisch hulpmiddel vermarkt mag worden. De IVDR heeft een vergelijkbare opbouw en omvang en is natuurlijk meer toegespitst op in vitro diagnostica. De fabrikanten worden met deze verordeningen in een keurslijf gestopt, dat excessen uit het verleden moet voorkomen. Instellingen die zelf algoritmen vervaardigen zullen zich ook aan de verordeningen moeten houden. Het is – gelukkig – zo dat er voor instellingen onder sommige omstandigheden een lichtere wetgeving geldt, een MDR-light zeg maar. Daar kom ik later op terug. De individuele lidstaten hebben er daarnaast invloed op wat wel en wat niet een medisch hulpmiddel is (uitgangspunt 8 MDR/IVDR):
“Het dient aan de lidstaten te zijn om per geval te beslissen of een product al dan niet onder het toepassingsgebied van deze verordening valt.”
Overigens worden de lidstaten hierbij gecontroleerd door de Europese Unie, met hulp van een ‘Medical Device Coordination Group’ (MDCG), bestaande uit deskundigen uit alle lidstaten. Het is de bedoeling dat in de EU producten of productgroepen consequent worden beoordeeld, dus in de praktijk zullen de producten in Europa waarschijnlijk redelijk homogeen worden beoordeeld. Waar we in Nederland wel voor moeten uitkijken is dat we niet zoals bij de AVG de meest strikte lezing toepassen, omdat dit onnodig tot vertraging en extra kosten zal leiden.
Definitie medisch hulpmiddel
Er is een heldere definitie van medische hulpmiddelen. De definitie omvat onder andere software. Het doel van een medisch hulpmiddel is volgens de definitie in artikel 2, lid 1 van de MDR:
- diagnose, preventie, monitoring, voorspelling, prognose, behandeling of verlichting van ziekte,
- diagnose, monitoring, behandeling, verlichting of compensatie van een letsel of een beperking,
- onderzoek naar of vervanging of wijziging van de anatomie of van een fysiologisch of pathologisch proces of een fysiologische of pathologische toestand,
- informatieverstrekking via in vitro-onderzoek van specimens afkomstig van het menselijk lichaam, waaronder orgaan-, bloed- en weefseldonaties
- …
Belangrijk is verder nog dat er geen farmacologische werking is (dan valt het middel onder andere regels). De definitie van de IVDR onderscheidt zich doordat het hulpmiddel moet worden gebruikt voor “in-vitro-onderzoek van specimens die afkomstig zijn van het menselijk lichaam, met inbegrip van donorbloed en – weefsel“.
MDR of IVDR?
Een algoritme dat heropnames voorspelt, zoals beschreven in mijn vorige blog, kan van invloed zijn op het ziektebeloop en zou aldus onder de MDR vallen. Een algoritme dat CT-scans beoordeeld ook. Het is mij aan de andere kant niet duidelijk of een algoritme dat PA-cytologie classificeert nu onder de MDR of onder de IVDR valt, omdat beide definities hieraan refereren. In dit artikel beperk ik me tot de consequenties voor predictive analytics op basis van klinische patiëntengegevens. Die valt (indien van invloed op het ziektebeloop) in principe onder de MDR.
Kans voor zelf ontwikkelende instellingen
Het goede nieuws is dat de MDR onder bepaalde omstandigheden voorziet in een behoefte van zorginstellingen om zelf medische hulpmiddelen te ontwikkelen. Dat is te lezen in uitgangspunt 30 van de MDR en 29 van de IVDR:
“Zorginstellingen moeten de mogelijkheid hebben hulpmiddelen intern te vervaardigen, aan te passen en te gebruiken, om, weliswaar op niet-industriële schaal, tegemoet te komen aan de specifieke behoeften van patiëntendoelgroepen waaraan niet op een passend prestatieniveau kan worden voldaan door een gelijkwaardig hulpmiddel dat op de markt beschikbaar is.”
Let wel: het algoritme dat door een zorginstelling wordt vervaardigd mag pas gebruikt worden als het beter is dan een gelijkwaardig alternatief dat te koop is.
Eisen zelf vervaardigde algoritmen
Boven werd al genoemd dat de MDR voorziet in de behoefte van zorginstellingen om zelf medische hulpmiddelen te vervaardigen. Er wordt onderscheid gemaakt tussen de volledige MDR en de afgeslankte versie ervan – zeg maar de MDR-light. In artikel 5, lid 5 van de MDR wordt duidelijk en omvattend omschreven wanneer de lichtere variant van toepassing is en wat dat inhoudt:
Met uitzondering van de toepasselijke algemene veiligheids- en prestatie-eisen van bijlage I gelden de vereisten van deze verordening niet voor hulpmiddelen die uitsluitend binnen in de Unie gevestigde zorginstellingen worden vervaardigd en gebruikt, mits aan iedere onderstaande voorwaarde wordt voldaan:
- de hulpmiddelen worden niet overgedragen aan een andere rechtspersoon;
- de hulpmiddelen worden vervaardigd en gebruikt met inachtneming van een passend kwaliteitsmanagementsysteem;
- de zorginstelling rechtvaardigt in haar documentatie dat aan de specifieke behoeften van de patiëntendoelgroep niet kan worden voldaan, of daaraan niet op een passend prestatieniveau kan worden voldaan, door een op de markt beschikbaar gelijkwaardig hulpmiddel;
- de zorginstelling verstrekt haar bevoegde autoriteit op verzoek informatie over het gebruik van bedoelde hulpmiddelen, waaronder een rechtvaardiging voor de vervaardiging, de wijziging en het gebruik ervan;
- de zorginstelling stelt een verklaring op, die ze openbaar maakt en die de volgende elementen bevat: i) naam en adres van de vervaardigende zorginstelling, ii) gegevens ter identificatie van de hulpmiddelen, iii) een verklaring waaruit blijkt dat de hulpmiddelen voldoen aan de algemene veiligheids- en prestatie-eisen van bijlage I bij deze verordening en, indien van toepassing, informatie over vereisten waaraan niet helemaal wordt voldaan, met een met redenen omklede rechtvaardiging daarvoor;
- de zorginstelling stelt documentatie op met uitleg over de productiefaciliteit en het productieproces, het ontwerp en de prestatiegegevens van de hulpmiddelen, met inbegrip van het beoogde doeleind, die voldoende gedetailleerd is om de bevoegde autoriteit in staat te stellen te beoordelen of er wordt voldaan aan de algemene veiligheids- en prestatieeisen van bijlage I bij deze verordening;
- de zorginstelling neemt alle maatregelen die nodig zijn om te garanderen dat alle hulpmiddelen in overeenstemming met de onder 6. bedoelde documentatie worden vervaardigd, en
- de zorginstelling evalueert de ervaring die is opgedaan met het klinisch gebruik van de hulpmiddelen en onderneemt alle vereiste corrigerende acties.
Kortom, zorg voor een passend kwaliteitsmanagementsysteem en dat je ergens publiceert welke algoritmen je gebruikt, wat ze doen, dat er geen gelijkwaardig alternatief te koop is en een verklaring dat je aan de eisen van bijlage 1 voldoet. Dit laatste is nog wel een klus, maar op zich goed te doen. In een volgend artikel ga ik hier verder op in.
Overigens mogen lidstaten beperkingen opleggen aan ontwikkelmogelijkheden en daarnaast mogen lidstaten natuurlijk inspecties uitvoeren om te controleren of voldaan wordt aan eisen van de MDR. In iedere lidstaat wordt daartoe een bevoegde autoriteit aangewezen. In Nederland worden deze inspecties uitgevoerd door de Inspectie Gezondheid en Jeugd (IGJ).
CE-loos vervaardigen in de toekomst
Hoewel er op dit moment in Nederland nog wordt gediscussieerd over de interpretatie van de MDR, neigen de autoriteiten er naar om artikel 5, lid 5 dusdanig uit te leggen dat vooral de markt gestimuleerd wordt. Als een algoritme van een fabrikant even goed is als een zelfgemaakt algoritme zonder CE-keurmerk, dan mag het zelfgemaakte algoritme niet gebruikt worden voor patiëntenzorg. Het maakt daarbij niet uit, of de markt exorbitante bedragen vraagt. Dit heeft belangrijke consequenties. AI-experts gaan er namelijk van uit dat de prestaties van algoritmes beter zullen worden dan de prestaties van mensen maar dat ze nooit boven een bepaald niveau uit zullen stijgen:
Dat maximale niveau wordt de ‘Bayes optimale fout’ genoemd. Ruim voordat dit hoogste prestatieniveau wordt bereikt zal met de huidige statistische technieken geen significant verschil worden gevonden tussen algoritmen die hier in de buurt zitten. Als deze theorie wordt gevolgd, dan zal het in-huis vervaardigen en gebruiken van algoritmen als medisch hulpmiddel zonder CE-keurmerk in de loop der tijd afnemen, omdat er volgens de MDR steeds meer vergelijkbare alternatieven op de markt zullen zijn, die – tenminste statistisch gezien – even goed presteren. De markt zal vervolgens bepalen wat de kosten worden van algoritmen. Maar waarom wordt er dan gekozen voor een wetgeving die het uiteindelijk de zorginstellingen onmogelijk maakt zelfgemaakte medische algoritmen zonder CE-keurmerk te gebruiken? Ten eerste omdat dit de markt zou stimuleren om betere algoritmen te ontwikkelen. De redenering is, dat de marktpartijen het af zullen laten weten als medische hulpmiddelen gemakkelijk CE-loos door instellingen vervaardigd mogen worden, terwijl de leverancier moeten investeren in een prijzig CE-keurmerk. Dit zou juist tot stagneren van ontwikkeling kunnen leiden. Europa beschouwt de markt dus altijd als drijvende kracht van ontwikkeling, niet de professional in de zorginstelling. Ten tweede wordt er vanuit gegaan dat de veiligheid van een medisch hulpmiddel mét CE-keurmerk beter gewaarborgd is, dan de veiligheid van een medisch hulpmiddel zonder deze markering. Ofwel, als je het dan als zorginstelling zo belangrijk vindt om je eigen medische algoritme te gebruiken terwijl er vergelijkbare algoritmen op de markt zijn, betaal dan ook voor een CE-keurmerk.
Beter dan de markt: hoe dan?
Zoals boven besproken wordt de IGJ belast met het handhaven van de MDR. Maar hoe moet de IGJ dan bepalen of er een gelijkwaardig alternatief op de markt is voor een door een instelling vervaardigd algoritme? Een leverancier, die stelt dat de prestaties van zijn algoritme even goed zijn als die van de instelling vertelt namelijk niet het hele verhaal. In de meeste gevallen presteren algoritmen het beste op de trainingsdata en slechter op externe data. Het algoritme van een leverancier zal naar alle waarschijnlijkheid dus slechter presteren op de data van de instelling, dan op de eigen trainings- en testdata. Bijvoorbeeld, de vergelijking van ons heropname algoritme met een commercieel algoritme liet grote prestatieverschillen zien, tussen de oorspronkelijke testresultaten van het commerciële algoritme, de voorspellingen van dat algoritme op onze ziekenhuispopulatie en de voorspellingen van ons eigen algoritme op die populatie. Het commerciële algoritme bleek beduidend slechter te presteren op onze populatie dan op de testpopulatie van de leverancier. Met andere woorden, hoewel de leverancier kan stellen dat de prestaties even goed zijn, kan dat pas bewezen worden als de modellen rechtstreeks met elkaar vergeleken worden. In dit geval betekent dat, dat het commerciële algoritme geïnstalleerd moet worden in de instelling om vervolgens een representatief aantal voorspellingen te doen. Daarna kunnen de prestaties van het commerciële algoritme en het door de instelling vervaardigde algoritme statistisch met elkaar vergeleken worden. Een belangrijke keuze is dan de statistische test die gebruikt wordt, om de prestaties van de algoritmen met elkaar te vergelijken. Wie gaat de IGJ vertellen welke statistische test gebruikt moet worden. Wat wordt hier de norm?
de ene AUC is de andere niet
Er zijn nogal wat methoden om algoritmen met elkaar te vergelijken en de experts zijn het hier lang niet altijd met elkaar eens. Los daarvan zijn er nog methodologische hordes te nemen bij het de ontwikkelprocessen van machine learning algoritmen. Recent publiceerde een vooraanstaand AI-wetenschapper uit Stanford in JAMA een opiniestuk waarin bekritiseerd werd dat op dit moment de selectie van het optimale algoritme gedurende het trainingsproces plaatsvindt op basis van meetinstrumenten (zoals area under the curve, sensitiviteit, specificiteit), die weliswaar algemeen geaccepteerd zijn maar niet altijd representatief zijn voor de bruikbaarheid van het algoritme in de praktijk. In feite mag het juiste meetinstrument pas worden vastgesteld als bedacht is wat de consequenties voor de praktijk zijn. Als op basis van de kosten of personele inzet of misschien zelfs acceptatie door zorgverleners de ruimte voor interventies klein is dan heeft dat consequenties voor de selectie van het juiste model en dat zou kunnen betekenen dat de gangbare meetinstrumenten niet voldoen. Dat betekent impliciet dat er geen standaardmethoden zullen zijn waarmee algoritmen met elkaar vergeleken kunnen worden. Dat wordt nog een zware klus voor de toezichthouders!
Transferlearning? Updates?
De beperking, dat zelf gebouwde algoritmen niet mogen worden overgedragen heeft wel een belangrijke keerzijde. Het is de verwachting dat met verbeterende interoperabiliteit (die met VIPP-5 allicht al gerealiseerd kan zijn) de uitwisselbaarheid van algoritmen ook toeneemt. Hoewel uitwisseling van algoritmen zonder verdere maatregelen en validatie riskant is, moet wel worden nagedacht over de door interoperabiliteit gefaciliteerde transferlearning. Transferlearning is een methode waarbij een algoritme getraind wordt met data van instelling A om vervolgens nog kortdurend getraind te worden met data van instelling B waarna het model beter presteert omdat de kennis nu uit de data van zowel instelling A als B is geëxtraheerd. Dit fenomeen is uniek voor algoritmen en wordt niet besproken in de verordeningen. Het voordeel van dit soort trainingsmethodes is dat het model verplaatst wordt terwijl de data in de instelling kan blijven. Een vergelijkbare methode betreft decentralized federated learning, waarbij in verschillende centra een algoritme tegelijk steeds een stapje verder wordt getraind en tussen iedere stap de parameters van de resulterende algoritmen worden gemiddeld. Met deze methoden worden belangrijke AVG-hordes genomen. Daarnaast is natuurlijk de verwachting dat met uitbreiding van data de algoritmen na opnieuw trainen een update verdienen. Moet dan weer een nieuw CE-keurmerk behaald worden? Ik hoop dat de EU op tijd een oplossing vindt, die toepassing van deze methoden niet in een administratieve draak verandert.
Misschien zou Europa een voorbeeld kunnen nemen aan de regels die de FDA heeft opgesteld voor updates van algoritmen en software.
Algemene veiligheids- en prestatieeisen
Goed, als we er van uitgaan dat de markt ons niet kan voorzien van een acceptabel algoritme, dan kunnen we dus zelf aan de slag. Uit artikel 5, lid 5 volgt, dat het grootste deel van de 175 pagina’s tellende verordening niet van toepassing is op intern vervaardigde medische hulpmiddelen. We moeten alleen nog voldoen aan bovengenoemd artikel 5, lid 5 en aan de algemene veiligheids- en prestatie-eisen van bijlage 1. Deze bijlage telt 14 pagina’s in een klein lettertype. Het blijkt dat veel onderdelen van deze bijlage niet van toepassing lijken op algoritmen (het betreft dan opmerkingen over implantatie, straling en weefsels). Ik heb het mezelf makkelijker gemaakt door de onderdelen van deze bijlage die relevant zijn voor algoritmen die in een instelling gebruikt worden te groeperen in dit bestand. Het zijn nog altijd 7 pagina’s in lettertype 12 maar toch een stuk minder intimiderend dan de volledige bijlage.
In de algemene veiligheids- en prestatie-eisen worden enkele voor software belangrijke punten genoemd, zoals het verplicht opzetten van een kwaliteitsmanagementsysteem van het algoritme, waarbij kan worden uitgegaan van de norm NEN/ISO 13485:2016. In een volgend artikel ga ik daar verder op in.
normenstelsel: generieke exercitie
Er zijn daarnaast andere normen van belang die meer specifiek over software gaan (zoals o.a. IEC 62304 ) en er wordt op dit moment gewerkt aan een nieuwe norm over kunstmatige intelligentie in de zorg (uitgaande van het concept van ISO 24028:2019). Voor wat betreft de MDR lijkt uiteindelijk het leveren van de verplichte documentatie en het opzetten van de juiste werkwijzen (zoals het risicomanagementsysteem) een tamelijk generieke exercitie. Er zijn dan ook al de nodige cursussen over dit onderwerp te vinden. Het zou evenwel mooi zijn als er voor instellingen een generiek draaiboek zou zijn, dat gebruikt kan worden om intern vervaardigde algoritmen te laten voldoen aan de eisen van de MDR. Het lijkt me slim om hier nu niet per instelling het wiel opnieuw uitvinden maar – zeg maar – gezamenlijk te werken aan het verminderen van deze administratielast. Sterker nog; als over enkele jaren de commerciële algoritmen kwalitatief in de buurt komen van zelf vervaardigde algoritmen, dan loont het de moeite om als zorginstellingen gezamenlijk CE-keurmerken aan te vragen voor gezamenlijk vervaardigde algoritmen. Dit zou een belangrijk argument zijn voor een nationaal zorg-AI-platform: een platform waarin kennis en ervaring op het vlak van AI gebundeld wordt terwijl kosten worden beheerst.
Disclaimer: beschouw dit artikel als persoonlijke interpretatie, niet als gebruiksaanwijzing. Hoewel dit artikel met grote zorgvuldigheid werd samengesteld, kan noch de auteur, noch dokter.ai verantwoordelijkheid nemen voor eventueel geleden schade ten gevolge van beslissingen die genomen zijn op basis van de informatie op deze website. Mocht u op onjuistheden stuiten of anderszins opmerkingen hebben, laat het dan weten.
Heel interessante blog, dank! In aanvulling op het stuk ‘MDR of IVDR?’: binnen de oude wetgeving (MDD en IVDD) is er een guidance document (Meddev 2.1/6) dat standalone software als IVD beschouwt als het algoritme een combinatie van IVD en MD data gebruikt (zie p14, decision step 3). Een vergelijkbaar guidance document bestaat nog niet voor de MDR of IVDR maar ik zie geen tekenen dat dit inzicht nu anders is.
Hoi Paul, dank voor de aanvulling. Ik ga het nalezen.
Dag Bart-Jan, dank voor deze heldere uiteenzetting. Voor alle goede begrip: het verschil tussen de MDD /IVDD en MDR/IVDR zit hem vooral in de laatste letter denk ik – Directive vs Regulation. Een Directive is een Europese richtlijn die ook alleen als richtlijn geldt, terwijl een Regulation wettelijk bindend is en toegepast moet worden in alle lidstaten. Klopt dat? Zie ook https://europa.eu/european-union/eu-law/legal-acts_en
Beste Erik, dank voor je commentaar. Ik denk dat je een semantisch onderscheidt maakt. De facto moet nu een CE-markering bij een notified body behaald worden. Zonder de CE-markering mag je simpelweg niet verkopen/leveren. Dat gegeven verandert niet. Of je algoritme klasse 1 of 2a is verandert mogelijk wel. Dat heeft veel consequenties. Klasse 1 mag je zelf CE-markeren. Vanaf 2a moet je dat uitbesteden en dat kost tijd en geld (al snel €25.000)
Dag Bart-Jan,
In het kader van de paragraaf over CE-loos vervaardigen in de toekomst schrijf je dat “De redenering is, dat de marktpartijen het af zullen laten weten als medische hulpmiddelen gemakkelijk CE-loos door instellingen vervaardigd mogen worden, terwijl de leverancier moeten investeren in een prijzig CE-keurmerk. Dit zou juist tot stagneren van ontwikkeling kunnen leiden”. Het is natuurlijk anders wanneer de ziekenhuizen beschikking zouden krijgen tot platformen waarmee ze met eigen data makkelijk modellen kunnen bouwen die ze dan ook zelf kunnen toepassen. Dergelijk platform wordt bijv. nu reeds aangeboden door Robovision.ai. Dit zou de ziekenhuizen faciliteren in het zelf aanmaken van bruikbare CE-loze tools. Als dat lukt, dan krijg je een omgekeerde marktwerking, nl. dat eerder een markt ontstaat waarmee platformen c.q. tools worden aangereikt om dan zelf met eigen data de (lokaal) meest geschikte algoritmen te maken. Dus een markt die het zelf aanmaken stimuleert door de juiste vehikels daarvoor aan te reiken, eerder dan het verkopen van AI-tools. Misschien dat ook de EPD-leveranciers deze weg opgaan, en bijv. de PACS-vendors. Wat denk je hiervan?
Beste Erik, dat is zeker een interessante gedachte. Ik denk dat een deel van de ontwikkelingen die kant op gaan. Lastig voor radiologie en andere image recognition AI is dat je als instelling moeilijk in je eentje zo’n algoritme kan maken omdat je al snel 10.000 CT’s (Van 100 plaatjes?) moet labelen. Daarnaast is integratie in het werkproces vaak alleen met complexe user interfaces mogelijk. Dat blijft voorlopig nog moeilijk als zelfbouw maar wie weet. De predictive analytics op basis van EPD is daarentegen veel makkelijker te generaliseren en te toetsen. Alle software die daar nu zo’n beetje voor geschreven wordt, wordt ook met het oog op herbruikbaarheid geschreven. Ik verwacht dat de uitdaging daar vooral zal liggen in integratie in het werkproces. dat hangt dan weer van de EPD-leverancier af.