Non-inferiority studier

Publicerad: 1 mars 2024
Senast uppdaterad: 1 mars 2024
Kategori: Generellt kapitel
Status: Gällande
Författare: Filip Josephson

Non-inferiority innebär att dra slutsatser om en behandlingseffekt genom att visa likhet (snarare än skillnad) mellan två behandlingar.

Överlägsenhet respektive likhet

I avsnittet hypotestestning på sidan Studiedesign och genomförande har vi antagit att effekt skall etableras genom att visa att test-behandlingen är överlägsen referensbehandlingen (oavsett om den senare är ingen aktiv behandling eller en etablerad behandling som själv har en viss effektstorlek). Studier med detta syfte kallas för ”superiority”-studier.

I det som följer diskuteras hur förutsättningarna för att isolera en behandlingseffekt förändras, när man söker etablera behandlingseffekter genom att visa att en behandling inte är sämre än en etablerad behandling. Gränsen för hur mycket sämre testbehandlingen kan vara och ändå anses effektiv, kallas för ”non-inferiority-marginalen”.

Studier med sådan design kallas non-inferiority-studier. Detta är en randomiserad studie med en aktiv behandling som kontroll. Dess statistiska design syftar till att visa att testbehandlingen bibehåller en viss andel av den effekt som kontrollbehandlingen anses ha.

Effekter som grundas i statistisk skillnad är mera tillförlitliga än sådana som vilar på statistisk likhet, av skäl som diskuteras i det som följer. Eftersom en relativt stor andel av nya läkemedel godkänns utifrån effektdemonstrationer via non-inferiority snarare än superiority, är non-inferiority-studiens specifika metodologiska karaktäristika viktiga att beakta.

Varför gör man non‍-‍inferiority studier?

Exempel inkluderar:

För att etablera behandlingseffekter när det inte är sannolikt att testbehandlingen är bättre än referensbehandling, och då det inte är etiskt/praktiskt möjligt att undanhålla patienten aktiv behandling.
För att utesluta att en ny behandling är oacceptabelt mindre säker än en etablerad behandling. Exempel utgörs av ovan nämnda MACE‍-‍studier
För att specifikt generera data om den relativa effekten av två behandlingar.

En ny behandling kan tillföra nytta även om den inte är bättre än en existerande behandling; exempelvis om den har en bättre biverkningsprofil, mindre läkemedelsinteraktioner eller doseras på ett mindre komplicerat och därigenom fördelaktigt sätt. Därutöver visar den växande erfarenheten av bristsituationer på betydelsen av att ha flera alternativa behandlingar tillgängliga.

En studie som syftar till att visa likhet mellan två behandlingar kan även innefatta en studiearm utan aktiv behandling för att etablera effekt. I sådana fall uppstår inte de metodologiska problem som följer med effektdemonstrationer via likhet snarare än skillnad; detta scenario avhandlas således inte här.

Noll-hypotesen i en non-inferiority studie

Ovan diskuterades hur man i en studie som syftar till att visa att testbehandlingen är överlägsen referensbehandlingen, formulerar en nollhypotes vars innebörd är att det inte finns någon skillnad i effekt mellan behandlingarna.

I en non-inferiority-studie däremot, är noll-hypotesen inte längre noll skillnad. I stället är det att det finns en skillnad som är större än -M (som även kallas för delta). Här står M för non-inferiority-marginalen, det vill säga test-behandlingen är inte sämre än referensbehandlingen med en marginal större än -M. Således är det statistiska testet vid superiority respektive non-inferiority detsamma, förutom att baslinjen omkalibrerats från 0 till -‍M.

Tänkbara utfall i en non‍-‍inferiority studie

Ett tänkbart utfall av en studie med non-inferiority-design är att testbehandlingen visar statistisk överlägsenhet i enlighet med vad som skulle ha gällt vid en superiority-design.

Om det inte finns mer än en utfallsvariabel som ska testas, är övergång från att testa för non-inferiority till att testa för superiority normalt metodologiskt acceptabelt, då det är att betrakta som en statistiskt ”sluten testprocedur”, varvid typ 1‍-‍felet förblir skyddat (om det finns mer än en utfallsvariabel behöver dock proceduren för övergång från non-inferiority till superiority förspecificeras när man bestämmer hur man ska allokera alfa till olika utfallsvariabler).

Notera att motsatta förfarandet, att dra slutsatser om effekt via ”non-inferiority” i studier som designats för att hypotestesta överlägsenhet, näst intill aldrig är metodologiskt acceptabelt, på grund av avsaknad av förspecificering av M, så väl som designelement för att garantera ”assay sensitivity” (se avsnittet effektdemonstration i non-inferiority studier vilar på historiska kontroller) samt bristande typ 1‍-‍felkontroll. Om non-inferiority-studiens nollhypotes inte kan förkastas (det vill säga att det 95 % konfidensintervallet för skillnaden i effekt innefattar -M) så har studien inte visat effekt via non-inferiority.

De metodologiska problem som är specifika för non-inferiority-studier uppstår när nollhypotesen kan förkastas (det vill säga att non-inferiority visas) men överlägsenhet inte visas.

Då har studien i statistisk bemärkelse indikerat effekt av testbehandlingen. Detta räcker dock inte för att dra en slutsats om effekt. En sådan kräver, förutom ett positivt statistiskt test, obevisbara antaganden om hur kontrollarmen presterar i relation till en icke existerande studiearm med placebo/ingen behandling.

Effektdemonstration i non‍-‍inferiority studier vilar på historiska kontroller

”Assay sensitivity” eller analyskänslighet avser ett experiments förmåga att påvisa en skillnad mellan test- och kontrolbehandling av en viss storlek, om en sådan finns.

En non-inferiority studie med analyskänslighet skulle således ha visat referensbehandlingens överlägsenhet över ingen behandling, om en behandlingsarm utan aktiv behandling hade funnits. En sådan fanns dock inte.

Om en studie inte visar en statistisk skillnad i behandlingseffekt (utan endast likhet), så kan vi däremot inte säkert veta att studien utformats och genomförts på ett sådant sätt att den hade kunnat visa en skillnad om en sådan funnits. Det förblir således okänd om analyskänslighet förelegat.

Om statistisk överlägsenhet visas i en studie, drar vi således slutsatsen att effekt har demonstrerats. I frånvaro av sådan skillnad visar non-inferiority-studien inte oförmedlat att testbehandlingen är bättre än ingen aktiv behandling. Demonstrationen av effekt via non-inferiority står således inte på egna ben.

Slutsatsen om effekt via non-inferiority vilar på ett antagande om effektstorleken hos referensbehandlingen i jämförelse med ingen aktiv behandling. Detta antagande bevisas inte i non-inferiority-studien. Snarare baseras det på historiska studier av referensbehandlingen i jämförelse med ingen behandling.

Non-inferiority marginalen

Alternativ-hypotesen i en non‍-‍inferiority-studie gäller således om nedre gränsen för den uppmätta skillnadens 95‍-‍procentiga konfidensintervall inte innefattar -‍M. Hur definieras då non‍-‍inferiority-marginalen?

Den vanligen använda begreppsapparaten och proceduren för detta stammar från FDA’s riktlinje för effektdemonstration genom non‍-‍inferiority. FDA skiljer mellan två marginaler, som kallas M1 respektive M2

M1 bestäms utifrån historiska studier med referensbehandlingen. Den motsvarar hela den effekt som referensbehandlingen antas (men inte kan bevisas) utöva i non‍-‍inferiority-studien.
Med M2 avses den största acceptabla skillnaden i effekt mellan test och referens. M2 baseras på värdering av vad som kan anses vara kliniskt ekvivalent effekt. M2 definieras således ofta på subjektiv grund. Notabelt är att M2 inte kan vara större än M1, då detta skulle implicera att noll effekt kan vara relevant.

The fixed margin method

När vi diskuterar en indirekt demonstration av effekt via non‍-‍inferiority, är det således M1 som står i fokus. Det vanligaste sättet att bestämma M1 kallas för ”the fixed margin method” eller ”95‍-‍95‍-‍metoden”.

För att bestämma M1 enligt denna procedur, görs en systematisk översikt eller metaanalys av tidigare studier av referensbehandlingen mot ingen behandling, som bör ha varit lika den planerade non‍-‍inferiority-studien.

På denna grund beräknas den nedre gränsen för det 95‍-‍procentiga konfidensintervallet för referensbehandlingens effekt över ingen behandling. Denna definierar M1.

Om sedan det 95‍-‍procentiga konfidensintervallet för skillnaden i behandlingseffekt mellan test- och referensbehandling i non‍-‍inferiority-studien inte innefattar M1, så anses non‍-‍inferiority ha visats (därav 95‍-‍95‍-‍metoden).

Constancy assumption

De studier som är relevanta för att bestämma M1 bör likna den aktuella non‍-‍inferiority-studien så mycket som möjligt, frånsett att de måste ha visat överlägsenhet för non‍-‍inferiority-studiens referens-behandling över den då aktuella kontrollgruppen.

Studierna bör vara likartade avseende:

Målpopulationens definition
Studiepopulationens faktiska sammansättning vad gäller prevalensen av effektmodifierare
Referensbehandlingens doseringsregim
Bakgrundsbehandlingar och generellt omhändertagande
Monitorering och mätning av primärt utfall.

Begreppet prevalens definieras som antalet individer i en population som har en given sjukdom eller ett givet tillstånd vid en viss tidpunkt.

Med “constancy assumption” avses antagandet att referensbehandlingens effektstorlek är ungefärligen likartad, både mellan de historiska studier på vilken M1 baseras, och i den non‍-‍inferiority-studie som planeras eller analyseras.

Om constancy assumption inte är rimligt utifrån påtagligt varierande utfall i historiska studier av någorlunda storlek, så är behandlingen inte lämplig som referens i non‍-‍inferiority-studier.

Det är inte ovanligt att det bara finns en enda relevant tidigare studie för referensbehandlingen. I sådana fall kan constancy assumption inte bekräftas.

Det kan även vara så att det helt enkelt saknas relevanta historiska effektestimat för någon relevant referensbehandling. Då kan effekt för en testbehandling inte tillförlitligt etableras genom non‍-‍inferiority. Det innebär att överlägsenhet krävs för att etablera effekt av testbehandlingen.

Non‍-‍inferiority-studiens genomförande

En betydelsefull skillnad mellan superiority- och non‍-‍inferiority-studier, är de potentiella konsekvenserna av ett suboptimalt genomförande av studien.

När studiens genomförande diskuterades ovan, var fokus på element som kan införa bias till förmån för en skillnad mellan de studerade behandlingarna.

I non‍-‍inferiority-studier faller fokus snarare på omständigheter som kan ge bias till förmån för likhet mellan de studerade behandlingarna, eftersom man avser att dra slutsatser om testbehandlingens effekt i situationer där överlägsen effekt inte visats.

Saker att beakta inkluderar:

Om patienter inkluderas i en studie utan att faktiskt uppfylla studiekriterier.
Dålig följsamhet till studiebehandlingen.
Aktiv tilläggsbehandling.
Okänsliga mätmetoder eller otillräckliga mättekniker.

Dessa fenomen tenderar att ge bias till förmån för likhet mellan studiebehandlingarna - vilket i non‍-‍inferiority-studien, till skillnad från superiority-studien, utgör grunden för att dra slutsatsen att test-behandlingen har effekt.

Analyspopulationer och estimander i non‍-‍inferiority-studier

En ytterligare faktor som måste beaktas annorlunda i en non-inferiority-studie, är hur saknade mätvärden bör hanteras. I en superiority-studie söker vi hantera saknade data med rimligt konservativ imputation för att undvika bias till förmån för testbehandlingen.

Imputations-tekniker som ofta är konservativa i superiority-studier (såsom ”Baseline Observation Carried Forward” eller ”Jump to Reference”) tenderar att vara antikonservativa i en non-inferiority-studie, då de ger bias för likhet snarare än skillnad i utfall mellan studiearmarna.

På grund av dessa omständigheter föreslår äldre regulatoriska riktlinjer att likhet i utfall i en ITT‍-‍population inte är tillräckligt för att en non‍-‍inferiority-studie skall betraktas som statistiskt positiv. Det sägs att en PP‍-‍population bör uppfattas som komplementär. Hur detta skall förstås i termer av alfa‍-‍allokering förblir oklart.

Som tidigare nämnts uppfattas begreppet PP idag som icke‍-‍informativt. Det föredras att problematiken med interkurrenta händelser i non‍-‍inferiority-studier omhändertas med väl motiverande och förspecificerade estimander, som syftar till att inte gömma eventuella skillnader mellan studiearmarna.

Föregående sida
Subgruppsanalyser och sekundära effektvariabler

Nästa sida
Utredning av klinisk säkerhet

Har du synpunkter på Läkemedelsbokens nya webbplats?

Läkemedelsboken vänder sig framför allt till specialister i allmänmedicin, läkare under specialiserings- eller allmäntjänstgöring, studerande inom medicin och farmaci, men också till läkare som behöver råd vid medicinska problem utanför den egna specialiteten. Vi vill gärna att du som använder Läkemedelsboken skriver hur webbplatsen skulle kunna bli bättre, utifrån de behov som du har. Dina svar blir anonyma. Undvik därför att skriva namn, kontaktuppgifter eller något annat om dig själv eller någon annan.

Lämna synpunkter

Tänk på att det du skickar in till Läkemedelsverket blir en så kallad allmän handling. Om någon vill läsa våra allmänna handlingar så måste vi lämna ut dem. Undvik att skriva in känsliga personuppgifter.

Läs om hur Läkemedelsverket behandlar personuppgifter.

Non-inferiority studier

Överlägsenhet respektive likhet

Varför gör man non‍-‍inferiority studier?

Noll-hypotesen i en non-inferiority studie

Tänkbara utfall i en non‍-‍inferiority studie

Effekt­demonstration i non‍-‍inferiority studier vilar på historiska kontroller

Non-inferiority marginalen

The fixed margin method

Constancy assumption

Non‍-‍inferiority-studiens genomförande

Analys­populationer och estimander i non‍-‍inferiority-studier

Har du synpunkter på Läkemedelsbokens nya webbplats?

Har du synpunkter på Läkemedelsbokens nya webbplats?

Effektdemonstration i non‍-‍inferiority studier vilar på historiska kontroller

Analyspopulationer och estimander i non‍-‍inferiority-studier