I den konteksten blir trenden mot OS det viktigste som ble meldt. Og egentlig burde det øke troa på at UV1 faktisk har effekt i NIPU. Oktober blir utrolig spennende i år.
I alle fall dersom vi fremdeles venter på Initium
Jeg har tatt utgangspunkt i median kurven. For å se effekten av CI på PFS er det best å lage en modifisert kurve som gir ønsket mPFS. Generelt vil høyere mPFS gi senere avlesning.
Progression-free survival is an important end point in advanced disease settings. Blinded independent central review (BICR) of progression in randomized clinical trials has been advocated to control bias that might result from errors in progression assessments. However, although BICR lessens some potential biases, it does not remove all biases from evaluations of treatment effectiveness. In fact, as typically conducted, BICRs may introduce bias because of informative censoring, which results from having to censor unconfirmed locally determined progressions. In this article, we discuss the rationale for BICR and different ways of implementing independent review. We discuss the limitations of these approaches and review published trials that report implementing BICR. We demonstrate the existence of informative censoring using data from a randomized phase II trial. We conclude that double-blinded trials with consistent application of measurement criteria are the best means of ensuring unbiased trial results. When such designs are not practical, BICR is not recommended as a general strategy for reducing bias. However, BICR may be useful as an auditing tool to assess the reliability of marginally positive results.
Meget interessant den siste setningen i forhold til den forskjellen som oppstod mellom cro og NIPU selv mhp PE!
Jag hittade denna artikel apropå skillnad mellan BICR och local assessment (LA):
“Systematic bias between blinded independent central review and local assessment: literature review and analyses of 76 phase III randomised controlled trials in 45 688 patients with advanced solid tumour”
Ni får gärna läsa och dra era egna slutsatser, men detta är informationen jag inhämtar:
- Man sökte fram fas III-studier där det fanns skillnad mellan BICR och LA avseende statistisk signifikans för endpoint
- Man hittade 76 studier
Nedanstående är mina egna beräkningar/slutsatser:
-
7/76=9% av studierna hade statistisk signifikans för HR PFS bedömt av LA, men inte för BICR (många olika cancersorter)
-
Av detta kan man dra slutsatsen att det är ganska ovanligt att LA och BICR skiljer sig avseende statistisk signifikans för HR PFS
-
Om man korrelerar diskrepans i bedömningen av PFS till singifikant skillnad i OS: 3/7=43% av dessa studier såg ingen skillnad i OS. 3/7=43% av studierna så en trend till ökning av OS som ej var signifikant. Endast 1/7=14% av studierna såg en signifikant skillnad i OS.
-
Alla mina påstående behöver justeras pga att denna studie kollade på fas III:or, där n=248-1168. Variansen borde alltså vara mycket större för fas II-studier med färre patienter som NIPU där n=118.
-
Jag drar därför slutsatsen att diskrepansen mellan HR PFS för LA och BICR kan vara väldigt stor, mycket större än jag trott, och att det minst föreligger en 90% sannolikhet att OS ej kommer skilja sig signifikant, men att det kanske föreligger 30-50% sannolikhet att man ser en positiv trend.
-
Frågan är hur stor sannolikheten är att denna positiva trend är tillräckligt stark för att att motivera en fas III i MPM. Vad tror ni?
Hvor mange av disse studiene var i 2L MPM, tror du?
I denne indikasjonen skal det «bare» en mindre forbedring av OS til for å kunne bli en godkjent behandling (og da trolig også i førstelinje).
Keytruda + chemo (Keynote-483) fikk nylig sine resultater fra fase-3 og der var OS litt svakere enn med ipi+nivo (CheckMate-743). Allikevel blir det en godkjent behandling i all den tid OS er bedre enn chemo alene. Ingen av studiene viste signifikant bedre PFS.
PI i NIPU mener at de er på vei mot bedre OS i UV1 armen (óg at de har signifikant PFS!), så får man bare krysse fingrene. Om PI kan vise mer modne data på bedre OS (på ESMO) så er jo veien til en fase-3 studie vid åpen. Ville overrasket meg stort om ikke BMS ønsket å gå i gang så raskt som mulig (de ønsket opprinnelig flere pasienter i NIPU).
Ingen av studierna var just i MPM, och inte heller någon med immunterapi, tror jag. Man kan kanske stödja sig mot att checkmate 743 såg signifikant skillnad i OS men inte i PFS, och att det finns en tendens bland immunterapier att ge utslag i “the tail of the survival curve”, alltså att om man redan nu kan se tecken till ökad OS i experimentarmen kanske denna skillnad kan komma att bli ännu större när datan mognar.
Man kan nog hitta argument både för och emot att man sammantaget ska få tillräckligt starka data för att gå till fas III, men sannolikheten är hög både för att man får tillräckligt bra data, och att man att man inte får det.
Mest intressant tycker jag dock är att försöka förutspå utfallet i INITIUM, eftersom detta står för största värdet av caset just nu (förutom NSCLC). Jag har skrivit till företaget men ej fått svar angående vilken effektstorlek man behöver i OS för att nå signifikans. Jag tror nämligen det finns en stor risk att man missar primär endpoint där också, eftersom man har satt H1 så optimistiskt med HR 0,6, och vad jag förstår har man gjort detta arbiträrt. Jag har försökt utgå från risk för typ 1-fel, grad av immunisering, ECOG-status och diminishing returns av tre komponenter (UV1+ipi+nivo) jämfört med fas I-datan där endast två använts. Jag hamnar då på HR >0,736. Jag tror dock verkligen att en effekt finns, frågan är ju såklart hur stor den är. Powern för att nå primär endpoint i INITIUM känns dock för liten.
Svar på inlägget ovan:
Alltså, man har ju missat primär endpoint, PI påstår inget annat. Frågan är dock om LA eller BICR har “rätt”, vilket slutlig OS borde ge svaret på. Enligt studien jag kollade på har tyvärr dock BICR oftast “rätt”.
Det räcker för övrigt inte “bara att visa mindre förbättringar i OS”, de måste vara tillräckligt stora för att motivera fas III. Allting är en gradskala.
Jeg tror vi kan gå ut fra at når det ble opplyst at man så for seg at resultatet for INITIUM ville komme i løpet av 1. halvår 2023, så bygde det primært på statistiske vurderinger. Det innebærer trolig at sannsynligheten for å nå en konklusjon ut fra den valgte power ble ansett som høy. Selvfølgelig kan vi ikke se bort at noen av de forutsetningene som ble lagt til grunn, ikke har slått til. Dette vet vi imidlertid ikke noe om på nåværende tidspunkt. Inntil videre velger jeg å tro at utsettelsen skyldes at INITIUM har ønsket effekt.
PI anerkjenner selvfølgelig at BIRC vurdering er tellende. Når det er sagt, så mener LA / akademikerne at de har «a highly significant and positive study». Om man har en tendens i favør UV1 på PFS vil man også kunne se (tydelige) utslag på OS. I MPM har man ikke sett signifikant PFS i KN483/CM743.
Yessir, derfor jeg satt «bare» i gåsetegn.
CM743 OS 18,1 måneder, KN483 OS 17,3 måneder. Hvor mye høyere må man for å motivere et fase-3?
Disse OS tallene du nevner her, hvor på tidsaksen er vi for NIPU rundt ESMO i oktober, gjennomsnittlig tid siden innrullering er vel en god parameter å se til her, vet du hva den er sånn ca. pr. dato.
På ESMO sin åpningsdag 20. oktober, er det 21,1 måneder siden pasient nummer 59 sannsynligvis ble rekruttert til NIPU-studien.
…eller, det relevante er jo deadline for late-breaking abstract 14. september. Da er det 20,0 måneder siden medan innrullert.
Mao blir det vel ganske close mhp OS data på ESMO, dog cm743 er første linje , NIPU er andre linje, Ellers kan man vel se på differansen for mpfs og os for cm743, som er 18.1- 6.8 mndr, dvs 11.3mndr. Ifølge din tabell Polygon, var mpfs medium oktober ifjor, dvs ca 11,3 mndr før deadline ESMO!
Dog det er jo forskjellen I armene som er den avgjørende her, i den forbindelse antar jeg at “PE for OS” tilsvarer mpfs mhp de statistiske dataene som krever 69 events, isåfall hvor sannsynlig er det at det inntreffer før 200923.
Hei,
takk for link til en veldig interessant artikkel. Jeg liker spesielt godt at du forteller hvordan du har tolket den.
En kommentar jeg ikke umiddelbart er enig i, men som du kanskje kan utdype er denne:
På slutten i artikkelen er det et plot med sammenlikning mellom HR central og local. Legger en denne til grunn og sammenlikner med et forenklet forhold mellom HR og antall pasienter i Initium sin kontrollgruppe får jeg at det kanskje bare er snakk om 1-2 pasienter.
Turkise streker er caHR=0.73, røde streker er korridor for forhold mellom HR central og local, mens sorte piler viser hvordan jeg leser av grafen. Ut fra dette får jeg da at det er sannsynlig at BICR er på 38 event.
Det jag menade med det var, att vid de tillfällen LA och BICR skiljde sig åt, visade sig oftast BICR ha ”rätt” (ingen skillnad/ingen signifikant skillnad i OS tros att LA såg signifikant skillnad i HR PFS). Jag glömde nämna att i snitt så var HR BICR 18% högre än HR LA (intervall 4-55%) de gånger de skiljde sig åt avseende signifikans för HR PFS (7/76 studier). Jag drog därför slutsatserna att:
- BICR ofta har ”rätt”, det vill säga om HR PFS bedöms icke-signifikant så blir utfallet oftast icke-signifikant även för OS
- Detta känns rimligt då LA ”borde” vara med biased än BICR
- Trots att det var fas III-studier kunde variansen vara ganska stor mellan LA och BICR de gånger de skiljde sig åt (18 %)
- Variansen borde vara ännu större i fas II-studier de gånger BICR och LA skiljer sig åt avseende signifikans för HR PFS
- På grund av förhållandevis liten sample size i NIPU känns det rimligt att anta ganska stor skillnad på LA och BICR i detta fall
Jag förstår faktiskt inte riktigt graferna du visar här. Kan du vara snäll att förklara på ett enkelt sätt en gång till? Jag är färgblind också så försök beskriva linjerna på ett annat sätt än bara med färg om du kan :).
Om jag dock tolkat det rätt har du använt korrelationen på 0,94 mellan LA och BICR för HR PFS, och utgått från att LA precis nådde statistisk signifikans i NIPU (när jag räknar på det får jag det till att det är 40 events som behövs i kontrollgruppen för att nå HR <0,736 och inte 39 events, men är lite osäker). Då blir HR för 40 events i kontrollarmen 0,726 när jag räknar på det. Blir dock lite förvirrad över att du slänger in INITIUM här, det är väl NIPU vi diskuterar? Om HR PFS för LA är 0,726, blir HR PFS för BICR 0,726/0,94=0,772, vilket skulle motsvara 39 events i kontrollgruppen.
Det vi ju egentligen försöker svara på, är hur stor vi tror att skillnaden mellan HR PFS för LA och BICR är. Knäckfrågan här blir väl kanske om det är den ”vanliga” variansen man ska räkna med (korrelationen 0,94, den jag tror du visar i dina grafer), eller om man ska räkna med ”ovanligt hög varians” (det jag kollat på i de sju studierna, en korrelation på typ 0,85 (1/1,18=0,85)). Vid korrelation på 0,85 hamnar HR PFS för BICR på 0,726/0,85=0,854, vilket skulle motsvara 37 events i kontrollarmen.
Något som kan tala för att det är den ”vanliga” variansen man ska räkna med, är att majoriteten av de fas III-studier man kollat på i denna studie sannolikt föregicks av fas II. Man kunde därför powerberäkna på ett bättre sätt, vilket gjorde att man oftare hamnade inom statistisk signifikans för både LA och BICR. Detta stämmer även överens med att fas III-studier har högre success rate än fas II. Man hade inga kliniska data för UV1+nivo+ipi i MPM tidigare.
Samtidigt kvarstår faktumet att antalet patienter i NIPU är förhållandevis få, vilket borde ge en hög varians.
Tycker det är väldigt svårt att veta hur man ska väga faktorerna mot varandra och jag vet inte säkert om det går att dra några slutsatser i detta skede. Vad är era tankar om allt detta, hur stor tror ni skillnaden mellan HR PFS för LA och BICR är? Är mina resonemang logiska eller tänker jag fel?
Dannes det ikke et helt uriktig bilde ved å bruke varians og kovarians lagt til grunn for korrelasjon mellom “konfliktstudier” og utfall opp mot et enkelt studie og eventfordeling?
Forbehold at jeg ikke har plukket den røde tråden her…
Eneste det er aktuelt for er vel NIPU og om Helland faktisk har en reell trend mot forbedrer OS basert på deres PE met med signifikans i predefinerte lokale analyser.
Disse er nok nettopp predefinert gitt BICR kan være FOR konservativ ved bedømmelse av bilder i en så tricky indikasjon. Gjerne like konservativ som LA er biased, ergo utfallsrommet kan være grunnleggende positiv for modne data senere🤔
Siden ingen av de 7 studiene du refererer til er i den relevante indikasjonen, (og kanskje heller ikke innenfor immunterapi i det hele tatt) må vel en konklusjon på statistisk sannsynlighet i beste fall bli en kvalifisert gjetning @Laaarsas ?
Det kan fort bli å sammenligne epler og pærer.
Ja absolut inte mer än så. Men det kanske är bättre än ingenting? Jag hade i alla fall ingen uppfattning om hur stor skillnaden mellan bedömningar av LA och BICR kunde vara innan jag läste artikeln, utan antog att de faktiskt skulle vara ganska lika. Beroende på hur man tolkar informationen i artikeln och vilka slutsatser man drar kan man hävda att skillnaderna inte faktiskt är så stora (korrelation på 0,94), eller att eftersom det är en fas II så skulle skillnaderna visst vara mycket stora. Vet ej vad som är rimligast.
Jeg tenker at fase 2 kontra fase 3 er bare en faktor. Hvor komplisert det er å måle progression i den aktuelle indikasjonen er en annen.