Acceder

Laminar Pharmaceuticals

2,75K respuestas
Laminar Pharmaceuticals
Laminar Pharmaceuticals
Página
190 / 190
#2837

Re: Laminar Pharmaceuticals

 Graficas segundo prompt: OS experimental si OS control = Stupp 14.6 meses
 



#2838

Re: Laminar Pharmaceuticals

Hola Dashboard:

te confirmo los resultados de tu Prompt 1, llego a los mismos con segundo decimal de diferencias (que viene de redondeos de lo que veo ya que no hay acceso a tu fichero).

Por otro lado como "challenge", he revisado un método B alternativo usando Poisson-Binomial para tener método diferente aunque con nuestra muestra tan pequeña de 144 poca diferencia da... de hecho usándolo sale ΔmOS máximo   0.53 días (0.017 meses),  Δλ máximo 0.72 días y P(N≥90) en λ_A 0.502 (vs 0.500 exacto). Medo día no es relevante...

Espero te sirva de algo, aunque 100 confirmaciones valgan menos que un error encontrado.



Para el Prompt 2 obtengo mismos resultados, esta vez con variación por redondeo 2 decimales que veo tuyos. (mismo comentario sobre método B)



Y un poquito de diversión para ti, Dashboard: ¿y si el control no se comporta como Stupp? Gráficas de qué pasa con los números cuando cambias esa suposición, usando como referencia cinco ensayos históricos reales de glioblastoma. 





Saludos,
J.

#2839

Re: Laminar Pharmaceuticals

Hola J. 

Gracias por tomarte la molestia de replicarlo y, sobre todo, por intentar tensionar el método en vez de limitarte a confirmarlo.

Que en el Prompt 1 te salgan prácticamente los mismos resultados, con diferencias de segundo decimal atribuibles al redondeo, ya es una buena señal. Pero lo más útil de tu revisión es justo el “challenge” con un Método B alternativo basado en Poisson-binomial.

Si con ese contraste salen diferencias máximas del orden de:

  • ΔmOS = 0.53 días (0.017 meses),
  • Δλ = 0.72 días,
  • y (P(N \ge 90)) en la solución de (\lambda_A) = 0.502 frente a 0.500,

entonces, al menos para este problema y con (N=144), la aproximación principal parece muy robusta en términos prácticos. Medio día de diferencia está muy por debajo de la escala temporal relevante del ejercicio y no cambia ninguna de las conclusiones.

Que además en el Prompt 2 te ocurra lo mismo refuerza la idea de que los resultados no dependen de una implementación concreta, sino de la estructura del modelo y de los supuestos impuestos.

Y coincido totalmente contigo en la última frase: una confirmación nunca vale tanto como encontrar un error. Precisamente por eso tu contraste tiene valor: porque no solo confirma, sino que intenta romper el planteamiento con un método alternativo y no encuentra una discrepancia material.

De hecho, mi siguiente paso iba a ser precisamente plantear el prompt para construir un mapa de calor de la OS del control según fecha de ocurrencia del evento 90, pero como esa línea de trabajo ya la he hecho, voy a pasar directamente a intentar estimar la OS del control de la forma más precisa que pueda. Eso me va a llevar algo de tiempo porque quiero combinar el modo agente con investigación avanzada para intentar acotar bien el ancla del control antes de seguir afinando.

Como dato que me parece bastante revelador: la OS del brazo experimental del ensayo fase 2a de SurVaxM, además con criterios de exclusión significativamente más favorables, es de 25.9 meses. Si algo de ese orden acabara pareciéndose al control real en nuestro caso, entonces, según el mapa de calor, ya en abril estaríamos hablando de un HR alrededor de 0.8 en OS global.

Por curiosidad metodológica: ¿qué modelo de IA has usado para replicarlo? 

#2840

Re: Laminar Pharmaceuticals

Hola:

sobre todo Opus de Anthropic, y como ya intuirás Python/numpy/scipy.

Sobre el heatmap: uso Weibull con el mismo k calibrado de Stupp (1.2683) que usas tú. Barremos mOS_control de 14 a 28 meses recalculando λ_c para cada ancla,  y resolvemos λ_t para que P(evento 90 ≤ D) = 0.5. No hay ningún truco, es tu mismo modelo pero sin fijar el control... ¿tiene sentido?

Sobre lo de SurVaxM como referencia del control: ojo que es brazo experimental de fase 2a con criterios de inclusión mas favorables, así que 25.9m es probablemente un techo no un caso base. Pero como cota superior es útil, si el control fuera tan bueno, el heatmap da HR ~0.8 ya en abril que es justo  lo que comentas. 

Y bonus track algo menos historiado y muuuuuuucho menos fiable:
P(éxito): 93-100% para todas las fechas. Esto suena demasiado bueno, pero tiene lógica: si el evento 90 cae en abril-noviembre 2026, el HR medio ponderado es 0.23-0.37, y con 90 eventos el logrank detecta cualquier HR < 0.63. Está muy por debajo del umbral.



Que el ensayo no haya alcanzado los 90 eventos a marzo 2026 es, bajo cualquier modelo razonable, una señal fuerte. No prueba nada (no sabemos qué brazo tira), pero la probabilidad de HR > 0.63 es prácticamente cero bajo este análisis. Ojo, importante: esto asume que no sabemos nada más (no hay comunicados de la empresa, decisiones del IDMC, etc.). En la realidad, esas señales también nos informan indirectmente.


Pero quizás mas llamativo para el publico de este hilo que haya llegado a leer hasta aquí:
" El análisis dice: si el evento 90 cae en cualquier fecha de abril a noviembre 2026, el ensayo es casi seguro positivo, porque incluso con controles modernos optimistas, el HR implícito es tan bajo que 90 eventos sobran para detectarlo/ser bueno.

¡OJO NO creerse nada, todo pruebas elucubraciones y desvaríos de este forero random que queda a su disposición!

Saludos,
J
#2841

Re: Laminar Pharmaceuticals

¿Estamos seguros de que nos informaran cuando se hayan alcanzado los 90 eventos? 
#2842

Re: Laminar Pharmaceuticals

No, no hay garantía de que nos informen directamente cuando se alcancen. 

Cómo nos enteraremos:
  1. Comunicado de la empresa — si deciden informar (lo han hecho con hitos anteriores como el IDMC) pero con la entrada de nuevos accionistas... dudoso
  2. Actualización en ClinicalTrials.gov — el sponsor debe actualizar el registro cuando el estudio completa. Pero puede haber meses de retraso entre el evento y la publicación
  3. Publicación de resultados — obligatorio en ClinicalTrials.gov dentro de 12 meses de study completion que es en Noviembre de 2026!!!!
  4. ¿Nos legará antes por otras vías?

Paciencia...

J.
#2843

Re: Laminar Pharmaceuticals

Esta vez si que se puede decir, no news-good news
#2844

Re: Laminar Pharmaceuticals


1) Objeto de la estimación


El objetivo es estimar la supervivencia global mediana (OS) esperable en el brazo control de CLINGLIO (NCT04250922), es decir, en pacientes tratados con protocolo de Stupp + placebo. El registro del estudio lo describe como un ensayo fase IIb/III aleatorizado, doble ciego, en glioblastoma de nuevo diagnóstico, IDH1 wildtype, con RT + TMZ concomitante y luego TMZ adyuvante, y análisis final de OS tras 90 eventos. El propio programa ha comunicado además que, tras el análisis intermedio de PFS, el estudio siguió adelante sin futilidad y con final de OS previsto para finales de 2026. (ctv.veeva.com)

Para esta proyección tomo como base los criterios de elegibilidad que has copiado del registro: población de GBM primario/de novo, IDH1 wildtype, MGMT determinado centralmente pero no usado como criterio de selección, resección total o parcial obligatoria, exclusión de biopsy-only, exclusión de multifocalidad/diffuse midline, y KPS >50.

2) Resultado principal de la proyección


Mi estimación puntual más defendible para la OS mediana del control de CLINGLIO es de 17,0 meses.

El rango probable que considero más realista es 16,2 a 18,3 meses.

El rango ampliado de sensibilidad, para escenarios menos probables pero todavía plausibles, es 15,0 a 19,0 meses. (PMC)

3) Método de estimación


La estimación no sale de una fórmula única, sino de un procedimiento auditable en tres pasos.

Primero, uso como anclajes principales los ensayos aleatorizados con brazo control Stupp y con elegibilidad más parecida a CLINGLIO: RTOG 0825, AVAglio y MIRAGE. Esos tres estudios son los más útiles porque no enriquecen fuertemente por MGMT en la cohorte global y comparan directamente contra TMZ/RT estándar desde el inicio. Sus OS medianas en el control fueron 16,1 meses en RTOG 0825, 16,7 meses en AVAglio y 17,0 meses en MIRAGE. El promedio simple de esos tres controles es 16,6 meses, que funciona como el mejor punto de partida “neutro”. (PMC)

Segundo, uso ensayos “cercanos pero no equivalentes” para marcar los límites de plausibilidad. INTELLANCE-1 tuvo una OS del control de 18,7 meses, pero es una cohorte seleccionada por EGFR amplificado y con enfermedad unifocal, así que representa un entorno algo más favorable que un all-comer molecular. En el otro extremo, CheckMate 498, restringido a MGMT no metilado, tuvo una OS del control de 14,9 meses, lo que marca bien el suelo de una cohorte biológicamente desfavorable. CheckMate 548, casi enteramente MGMT metilado/indeterminado y además sin biopsy-only, alcanzó 32,1 meses en el control, pero ese valor es demasiado favorable y no es transportable a CLINGLIO como expectativa central. ALECSAT añade un techo moderado adicional, con control en 18,3 meses. (PMC)

Tercero, aplico una corrección clínica explícita a partir de las diferencias de elegibilidad entre CLINGLIO y esos estudios afines.

4) Factores que probablemente empujan la OS del control de CLINGLIO hacia arriba


Hay varias características de CLINGLIO que, en conjunto, deberían hacer que el brazo control rinda algo mejor que el promedio de un ensayo Stupp amplio.

La primera es la exclusión de biopsy-only. CLINGLIO exige resección total o parcial, lo que en general selecciona pacientes con enfermedad más accesible y mejor pronóstico que aquellos en los que solo puede hacerse biopsia. AVAglio y MIRAGE sí admitían biopsia, de modo que su control incluye casos más heterogéneos y potencialmente peores que los de CLINGLIO. En RTOG 0825 no se formuló así de forma tan directa, pero la exigencia de tejido tumoral previo a RT dejó fuera, en la práctica, a parte de los casos con biopsia diagnóstica simple. (PMC)

La segunda es la exclusión de multifocalidad/diffuse midline que figura en el registro que has copiado. Eso también enriquece por mejor pronóstico frente a cohortes más abiertas, porque la enfermedad multifocal y la enfermedad anatómicamente extensa suelen asociarse a peor evolución.

La tercera es que el ensayo exige una población con tejido suficiente, cirugía previa y tratamiento estándar completo, lo que la acerca más a cohortes “bien tratables” que a series más pragmáticas.

Estas tres características justifican mover la expectativa del control ligeramente por encima del promedio bruto de 16,6 meses derivado de RTOG 0825, AVAglio y MIRAGE. (PMC)

5) Factores que empujan la OS del control de CLINGLIO hacia abajo


El principal contrapeso es que CLINGLIO exige IDH1 wildtype. Eso elimina el pequeño subconjunto de tumores IDH mutados de mejor pronóstico que todavía podía contaminar algunos estudios históricos o transicionales. Esa depuración molecular hace que no sea correcto subir mecánicamente la OS esperada del control solo porque el estudio excluya biopsy-only y multifocalidad.

El segundo contrapeso es el KPS >50. Aunque sigue siendo una población tratable, ese umbral es más laxo que el de varios ensayos comparadores de referencia, que con frecuencia pedían KPS ≥70 o equivalente. Eso introduce la posibilidad de que entren pacientes funcionalmente peores que en RTOG 0825, MIRAGE, INTELLANCE-1 o los CheckMate, lo que limita el alza esperable de la OS del placebo. (ctv.veeva.com)

6) El modulador principal: la mezcla de MGMT


La mayor incertidumbre de la proyección está en la distribución real de MGMT dentro del brazo control.

En el desarrollo clásico de TMZ, el subgrupo con MGMT metilado tuvo una OS claramente superior al no metilado; el propio artículo de CheckMate 498 recuerda el dato histórico de 21,7 meses con RT+TMZ en metilados frente a 12,7 meses en no metilados. En la era moderna, CheckMate 498 mostró que una cohorte totalmente MGMT no metilada tiene un control de 14,9 meses, mientras que CheckMate 548 mostró que una cohorte fuertemente favorable, esencialmente MGMT metilada/indeterminada, puede alcanzar 32,1 meses. (PMC)

CLINGLIO no selecciona por MGMT, pero sí lo determina centralmente. Eso significa que su control no debería parecerse ni al extremo puro no metilado de CheckMate 498 ni al extremo muy favorable de CheckMate 548. De hecho, la comunicación pública del sponsor sobre el análisis intermedio indicó una señal de PFS en MGMT metilados y ausencia de mejora en no metilados, lo que refuerza que la mezcla molecular probablemente será el principal determinante de dónde cae la OS final del control dentro del rango proyectado. (prnewswire.com)

7) Justificación específica usando los ensayos más afines


La base principal de la proyección es que CLINGLIO se parece más a AVAglio, MIRAGE y RTOG 0825 que a los ensayos enriquecidos por biomarcadores.

AVAglio es útil porque es un ensayo grande, contemporáneo, con control Stupp completo y sin selección por MGMT. Su control de 16,7 meses seguramente infraestima ligeramente a CLINGLIO, porque AVAglio admitía biopsia y era algo más amplio en elegibilidad quirúrgica. (New England Journal of Medicine)

MIRAGE es quizá el ancla individual más parecida a nivel biológico moderno, porque tampoco selecciona la cohorte global por MGMT y además ya opera en una era donde la exclusión de IDH mutado conocido forma parte de la lógica del ensayo. Su control fue 17,0 meses, y por eso lo considero el mejor centro de gravedad individual para CLINGLIO. La diferencia principal es que MIRAGE todavía admitía biopsia/parcial/GTR, mientras que CLINGLIO excluye biopsy-only. Eso sugiere que CLINGLIO podría rendir igual o algo mejor que esos 17 meses, salvo que la mezcla de MGMT o el KPS más laxo lo compensen a la baja. (Amsterdam UMC)

RTOG 0825 aporta un control de 16,1 meses y funciona como ancla conservadora. Aunque no tiene la limpieza molecular de los ensayos más modernos, su elegibilidad también era relativamente robusta y la exigencia de material tumoral lo acercaba a cohortes no basadas en simple biopsia. Por eso lo uso como límite inferior razonable del escenario central, no como forecast principal. (PMC)

INTELLANCE-1 y ALECSAT justifican que el techo del rango probable pueda acercarse a 18–18,5 meses. INTELLANCE-1 tuvo un control de 18,7 meses, pero exigía EGFR amplificado y por tanto no es directamente generalizable. ALECSAT, con control de 18,3 meses, apunta en la misma dirección: en cohortes modernas algo favorables, el control Stupp puede situarse cerca de 18 meses. Eso me sirve para sostener el límite superior del rango probable, pero no para fijar el punto central. (PMC)

CheckMate 498 justifica el suelo de sensibilidad. Si CLINGLIO tuviera por azar una mezcla desproporcionadamente desfavorable de MGMT no metilado o una mayor carga de pacientes con peor estado funcional, la OS del control podría acercarse a 15 meses, que es justamente donde cayó el control de CheckMate 498. Pero no lo considero el escenario más probable porque CLINGLIO no está enriquecido exclusivamente por MGMT no metilado. (PMC)

CheckMate 548, en cambio, demuestra que los controles pueden dispararse por encima de 30 meses cuando la cohorte está muy enriquecida por MGMT favorable y además excluye biopsy-only. Precisamente por eso no debe usarse como referencia central para CLINGLIO. Sirve como recordatorio de que el MGMT domina gran parte de la varianza, pero no como comparador transportable. (PMC)

8) Sensibilidades explícitas


En un escenario conservador bajo, la OS del control de CLINGLIO caería en 15,0 a 16,0 meses. Eso exigiría una mezcla biológica peor de lo esperado, con predominio de no metilados, necesidad elevada de corticoides y/o mayor carga funcional baja dentro del rango KPS permitido. El respaldo empírico para ese escenario es CheckMate 498. (PMC)

En el escenario central, que considero el más plausible, la OS del control cae en 16,2 a 18,3 meses. Ese rango está anclado directamente en RTOG 0825, AVAglio y MIRAGE, luego corregido por las ventajas de CLINGLIO en cirugía y focalidad, y por los contrapesos de IDH-wt y KPS >50. (PMC)

En un escenario alto, la OS del control podría situarse en 18,3 a 19,0 meses. Para que eso ocurra, CLINGLIO tendría que haber reclutado una cohorte placebo especialmente favorable en términos de MGMT y calidad de resección, y el efecto positivo de excluir biopsy-only y multifocalidad tendría que pesar claramente más que el efecto negativo de exigir IDH-wt. INTELLANCE-1 y ALECSAT son los mejores soportes empíricos para aceptar que ese escenario es posible, aunque no sea el base case. (PMC)

9) Conclusión final


Mi conclusión operativa es esta: la OS mediana más probable del brazo control de CLINGLIO es aproximadamente 17,0 meses. El intervalo que considero más razonable hoy, antes de disponer de la tabla basal pública completa del placebo, es 16,2–18,3 meses. Y el intervalo ampliado de sensibilidad que cubriría escenarios menos probables pero plausibles es 15,0–19,0 meses. (ctv.veeva.com)

La justificación es coherente con los ensayos más afines: AVAglio, MIRAGE y RTOG 0825 fijan el ancla central; INTELLANCE-1 y ALECSAT sostienen un techo razonable alrededor de 18–19 meses; CheckMate 498 sostiene el suelo; y CheckMate 548 muestra por qué no conviene sobreestimar el control de CLINGLIO extrapolando desde cohortes muy enriquecidas por MGMT favorable. (PMC)

#2845

Re: Laminar Pharmaceuticals