マネジメントブログ

Xのご質問への回答と臨床第2相試験の「感触」

河邊です。ブログは大変ご無沙汰になりました。
既に公表しているとおり現在は、CBP501欧州臨床第3相試験の開始に向けて、規制当局とのコミュニケーションや薬剤の準備などを続けています。

今日は、X(旧ツイッター)でいただいたご質問にお答えします。

Q(要約):
CBP501臨床第2相試験について「症例数の少なさ」を指摘するコメントがいくつかあります。
キャンバスの過去の説明によると「9名中4例の3M-PFS(3ヶ月間無増悪生存)で早期有効中止」は「23名中6例の3M-PFS」と同等の結果だから被験者保護の目的で推奨されているアダプティブデザインを採用したとされていましたが、もし23名の試験だったら症例数の少なさを指摘されなかったということでしょうか?
もしそうならば、せっかく被験者保護のために2ステージデザインにした本来の意味が失われるように感じます。

もとのご質問はこちらです。ご質問ありがとうございました。要約ご容赦ください。 )

米国で実施したCBP501臨床第2相試験について、欧州臨床腫瘍学会(ESMO)でのポスター発表 、European Journal of Cancer 誌への論⽂掲載が続きました。
これらに関連して、CBP501臨床試験の「症例数の少なさ」ということばが、私たち自身が使用したものも含めて、さまざまな文脈で、それぞれ微妙にニュアンスの異なる使われ方をされています。

せっかくの機会なので、Xでの短い回答ではなく、整理し直してブログでお答えすることにしました。
少し難しい単語が出てきますが、過去のブログやXなどで解説していますから、適宜参照しながらお読みください。

統計上の意味は同等です

CBP501臨床第2相試験で採用したフレミングの2ステージデザインは統計的に確立された手法で、「9名中4例の3M-PFSで早期有効中止」と「23名中6例の3M-PFS」の統計上の意味は同等です。

こちらのブログ記事でやや詳しくご説明しているように、被験者保護を目的として(そのうえ上手くいけば費用も時間も節約できるメリットもあるので)アダプティブデザインを採用したものです。
この点については議論の余地がなく、誰との間にも意見の相違はありません。

「比較的」小さな試験であることは確かです

一方で、そもそも第2相試験は、最終証明のためのピボタル試験(第3相試験)に比べれば「小規模な試験」です。

試験結果から確定的に言えることは、試験規模が大きければ大きいほど増えます。
あらかじめ定めた条件に従って統計的に有意な差が示されない限り、9例でも23例でも、あるいは100例であっても、「比較的小規模な試験なので言えることは限られており、統計的有意差を検出できる規模に拡大した試験が望まれる」という表現になります。

ご質問いただいた論文で “We acknowledge study limitations due to the small sample size.“ (サンプルサイズの小ささゆえの限界を認識している)と書かれている背景には、その意味が大きく含まれています。

■3M−PFSはOSの代理指標です

さきほど参照したブログ記事でもご説明しているとおり、抗がん剤の最終承認のための指標は基本的にOS(全生存期間)です。

CBP501臨床第2相試験の主要評価項目とした3M-PFS(3ヶ月間無増悪生存)という指標は、あくまでも、その投与群がこの臨床第2相試験を通過できるか否かを決めるために設定した、OSの代理指標です。
OSに関する統計的な結論は、この少ない(9名でも23名でも似たようなものです)症例数では出せません。

規制当局との意見の相違

フェアリサーチ社の直近のアナリストレポートで、

フェアリサーチの想像に過ぎないが、一応、FDAと相談してデザインが決定された Phase2-stage1 にて3剤併用療法の統計的な有効性は示されたものの、各群9例と症例数が少ないデザインであったため、もう少し症例数を増やして検証してみたいという意図があるのではと推測される。

と記載されています。

これだけ読むと
「早期有効中止をせず23名まで試験を進めていたら症例数の少なさを指摘されなかったのかな?」
とお感じになるかもしれません。

しかしながら、前出のとおり統計的には「9名中4例の3M-PFSで早期有効中止」と「23名中6例の3M-PFS」は同等です。
もし米国規制当局の担当者が「23名なら少なくなかった」と指摘しているとすれば、科学的・統計的におかしな指摘をしていることになります。

その可能性が完全に無いとは言えませんが、直接協議を続けてきた私たちとしては、おそらくそうではなく、仮に23名の試験をやっていたとしても同じ指摘になっただろうと感じています。

現に、米国規制当局は今回、1群あたり20例や30例の規模ではなく、2群合計約150〜160名すなわち1群あたり75〜80名という、結果によっては統計的有意差が出るかもしれないほどの症例数の試験を実施するよう求めています。
「少し」増やしたいという意図だとは読み取りづらいです。

私たちや科学顧問らは、そのような規模・設計の試験は臨床第3相試験の役割であると考えており、規制当局との協議でも一貫してその旨を主張しました。
基本的に臨床第2相試験は、最終証明のための第3相試験を実施するに足る「感触」を掴むためのものです。
私たちは、代理指標として設定した3M−PFSによる主要評価項目の達成や、症例数が比較的少ないので統計的に確実とまでは言えないものの3剤併用投与群と2剤投与群に見られた大きな相違(後述)をもって、本来臨床第2相試験に求められる「第3相試験開始に足る十分な結果」は既に得られたと考えています。
その考えは現在も変わらず、欧州規制当局への臨床第3相試験開始申請を実施しています。

CBP501臨床第2相試験で得た「感触」

ご質問への回答は以上ですが、ちょうど「感触」の話題になりましたので、この機会に改めて、論文で初めて公表されたCBP501臨床第2相試験結果のグラフ3点についてご説明します。

個別症例のPFSとOSを示すスイマープロット図

個別の症例について、PFS(青色)とOS(橙色)を示したものです。

PFSが3ヶ⽉を超え治療の効果の兆候が⾒える症例において、第1群・第2群(いずれも3剤投与群)ではOSが伸びていることや、特に第1群にはデータカットオフ時点で10ヶ月超ご存命の患者様が3名おられたことが公表されました。

これだけでも、膵臓がん3次治療の臨床現場を知る人にはかなりの驚きをもって迎えられるデータです。実際に、その片鱗がESMOセッションでの取扱いなどにも現れていました。

腫瘍サイズの増⼤/縮⼩を⽰すウォーターフォール図

個別の症例について、腫瘍サイズの増⼤/縮⼩の⽐率 (治療開始時ベースラインとの⽐較)を示したものです。⾚は病勢進⾏(PD)、⻘は部分奏効(PR)を⽰しています。

CBP501を含む第1群・第2群(左2つ)とその他の投与群とで、様⼦が⼤きく異なることが見て取れます。

また、第4群の結果は、病勢安定(SD)の症例数の値だけ⾒ると第1群や第2群との差が⼩さく⾒えますが、 この図では奏効や進⾏の様⼦がずいぶん異なることがわかります。
さらに、第1群においてのみ部分奏効(PR)2例が観察されたことは既にお知らせしたとおりですが、それら症例(左のグラフの青い棒2本)における腫瘍縮小度合いの⼤きさも確認できます。

各群のOSの状況を⽰す⽣存曲線

投与群ごとに、縦軸には投与群に占める⽣存者の割合、横軸には期間(この図では⽉数)を⽰したものです。
線上の短い縦棒は、データカットオフ時にご存命の症例を⽰しています。

この図でも、治療の効果の兆候が⾒える症例において、第1群では⻑期間にわたって効果が持続していることがわかります。

ところで、古くから当社をウォッチしていただいている皆さんには「どことなく見覚えのある図」と思われたかもしれません。
実は、2015年にCBP501臨床試験を一から出直す際に、新しい臨床試験計画を始める「中期活動計画」として投資家の皆さんにお示しした「実現を目指す生存曲線」の図にかなり近いのです。
(図は2016年9月株主報告会説明資料より)

この目標公表から10年近くかけて、私たちはようやく、少ない症例数ながらヒト臨床試験でこれに近いデータをお示しできるところまで辿り着きました。

進みの遅さには私たち自身もつらく感じており、投資家の皆さんの苛立ちはなおさらであろうと、本当に申し訳ない気持ちです。
そのうえ米国規制当局との間では残念なことに次の試験に関する意見の相違もありました。
臨床試験の話なので、確実な成功をお約束することもできません。

とはいえ、新薬の実現に向けて「あとは証明するだけ」の最終アタック地点にいることは確かです。
膵臓がん3次治療の領域において、当面のゴールに向かって世界で最も近い場所にいる状況も変わっていません。

ぜひ、引き続き応援をいただきますようお願いいたしします。