臨床病理学的データとゲノムデータの統合による結腸直腸癌死亡率のベイジアンリスク予測モデル
npj Precision Oncology volume 7、記事番号: 57 (2023) この記事を引用
1373 アクセス
3 オルトメトリック
メトリクスの詳細
結腸直腸がんの日常的な腫瘍節転移(TNM)病期分類は、腫瘍の病理生物学的不均一性と腫瘍の広がりの不正確な評価により、生存予測において不完全です。 私たちは、統計学習手法であるベイジアン加法回帰ツリー (BART) を活用して、患者固有の腫瘍の特徴を包括的に分析し、予後予測を改善しました。 米国全土の2件の前向きコホート研究におけるステージII~IIIの患者815名を対象とした75の臨床病理学的、免疫、微生物、ゲノム変数のうち、BARTリスクモデルにより7つの安定した生存予測因子が特定された。 モデル予測生存率に基づくリスク層別 (低リスク、中リスク、および高リスク) は統計的に有意であり (ハザード比 0.19 ~ 0.45、高リスクとの比較; P < 0.0001)、The Cancer Genome Atlas (TCGA) を使用して外部検証することができました。 ) データ (P = 0.0004)。 BART は、モデルの柔軟性、解釈可能性、および他の機械学習モデルと同等または優れたパフォーマンスを実証しました。 BART と腫瘍特異的因子を使用した統合バイオインフォマティクス分析は、結腸直腸がん患者を予後グループに確実に階層化し、臨床腫瘍学の実践に容易に適用できます。
結腸直腸がんは、局所的な腸微環境における宿主、微生物、腫瘍細胞間の複雑な相互作用の中で発生します1。 腫瘍リンパ節転移 (TNM) 病期分類のみに基づく生存予測は、腫瘍の不均一性と腫瘍の広がりの不正確な評価により不完全です。 ステージ II/III の患者の場合、リスク評価は補助化学療法の使用、治療強度と期間に重大な影響を及ぼします 2,3。 したがって、個々の患者の転帰をより正確に予測するには、腫瘍の進行に寄与する因子の大規模な多変量解析が必要です。 蓄積されている証拠により、腫瘍マイクロサテライト不安定性 (MSI) 状態、BRAF 変異、Fusobacterium nucleatum の量、T 細胞浸潤などの要因が結腸直腸がんの関連予後バイオマーカーであることが示されています 4,5,6。 これらの発見を考慮して、我々は腫瘍および免疫特性を TNM 分類と統合することで結腸直腸癌の予後予測モデルを改善できる可能性があると仮説を立てました。
生存予測に利用可能な臨床病理学的変数を利用するために、アンサンブル和木分類モデルであるベイジアン加法回帰木 (BART) を実装しました。 アンサンブル法は、変数の重要度の尺度によってモデルの解釈可能性を維持しながら、予測因子と結果変数の間の非線形で相互作用的な関係の柔軟なモデリングを可能にし、腫瘍分子のサブタイプ分類、治療反応、および複数のがんタイプにわたる生存予測において有望な結果をもたらしています8、9、10。 BART は、基礎となる確率分布をツリー和モデルに導入することで、古典的なアンサンブル ツリー パラダイムを拡張し、固有の正則化を可能にします。 BART は、ランダム フォレスト (RF)、勾配ブースティング (GB)、最小絶対収縮および選択演算子 (LASSO)、多変量適応回帰スプライン、人工ニューラル ネットワークなどの他の機械学習手法と比較して、良好なパフォーマンスと優れた変数選択機能を実証しています。 (ANN)11、プロテオミクスプロファイリング、遺伝子制御ネットワーク解析、およびノンパラメトリック生存解析における先行研究で有望な結果をもたらしています12、13、14。
この研究では、我々は、2 つの大規模な前向きコホート研究、すなわち看護師健康調査 (NHS) における結腸直腸がん患者データベースを利用して、ステージ II/III 患者の死亡リスク層別化を改善するために、TNM ステージの構成要素と他の要因を組み込んだ BART モデルを構築しました。 )および医療専門家追跡調査(HPFS)。 RF、GB、その他の統計学習方法と比較した受信者動作特性 (ROC) 曲線によって示され、The Tumor Genome Atlas (TCGA) データセットを使用して外部検証された BART モデルの良好なパフォーマンスを確認しました。 我々は、5 重交差検証にわたる順列検定による有意性の安定性、および重要な変数に対する結果の部分的な依存性の観点から、BART モデルに寄与する変数を調べました。 私たちの研究は、ベイジアンアンサンブルモデルがさまざまな腫瘍および患者固有の要因を統合して生存予測を向上させ、個人のがん死亡リスクを評価する臨床ツールとして機能し、それによって最適な患者管理の精度を高めることができることを実証しました。