Cytiva

検索のヘルプ

Location:Home実験手法別製品・技術情報2D DIGE(蛍光標識二次元発現差異解析)

2D DIGEデータの多変量解析による卵巣腫瘍の分類とバイオマーカーの選択

Christian Andersson Stahlberg, Stephanie Bourin & Josef Buelles
Cytiva, Discovery Systems, Amersham™ Biosciences AB, Uppsala, Sweden.

はじめに

Ettan™ DIGEは、蛍光標識二次元ディファレンスゲル電気泳動(2D DIGE)を用いて複雑なサンプル中のタンパク質発現の正確な相対定量が可能なシステムとして、高い評価を得ています。DeCyder™ 2Dソフトウェアの新しいモジュールであるDeCyder™ EDA(Extended Data Analysis)を組込むことで、多変量解析を用いたさらに詳しいデータ解析が可能になります。今回ご紹介するのは、組織病理学的に正常、良性、悪性に分類された生検サンプルを用いた卵巣がんの研究事例です。異なるクラス間の識別に使用するバイオマーカーを同定し、バイオマーカーを用いた分類法を構築しました。その後、未知サンプルの分類を行いました。

※DeCyder™ 2Dソフトウェアは販売終了となりましたが、参考情報として掲載しております。

手法

ヒトの卵巣がんについて2D DIGE解析を行った研究の画像は、Prof. Peter James(University of Lund, Sweden)より提供いただきました。58人分のサンプル(組織病理学的に、良性が13、悪性が18、境界上が19、正常が8と分類された生検サンプル)のサブセットを用いて、以下のすべての解析を行いました。サンプルはすべてEttan™ DIGE製品添付マニュアル通りの方法で2D DIGEを行いました(図1)。それとは別に、医学的に特徴が明らかになっている10サンプル(境界上は含まず)も同様にDIGE DeCyder™ワークフローに従って処理しました。これらは、構築した分類法の精度や妥当性を評価するためのサンプルで、統計解析には含まれていません。

2D DIGEは、タンパク質サンプルを3種類の異なる蛍光色素にて標識し、同一ゲル上で一括して二次元電気泳動を行う技術です。この方法を用いると複数のタンパク質サンプルを1枚のゲル上で解析することが可能になるため、発現量の差異をより高精度に検出することができます。Extended Data Analysisモジュールを組込むと起動後の画面にExtended Data Analysisのアイコンが表示されるようになります。

図1. 2D DIGE解析の流れとDeCyder™ Extended Data Analysis(EDA)を組込んだ状態のDeCyder™ 2Dソフトウェア

結果

EDA(Extended Data Analysis)

DeCyder™ 2Dでの解析結果を新しいExtended Data Analysis(EDA)にインポートしました。EDAには追加の統計検定が含まれており、データの生物学的解釈が容易になります。2296のタンパク質スポットから、サンプルの70 %以上に存在し、かつOne-Way ANOVAのP値が0.01未満の117スポットを選択しました。その性質および主成分分析グラフでの散らばり具合から(図2)、境界上のサンプルは今後の分析から除外しました。

試料のタイプのPCAプロット(左)と117のタンパク質スポット(右)

赤 悪性
灰 境界上
青 良性
緑 正常

図2. 4つのサンプルタイプ(左)と117のタンパク質スポット(右)の主成分分析プロット。境界上とされたサンプルは良性とされたグループと悪性とされたグループの中間に分布していました。右側のグラフから、多くのタンパク質スポットが似たような情報を含むことが分かります。

評価前のデータ

データセットには117のタンパク質スポットが含まれており、39のサンプル(良性、悪性、正常を含む)を階層的クラスター解析など複数の手法で解析しました(図3)。クラスター解析の結果、良性と悪性のグループの中にもサブタイプが存在する可能性が示されました。

クラスタ解析の結果、良性と悪性のグループの中にもサブタイプが存在する可能性が示されました

赤 悪性
青 良性
緑 正常

図3. サンプルの70 %以上に存在し、かつOne-Way ANOVAのP値が0.01未満の117スポットを用いた階層的クラスター解析の結果

評価後のデータ

それぞれの種類(良性、悪性、正常)をもっとも明確に識別できるタンパク質スポットを探すために、前向き選択法5分割交差検証で分析を行い、正規化判別分析で評価して特徴を選択しました。その結果、6種のタンパク質がもっとも高い識別値をもつことがわかりました。これらを用いて主成分分析を行った結果が図4です。正規化判別分析による判定法を構築し、それによって39のサンプルを分類した結果が図5です。今後、これらの6種のタンパク質について、質量分析を行う予定です。

左上が正常、右下が悪性、良性はその中間に分布しました

赤 悪性
青 良性
緑 正常

図4. 特徴選択プロセスで選択した6種のタンパク質だけを用いて行った主成分分析プロット

判定法では良性14、悪性18、正常7となり、実際にはそれぞれ、13、18、8でした

図5.6種のタンパク質から構築した正規化判別分析による判定法を用いた判定結果。判定法の精度は96.6 %でした。

未知サンプルの分類

未知サンプルを正規化判別分析による判定法で分類しました。その結果、すべてのサンプルを分類することができ、分類した結果は組織病理学的な分類と一致していました。要約すると、10種の未知サンプルを6種のタンパク質の発現パターンで分析し、迅速に腫瘍の種類を分類することが可能でした。

結論

  • 2D DIGEデータを用いて複雑な多変量統計解析することで、2D DIGE法の診断能力が高まりました。
  • わずか6種のタンパク質のデータを用いて96 %以上の精度で卵巣サンプルを分類可能な判定法を構築することができました。また、未知サンプルを用いてその有効性を確認することもできました(組織病理学的分類と100 %合致)。
  • DeCyder™ EDA は「個々のタンパク質の発現変動だけではなく、タンパク質間の相関や全体的な発現傾向の共通性や差異を見つけたい」というお客さまのご要望にお応えします。

お問合せフォーム

※日本ポールの他事業部取扱い製品(例: 食品・飲料、半導体、化学/石油/ガス )はこちらより各事業部へお問い合わせください。