ヒトのゲノムは約30億の塩基からなっています。本プロジェクトでは、一人ひとりの患者さんからいただいたゲノムについて、30億個の塩基の配列をすべて読み取る全ゲノム解析を行います。このように膨大な解析を行う意義をご説明します。
ヒトの遺伝子は約2万個あり、ゲノムの30億個の塩基配列の中に飛び飛びの「島」のように存在しています。ヒトの細胞の中では、遺伝子の情報をもとにタンパク質がつくられ、それらのタンパク質の働きで生命活動が営まれています。遺伝子に変異があると、つくられるタンパク質の性質が変わってしまい、それが原因で病気になることがあります。
1つの遺伝子の変異で起こる単一遺伝子性疾患については、これまでの研究で原因となる遺伝子とその変異が突き止められているものもあります。原因遺伝子変異がわかれば、病気が起こるメカニズムがわかり、治療法の開発にもつながりますが、原因遺伝子変異の探索は簡単ではなく、まだ突き止められていないものも多数あります。
一方、複数の遺伝子の変異に環境因子も加わることで起こる多因子性疾患は、患者さんごとに変異している遺伝子の組み合わせが異なり、それによって病気のなりやすさ・なりにくさも異なります。このため、患者さんに合った治療をするには、患者さんごとに複数の遺伝子の変異を調べる必要があります。
このような背景から全ゲノム解析が求められています。全ゲノム解析を行うと、約2万個の遺伝子のすべてについて、変異の有無を知ることができます。そして、その結果と患者さんの病気の状態の関係を調べることで、どの遺伝子の変異が病気に関係しているかがわかってくると期待されます。
具体的には、単一遺伝子性疾患の場合は、原因となる遺伝子とその変異を明らかにできる可能性があります。2万個の遺伝子の中には、まだ働きがよくわかっていないものもたくさんあり、その中に原因となる遺伝子があるかもしれないからです。多因子性疾患の場合は、一人ひとりの患者さんの遺伝子の変異の組み合わせが明らかになり、その組み合わせに合わせた治療ができる可能性があります。
ゲノムの中で遺伝子が占める割合は低く、2万個の遺伝子の島を全部合わせても数%にすぎません。しかし、遺伝子以外の部分も、遺伝子の働きを調節するなどの働きをしていることがわかってきています。このため、単一遺伝子性疾患であっても、遺伝子以外の部分の働きの違いによって、病気になりやすいかどうかが変わってくる場合があります。また、多因子性疾患でも、遺伝子以外の部分の違いが、一人ひとりの病状の違いを生み出す因子の1つとなっている可能性があります。
これまでの研究では、ゲノムのうちでも遺伝子だけを取り出して配列を調べることが多く、遺伝子以外の部分の違いはあまり調べられてきませんでした。全ゲノム解析では、遺伝子以外の部分の配列もすべて読み取りますから、その配列の違いと病気の関係も研究することができます。
遺伝子の変異の大部分は、遺伝子の中で1個の塩基が別のものになっているとか、塩基が数個欠けているとか余分に入っているという小さなものです。しかし、ゲノム全体でみると、もっと大きなスケールで変化が起こることがあり、それが病気の原因となる場合もあります。
例えば、一つあるいは複数の遺伝子がまるごと欠けている場合や、重複している場合があります。2つの染色体の一部がちぎれて、ちぎれた部分が入れ替わり、つなぎ目にある遺伝子の配列が大きく変わってしまうこともあります。染色体の一部(塩基数にして数百万個)が欠けたり、余分になっている場合もあります。
こうしたゲノムの変化はさまざまな手法で調べられてきましたが、うまく調べることができないスケールの変化もありました。現在の全ゲノム解析法では、1塩基の変化から数十万塩基の変化までを検出できるので、これまで見逃されていたスケールの変化を発見できる可能性があり、その変化が病気の原因となっているかを研究することができます。