研究内容

　本分野では、ポストGWAS（genome-wide association study）研究として、エピゲノム、トランスクリプトームなどの様々なビッグデータ解析に、分子生物学的手法を用いた解析を組み合わせることによって、多因子疾患の病態に多面的なアプローチを試みます。また、これらの解析結果を用いて、個人のゲノム情報に基づいた病態・薬剤応答性などの予測法を開発し、いわゆるプレシジョン医療の確立を目指します。

１）遺伝子多型が発現やスプライシングに与える影響の網羅的解析
　多因子疾患の感受性遺伝子領域の多くは、遺伝子多型が発現に影響を与える領域、すなわちeQTL (expression quantitative trait locus)であると考えられています。したがって、GWASの結果を解釈するためには、GWASとeQTLデータの統合解析が必須です。すでに、Geuvadis project、GTEx projectなどのeQTL解析データが公開されており、我々も日本人の免疫細胞サブセットにおけるQTLカタログの樹立を行ってきました（Nat Genet 2017）。本研究領域の課題としては、eQTL効果の一部は、細胞特異的であったり、刺激特異的であったりするため、より詳細な解析が必要であることや、遺伝子多型から離れた領域（＞100kb）に働くものもあるため、Hi-C法などによって得られる高次エピゲノム情報を追加して解析する必要があること、などがあげられます。さらに、eQTLに加えて、遺伝子多型がスプライシングに影響を与える領域、すなわちsQTL (splicing QTL)であると考えられます。研究室では、従来のショートリードシークエンサーによるeQTLデータに加えて、ロングリードシークエンサー（後述）を用いたスプライス・アイソフォーム解析を行うことによって、疾患に関わるsQTLの全貌を明らかにします。

２）多因子疾患のGWAS候補領域における遺伝子機能解析
　GWASは、疾患毎に100を超える感受性遺伝子領域を明らかにしてきました。一つ一つの遺伝因子の果たす役割は小さいですが、病態の一側面を形成しているのも事実です。したがって、個々の感受性遺伝子の機能を明らかにすることが病態解明の第一歩となります。たとえば、我々は筋無症候性皮膚筋炎（CADM）のGWASにおいて、WDFY4遺伝子のsQTL効果を持つ多型が疾患と関連することを明らかにしましたが、リスクアレルによって増加するC末端欠如型のWDFY4タンパクが、RNAウィルス認識受容体であるMDA5のシグナルを増強することを明らかにしました（Ann Rheum Dis 2018）。CADMは、致死率が50%にいたる急速進行性の間質性肺炎をもたらすため、このC末端欠如型WDFY4タンパクを標的とした治療法が有望であると考えられます。このようにGWAS候補領域の詳細な機能解析によって疾患の治療に直結する知見を得られる可能性があります。

３）システムズ・アプローチによる遺伝子多型解析と疾患の病態理解
　個々の遺伝因子を解析することによって、多因子疾患の病態の一側面が明らかになりますが、病態全体を形成するのはこれらの遺伝因子の積み重なりです。したがって、疾患をシステムとみなしたうえで、この遺伝因子の積み重なりをシステムズ・アプローチによって解析することが、病態の全体像や個人間の病態の違いを評価するために必要です。実際に我々は、CD4陽性T細胞におけるeQTLの積み重なり(polygenic score)がTNF-αの活性化に寄与していることを、関節リウマチ患者のゲノムを評価することによって明らかにしました（Nat Genet 2017）。当分野では、GWAS、eQTL、sQTL、エピゲノムなどの様々なオミックスデータを統合することによって、ゲノム情報を用いた疾患の病態予測法の樹立を目指します。また、臨床教室やコホートプロジェクトの協力のもとに予測モデルの検証を行い、プレシジョン医療の実現化を目指します。

4) ロングリード・シークエンサー用いた疾患オミックス解析
　現在、第4世代シークエンス技術であるロングリード・シークエンサーが、疾患オミックス解析に革新をもたらしつつあります。たとえば、Nanopore社のシークエンサーは、DNAやRNAがポアを通過するときに発生する電流変化から、1万塩基以上を連続して読むことが可能であり、リピート配列や構造多型の解析に適しています。また、RNA解析では、様々なスプライス・アイソフォームの同定に加えて、リピート配列由来転写産物の同定も可能です。本分野では、ロングリード・シークエンサーを用いることによって、希少遺伝性疾患、神経疾患、癌などの病態・病因解明を目指しています（准教授・三橋）。さらに、現在知られているタンパク質に翻訳される領域は、ヒトゲノムの数%しか占めていません。その他の部分の多くは、レトロウィルス由来の配列であるレトロトランスポゾンなどの反復配列が占めています。これらの反復配列の中には、未知の翻訳される配列が存在している可能性があります。ロングリード・シークエンサーや分子生物学的な手法を用いて、反復配列由来の新規な転写産物の機能についても解析しています（助教・上田）。

1. Ishigaki K, Kochi Y et al. Polygenic burdens on cell-specific pathways underlie the risk of rheumatoid arthritis. Nat Genet 49:1120-1125,2017
2. Kochi Y, Kamatani Y et al. Splicing variant of WDFY4 augments MDA5 signalling and the risk of clinically amyopathic dermatomyositis. Ann Rheum Dis 77:602-611,2018
3. Sone J, Mitsuhashi S et al Long-read sequencing identifies GGC repeat expansions in NOTCH2NLC associated with neuronal intranuclear inclusion disease. Nat Genet 51:1215-1221, 20191)
4. Honda S, Kochi Y et al. Association of Polygenic Risk Scores With Radiographic Progression in Patients With Rheumatoid Arthritis. Arthritis Rheumatol. 2022, AOP.