東北大学病院 精神科

2020.08.12

高橋雄太先生の機械学習を用いたゲノム情報に基づくうつ病症状のリスク予測の研究に関する研究論文がTranslational Psychiatry誌に掲載され、プレスリリースされました。

精神疾患の発症には遺伝子をコードしている DNA 上に存在して個体差を規定するDNA 多型が関わることが以前より知られていましたが、精神疾患の発症をDNA 多型情報から予測モデルを用いてリスク予測する研究には大きな課題がありました。それは多くの精神疾患の発症には多数の DNA 多型が関わっている一方、一つ一つの DNA 多型の効果サイズが小さいため、真に疾患との関連を示す DNA 多型を検出することが難しく、結果的に予測モデルの過学習が生じる
こととなり、予測精度の向上は限られてしまうからです。STMGP 法は DNA 多型の選択をして、さらに GWAS*4の統計量に基づいて DNA 多型に重みづけを行うことで予測モデルの過学習を抑え、高精度な予測ができるように開発された機械学習手法です(図)。今回の研究において、この STMGP 法が実際に精神疾患発症のリスク予測をするのに有効であるかを検討しました。
具体的には、東北メディカル・メガバンク計画によって収集された宮城県在住の 3,685 人分の DNA 多型情報を用いて予測モデルの機械学習を行い、岩手県在住の 3,048 人のデータを用いて予測モデルの精度を評価しました。まず、うつ病に関する症状のデータと、さまざまなシミュレーション解析*5により作成されたデータを用いて予測精度の検討を行いました。次に、STMGP 法と現時点で頻用されている最先端の予測モデル(Polygenic Risk Score 法、genomic best
linear unbiased prediction, summary-data-based best linear unbiasedprediction, Bayes R 法、Ridge 回帰法)について、それぞれの予測精度と過学習の程度を比較しました。これらの比較検討の結果、うつ病に関する症状のリスク予測においては、他モデルの予測精度と比較して有意差はないものの、STMGP 法は最も高い予測精度を示しました。シミュレーション解析の検討においては、STMGP 法が複雑な遺伝素因をもつ精神疾患の DNA 多型情報からのリスク予測に有用である可能性を示しました。
今後研究が進み、STMGP 法といった過学習を抑えた機械学習の手法を用いることで精密なうつ病のリスク予測が可能となれば、うつ病やその他の精神疾患への罹患のし易さやし難さに関わる病態の一部を DNA 多型に基づいて説明でき、より個々人に適した予防法や医療を提供することが期待されます。

https://www.megabank.tohoku.ac.jp/news/40118
https://www.nature.com/articles/s41398-020-0831-9

ページのトップへ戻る