これらのデータを元に遺伝子ごとのコピー数突然変異の確率を明らかにすることが試みられた。この確率は、各遺伝子において集団で観察されるコピー数変化の種類数と、理論的に比例することが知られていることから、全遺伝子におけるコピー数突然変異の総確率を、各遺伝子におけるコピー数変化の数で除算することで、各遺伝子におけるコピー数突然変異の確率が算出された。
また、この確率と以前の研究で計算された一塩基置換などの突然変異確率とを合計することで予想される突然変異の数と、神経発達障害の家系で見られた突然変異数の比較が行われたところ、突然変異が統計的に有意に多く見られる380遺伝子が同定されたとする(誤検出率5%)。
この380個のうちの52個は過去に神経発達障害との関連が報告されておらず、新規の原因遺伝子候補と考えられるとするほか、そのうち、3個(GLTSCR1、MARK2、UBR3)はコピー数変化がその統計的に有意性に貢献しており、コピー数変化を解析に含めることの重要性が示唆されたとする。
そして、これらの新規遺伝子候補について、神経発達障害においてすでに知られた原因遺伝子との機能的な類似性をもとに、さらに絞り込むことを目的に深層学習モデルを、今回同定された新規遺伝子候補に適用したところ、陰性対照(神経発達障害の原因でない遺伝子群)よりも有意に高いスコアが示され、新規遺伝子候補が既知の原因遺伝子と機能的に類似していることが確認されたという。
また、今回の新規候補遺伝子が真の原因遺伝子である確率が、このスコアを指標にして事前確率(63%=(52-380×0.05)/52)からベイズ推定を用いた計算によって求められた結果、真の原因遺伝子である事後確率が90%以上を示す、11個の有力な原因遺伝子候補を抽出することに成功したとする。その11個は、HDAC2、SUPT16H、HECTD4、CHD5、XPO1、GSK3B、NLGN2、ADGRB1、CTR9、BRD3、MARK2としている。
なお、今回の研究は、神経発達障害の原因解明には一塩基置換や小さな挿入欠失に加え、コピー数変化を解析対象にする重要性を明らかにしたもので、この手法を用いて明らかにした原因候補遺伝子群は、神経発達障害の遺伝子診断や病態メカニズムの解明、医学的管理法や治療法の開発に寄与することが期待されるとしている。