TogoVar収録データセット一覧 (GRCh38)

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名解析手法Liftover GRCh37対象集団健常者罹患者サンプル数アレル数含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) PanelWGS日本人7,60994,961,1546データセット
JGA-NGSWES日本人1254,624,1247データセット
JGA-SNPSNP-Chip日本人183,8841,244,8383データセット

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアントデータ

データベース名解析手法Liftover GRCh37対象集団健常者罹患者サンプル数アレル数作成者バージョン/
最終更新日
ClinVar複数1,117,487NCBI2022/09/01
Genome Aggregation Database (gnomAD) genomesWGS複数76,156759,302,267Broad Institutev3.1.2
Human Genetic Variation Database (HGVD)WES日本人1,208549,623京都大学Version 2.30
(2017/08/02)
ToMMo 14KJPN Allele Frequency Panel(14KJPN)WGS日本人約14,000133,757,499東北メディカル・メガバンク機構v20211208r2

注1:ClinVarはVCFファイルに含まれるGRCh38上の位置が決定しているバリアントのみを掲載しています。
注2:14KJPNの内訳は、SNV (Autosome、chrX(PAR1+PAR2+XTR)、chrMT)とINDEL (Autosome、chrX(PAR1+PAR2+XTR))です。

バリアント以外のデータ

データベース名バージョン/最終更新日内容作成者
ColilAPIで取得生命科学分野の文献間の引用関係の情報DBCLS
GRCh38.p132019/03/01ヒトゲノムリファレンス配列GRC
HGNC symbol report2022/09/16遺伝子シンボルや関連リソースの情報HGNC
LitVarAPIで取得バリアント名が出現する文献情報NCBI
PubTator Central2022/09/20バリアント名が出現する文献情報NCBI
TogoGenomeゲノムに関する包括的な情報DBCLS

データ加工に利用したツール

ツール名バージョン内容作成者
bcftoolsIndelの正規化とmultiallelicバリアントのbiallelicバリアントへの分割Genome Research Ltd.
BioReTNGSデータからバリアントを特定するツール群を一括実行アメリエフ
Variant Effect Predictor (VEP)Ensembl rel. 107バリアントにアノテーション(遺伝子名、Consequence等)を付加EMBL-EBI