TogoVar収録データセット一覧 (GRCh38)

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名解析手法Liftover GRCh37対象集団健常者罹患者サンプル数アレル数含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) PanelWGS日本人7,60994,961,1546データセット
JGA-NGSWES日本人1254,624,1247データセット
JGA-SNPSNP-Chip日本人183,8841,244,8383データセット
National Center Biobank Network (NCBN)WGS複数日本人:9,290 1KGP:2,504215,729,032なし

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアント頻度データ

データベース名解析手法Liftover GRCh37対象集団健常者罹患者サンプル数アレル数作成者バージョン/最終更新日
Genome Aggregation Database (gnomAD) exomesWES複数730,947183,558,769Broad Institutev4.0
Genome Aggregation Database (gnomAD) genomesWGS複数76,215759,336,320Broad Institutev4.0
ToMMo 54KJPN-SNV/INDEL Allele Frequency Panel(54KJPN)WGS日本人54,302262,200,990東北メディカル・メガバンク機構v20230626

注:54KJPNの内訳はSNVs(Autosome, chrX(PAR1+PAR2+XTR)およびchrMT)ならびにINDELs(AutosomeおよびchrX(PAR1+PAR2+XTR))です。

バリアント頻度以外のデータ

データベース名バージョン/最終更新日内容作成者
ClinVar2024/01/08バリアントの臨床的意義NCBI
ColilAPIで取得生命科学分野の文献間の引用関係の情報DBCLS
GRCh38.p132019/03/01ヒトゲノムリファレンス配列GRC
GWAS Catalog2024/05/28ゲノムワイド関連解析(GWAS)情報NHGRI-EBI
HGNC symbol report2024/05/28遺伝子シンボルや関連リソースの情報HGNC
LitVarAPIで取得バリアント名が出現する文献情報NCBI
PubMed2024/04/26文献情報NCBI
PubTator Central2024/01/04バリアント名が出現する文献情報NCBI

注:ClinVarはGRCh38上の位置が決定しているバリアントのみを含むVCFファイルからデータを取得しています。

データ加工に利用したツール

ツール名バージョン内容作成者
bcftoolsmultiallelicバリアントのbiallelicバリアントへの分割Genome Research Ltd.
BioReTNGSデータからバリアントを特定するツール群を一括実行アメリエフ
Variant Effect Predictor (VEP)Ensembl rel. 111バリアントに遺伝子名、Consequence、有害性予測(AlphaMissense, SIFT, PolyPhen)等をアノテーションEMBL-EBI