TogoVar収録データセット一覧 (GRCh38)

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名解析手法Liftover GRCh37対象集団健常者罹患者サンプル数アレル数含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) PanelWGS日本人7,60995,555,7406データセット
JGA-WESWES日本人1254,668,8057データセット
JGA-WGSWGS日本人7820,822,4134データセット
JGA-SNPSNP-Chip日本人183,8841,249,6713データセット

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアント頻度データ

データベース名解析手法Liftover GRCh37対象集団健常者罹患者サンプル数アレル数作成者バージョン/最終更新日
Genome Aggregation Database (gnomAD) exomesWES複数730,947183,717,261Broad Institutev4.1
Genome Aggregation Database (gnomAD) genomesWGS複数76,215759,336,320Broad Institutev4.1
NCBNWGS複数日本人:9,290 1KGP:2,504215,729,032ナショナルセンター バイオバンクネットワーク2024/6/28
ToMMo 54KJPN-SNV/INDEL Allele Frequency Panel(54KJPN)WGS日本人54,302252,777,334東北メディカル・メガバンク機構v20230626

注:54KJPNの内訳はSNVs(Autosome, chrX(PAR1+PAR2+XTR)およびchrMT)ならびにINDELs(AutosomeおよびchrX(PAR1+PAR2+XTR))です。

バリアント頻度以外のデータ

データベース名バージョン/最終更新日内容作成者
ClinVar2024/10/03バリアントの臨床的意義NCBI
ColilAPIで取得生命科学分野の文献間の引用関係の情報DBCLS
GRCh38.p132019/03/01ヒトゲノムリファレンス配列GRC
GWAS Catalog2024/10/15ゲノムワイド関連解析(GWAS)情報NHGRI-EBI
HGNC symbol report2024/08/27遺伝子シンボルや関連リソースの情報HGNC
LitVarAPIで取得バリアント名が出現する文献情報NCBI
MedGen2024/10/15遺伝医学に関連する症状や表現型に関する情報を集約したポータルデータベースNCBI
MGeND2024/03/08日本人集団から収集されたバリアントの臨床的意義NCGM
PubMed2024/10/14文献情報NCBI
PubTator Central2024/01/04バリアント名が出現する文献情報NCBI

注:ClinVarはGRCh38上の位置が決定しているバリアントのみを含むVCFファイルからデータを取得しています。
注:MGeNDの疾患名を独自の方法でMedGenにマッピングしていますので、MGeNDに記載されている疾患名と一致しない場合があります。

データ加工に利用したツール

ツール名バージョン内容作成者
bcftools多アリルサイトを2アリルバリアントに分割し、リファレンス不一致バリアントを除外して、正規化Genome Research Ltd.
BioReTJGAのWESデータから生殖細胞系のショートバリアント(SNPおよびインデル)を特定し、VCF形式でジョイントコールセットを生成アメリエフ
GATK Best Practice - Germline short variant discovery (SNPs and Indels)Ver. 4JGAのWGSデータから生殖細胞系のショートバリアント(SNPおよびインデル)を特定し、VCF形式でジョイントコールセットを生成Broad Institute
transannoVer. 0.45バリアントのGRCh37座標をGRCh38へLiftOverするツールOKAMURA, Yasunobu
Variant Effect Predictor (VEP)Ensembl rel. 112バリアントに遺伝子名、Consequence、有害性予測(AlphaMissense, SIFT, PolyPhen)等をアノテーションEMBL-EBI