TogoVar収録データセット一覧 (GRCh38)
NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ
データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。
頻度データセット名 | 解析手法 | Liftover GRCh37 | 対象集団 | 健常者 | 罹患者 | サンプル数 | アレル数 | 含まれる制限公開データセット |
---|---|---|---|---|---|---|---|---|
GEM Japan Whole Genome Aggregation (GEM-J WGA) Panel | WGS | ✔ | 日本人 | ✔ | 7,609 | 95,555,740 | 6データセット | |
JGA-WES | WES | ✔ | 日本人 | ✔ | ✔ | 125 | 4,668,805 | 7データセット |
JGA-WGS | WGS | 日本人 | ✔ | ✔ | 78 | 20,822,413 | 4データセット | |
JGA-SNP | SNP-Chip | ✔ | 日本人 | ✔ | ✔ | 183,884 | 1,249,671 | 3データセット |
∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など
その他のバリアント頻度データ
データベース名 | 解析手法 | Liftover GRCh37 | 対象集団 | 健常者 | 罹患者 | サンプル数 | アレル数 | 作成者 | バージョン/最終更新日 |
---|---|---|---|---|---|---|---|---|---|
Genome Aggregation Database (gnomAD) exomes | WES | 複数 | ✔ | ✔ | 730,947 | 183,717,261 | Broad Institute | v4.1 | |
Genome Aggregation Database (gnomAD) genomes | WGS | 複数 | ✔ | ✔ | 76,215 | 759,336,320 | Broad Institute | v4.1 | |
NCBN | WGS | 複数 | ✔ | ✔ | 日本人:9,290 1KGP:2,504 | 215,729,032 | ナショナルセンター バイオバンクネットワーク | 2024/6/28 | |
ToMMo 54KJPN-SNV/INDEL Allele Frequency Panel(54KJPN) | WGS | 日本人 | ✔ | 54,302 | 252,777,334 | 東北メディカル・メガバンク機構 | v20230626 |
注:54KJPNの内訳はSNVs(Autosome, chrX(PAR1+PAR2+XTR)およびchrMT)ならびにINDELs(AutosomeおよびchrX(PAR1+PAR2+XTR))です。
バリアント頻度以外のデータ
データベース名 | バージョン/最終更新日 | 内容 | 作成者 |
---|---|---|---|
ClinVar | 2024/10/03 | バリアントの臨床的意義 | NCBI |
Colil | APIで取得 | 生命科学分野の文献間の引用関係の情報 | DBCLS |
GRCh38.p13 | 2019/03/01 | ヒトゲノムリファレンス配列 | GRC |
GWAS Catalog | 2024/10/15 | ゲノムワイド関連解析(GWAS)情報 | NHGRI-EBI |
HGNC symbol report | 2024/08/27 | 遺伝子シンボルや関連リソースの情報 | HGNC |
LitVar | APIで取得 | バリアント名が出現する文献情報 | NCBI |
MedGen | 2024/10/15 | 遺伝医学に関連する症状や表現型に関する情報を集約したポータルデータベース | NCBI |
MGeND | 2024/03/08 | 日本人集団から収集されたバリアントの臨床的意義 | NCGM |
PubMed | 2024/10/14 | 文献情報 | NCBI |
PubTator Central | 2024/01/04 | バリアント名が出現する文献情報 | NCBI |
注:ClinVarはGRCh38上の位置が決定しているバリアントのみを含むVCFファイルからデータを取得しています。
注:MGeNDの疾患名を独自の方法でMedGenにマッピングしていますので、MGeNDに記載されている疾患名と一致しない場合があります。
データ加工に利用したツール
ツール名 | バージョン | 内容 | 作成者 |
---|---|---|---|
bcftools | — | 多アリルサイトを2アリルバリアントに分割し、リファレンス不一致バリアントを除外して、正規化 | Genome Research Ltd. |
BioReT | — | JGAのWESデータから生殖細胞系のショートバリアント(SNPおよびインデル)を特定し、VCF形式でジョイントコールセットを生成 | アメリエフ |
GATK Best Practice - Germline short variant discovery (SNPs and Indels) | Ver. 4 | JGAのWGSデータから生殖細胞系のショートバリアント(SNPおよびインデル)を特定し、VCF形式でジョイントコールセットを生成 | Broad Institute |
transanno | Ver. 0.45 | バリアントのGRCh37座標をGRCh38へLiftOverするツール | OKAMURA, Yasunobu |
Variant Effect Predictor (VEP) | Ensembl rel. 112 | バリアントに遺伝子名、Consequence、有害性予測(AlphaMissense, SIFT, PolyPhen)等をアノテーション | EMBL-EBI |