JGA-WGSデータセット
概要
NBDCヒトデータベース/Japanese Genotype-phenotype Archive(JGA)に登録されている個人レベルの全ゲノム配列データを再解析して検出したバリアントを集約した頻度データです。2次データ作成の許諾が得られたJGAデータが集約対象です。 なお、データセット単位のアレル頻度やジェノタイプ数を閲覧するには、NBDCヒトデータベースの制限公開データを閲覧するためのアカウントが必要です。 アカウントの取得には、データの利用 (NBDCヒトデータベース)を参照ください。
- バージョン/最終更新日:2024/12/3
- サンプルサイズ:78
- 検出バリアント(代替アレル)数:20,822,413
利用条件
データ利用者の権利
NBDCヒトデータ共有ガイドラインの「5-2. データ利用者の権利」の「5-2-1. 非制限公開データ」に準拠します。
- データ利用者は、『NBDCヒトデータベース』のデータを利用した研究成果をデータ利用者の責務を遵守する限り自由に発表できる。
- データ利用者は、『NBDCヒトデータベース』のデータを利用した研究結果をもとにした知的財産権をデータ利用者の責務を遵守する限り自由に取得できる。
データ利用者の責務
NBDCヒトデータ共有ガイドラインの「5-3. データ利用者の責務」の「5-3-1. 非制限公開データ」を準用します。再配布に関しては、制限公開データを二次加工したデータであるため、制限公開データのルールを適用します。
- データ利用に際してのデータの品質・内容・科学的妥当性については、利用者の責任と判断のもとで活用すること。
- データ利用者は、下記の事項を遵守すること。
- 研究利用への限定
- 個人同定の禁止
- 再配布の禁止
- 公衆利用(例:データを利用して論文等で発表する場合など)の際は以下の引用を付与してください。
Variant dataset aggregated from NGS data in NBDC Human Database / JGA [Internet]. Kashiwa: Database Center for Life Science, Joint Support-Center for Data Science Research, Research Organization of Information and Systems; [2024] - . JGA-WGS dataset; [cited YYYY Mmm DD]. Available from: https://grch38.togovar.org/doc/datasets/jga_wgs
データ解析手法
GATK best practice - Germline short variant discovery (SNPs + Indels)に則り加工しております。
- 説明: 生殖系列(germline)の全ゲノムシークエンスデータの加工
- ワークフローソースコード (jga-analysis): https://github.com/ddbj/jga-analysis
含まれる制限公開データセット一覧
データセットIDを指定してNBDCヒトデータベースにデータ利用申請できます。
データセットID | ヒトDB | 研究題目 | 対象集団 | サンプル数 | データ提供者 |
---|---|---|---|---|---|
JGAD000670 | hum00068 | ゲノム解析に基づく肺がんの発生・進展の分子機構の解明 | 非腫瘍組織由来検体(Germline) | 21 | 河野 隆志 |
JGAD000687 | hum0201 | ヒト腫瘍試料の収集・分譲とゲノム情報を利用した研究 既存試料の分譲とゲノム情報を利用した研究 消化器慢性炎症性疾患における遺伝子変異の検索 | 非腫瘍組織由来検体(Germline) | 14 | 佐藤 俊朗 |
JGAD000688 | hum0161 | シークエンス解析によるがんゲノム研究:肝芽腫 | 非腫瘍組織由来検体(Germline) | 33 | 中川 英刀 |
JGAD000689 | hum0159 | シークエンス解析によるがんゲノム研究:大腸がん | 非腫瘍組織由来検体(Germline) | 10 | 中川 英刀 |
合計 | 78 |