JGA-WGSデータセット

概要

NBDCヒトデータベース/Japanese Genotype-phenotype Archive(JGA)に登録されている個人レベルの全ゲノム配列データを再解析して検出したバリアントを集約した頻度データです。2次データ作成の許諾が得られたJGAデータが集約対象です。 なお、データセット単位のアレル頻度やジェノタイプ数を閲覧するには、NBDCヒトデータベースの制限公開データを閲覧するためのアカウントが必要です。 アカウントの取得には、データの利用 (NBDCヒトデータベース)を参照ください。

  • バージョン/最終更新日:2024/12/3
  • サンプルサイズ:78
  • 検出バリアント(代替アレル)数:20,822,413

利用条件

データ利用者の権利

NBDCヒトデータ共有ガイドラインの「5-2. データ利用者の権利」の「5-2-1. 非制限公開データ」に準拠します。

  1. データ利用者は、『NBDCヒトデータベース』のデータを利用した研究成果をデータ利用者の責務を遵守する限り自由に発表できる。
  2. データ利用者は、『NBDCヒトデータベース』のデータを利用した研究結果をもとにした知的財産権をデータ利用者の責務を遵守する限り自由に取得できる。

データ利用者の責務

NBDCヒトデータ共有ガイドラインの「5-3. データ利用者の責務」の「5-3-1. 非制限公開データ」を準用します。再配布に関しては、制限公開データを二次加工したデータであるため、制限公開データのルールを適用します。

  1. データ利用に際してのデータの品質・内容・科学的妥当性については、利用者の責任と判断のもとで活用すること。
  2. データ利用者は、下記の事項を遵守すること。
    • 研究利用への限定
    • 個人同定の禁止
    • 再配布の禁止
  3. 公衆利用(例:データを利用して論文等で発表する場合など)の際は以下の引用を付与してください。

    Variant dataset aggregated from NGS data in NBDC Human Database / JGA [Internet]. Kashiwa: Database Center for Life Science, Joint Support-Center for Data Science Research, Research Organization of Information and Systems; [2024] - . JGA-WGS dataset; [cited YYYY Mmm DD]. Available from: https://grch38.togovar.org/doc/datasets/jga_wgs

データ解析手法

GATK best practice - Germline short variant discovery (SNPs + Indels)に則り加工しております。

  1. 説明: 生殖系列(germline)の全ゲノムシークエンスデータの加工
  2. ワークフローソースコード (jga-analysis): https://github.com/ddbj/jga-analysis

含まれる制限公開データセット一覧

データセットIDを指定してNBDCヒトデータベースにデータ利用申請できます。

データセットIDヒトDB研究題目対象集団サンプル数データ提供者
JGAD000670hum00068ゲノム解析に基づく肺がんの発生・進展の分子機構の解明非腫瘍組織由来検体(Germline)21河野 隆志
JGAD000687hum0201ヒト腫瘍試料の収集・分譲とゲノム情報を利用した研究
既存試料の分譲とゲノム情報を利用した研究
消化器慢性炎症性疾患における遺伝子変異の検索
非腫瘍組織由来検体(Germline)14佐藤 俊朗
JGAD000688hum0161シークエンス解析によるがんゲノム研究:肝芽腫非腫瘍組織由来検体(Germline)33中川 英刀
JGAD000689hum0159シークエンス解析によるがんゲノム研究:大腸がん非腫瘍組織由来検体(Germline)10中川 英刀
合計78