National Center Biobank Network (NCBN) データセット

概要

NCBNデータセットは、ナショナルセンター・バイオバンクネットワーク(NCBN)が収集した、がんおよび希少疾患研究のコントロール群の全ゲノムシーケンス(WGS)解析を通じて得られたアレル頻度およびジェノタイプカウントです。 地域性を考慮してサンプルを収集しています。主成分分析により得られた本土および琉球クラスターのアレル頻度とジェノタイプカウントを含んでいます。 また、国際1000人ゲノムプロジェクト(1KGP)のサンプルとジョイントコールしているため、日本人集団に固有または存在しないバリアントも確認できます。 詳しくは発表論文をご覧ください。 )

  • バージョン/最終更新日:2024/6/28
  • サンプル数:9,290 (日本人集団)、2,504(国際1000人ゲノムプロジェクト)
  • バリアント数:215,729,032 (日本人集団と国際1000人ゲノムプロジェクトの合計)

発表論文

Kawai Y, Watanabe Y, Omae Y, Miyahara R, Khor S-S, Noiri E, et al. (2023) Exploring the genetic diversity of the Japanese population: Insights from a large-scale whole genome sequencing analysis. PLoS Genet 19(12): e1010625. https://doi.org/10.1371/journal.pgen.1010625.

利用条件

データ利用者の権利

NBDCヒトデータ共有ガイドラインの「5-2. データ利用者の権利」の「5-2-1. 非制限公開データ」に準拠します。

  1. データ利用者は、『NBDCヒトデータベース』のデータを利用した研究成果をデータ利用者の責務を遵守する限り自由に発表できる。
  2. データ利用者は、『NBDCヒトデータベース』のデータを利用した研究結果をもとにした知的財産権をデータ利用者の責務を遵守する限り自由に取得できる。

データ利用者の責務

NBDCヒトデータ共有ガイドラインの「5-3. データ利用者の責務」の「5-3-1. 非制限公開データ」を準用します。再配布に関しては、制限公開データを二次加工したデータであるため、制限公開データのルールを適用します。

  1. データ利用に際してのデータの品質・内容・科学的妥当性については、利用者の責任と判断のもとで活用すること。
  2. データ利用者は、下記の事項を遵守すること。
    • 研究利用への限定
    • 個人同定の禁止
    • 再配布の禁止
  3. 公衆利用(例:データを利用して論文等で発表する場合など)の際は以下の引用を付与してください。

    Kawai Y, Watanabe Y, Omae Y, Miyahara R, Khor S-S, Noiri E, et al. (2023) Exploring the genetic diversity of the Japanese population: Insights from a large-scale whole genome sequencing analysis. PLoS Genet 19(12): e1010625. https://doi.org/10.1371/journal.pgen.1010625.

データ提供者が作成したVCFファイルをダウンロード [非制限公開データ]

NBDCヒトデータベースからオリジナルVCFファイル NCBN-freeze2.sampleQC.GTfilter.freq.vcf.gz (69.24 GB)をダウンロードできます。

NBDCヒトDB研究題目対象集団サンプル数データ提供者
hum0331.v1.freq.v1Construction of control data for the promotion of genomic medicine for cancers and rare diseaseshealthy individuals (Japanese)9,290Katsushi Tokunaga
Total9,290

頻度を提供している集団一覧

Advanced searchの「Alternative allele frequency/count」を使用すると、集団単位の代替アレル頻度を条件にバリアントを検索できます。