Genotype data summary JSNP Home JSNP Home
english
お知らせ

2011年7月29日 ALS(筋萎縮性側索硬化症)の新たなデータセットを公開します。
2009年7月23日 食道癌の新たなデータセットを公開します。
2008年6月12日 35疾患の新たなデータセットを公開します。


データセットについて

これらのデータセットは36疾患の日本人患者集団それぞれほぼ200人分あるいは92人分のDNAサンプルから得られた遺伝子型頻度情報です。それぞれのデータセットは常染色体上に存在するおよそ50万、20万あるいは5万SNPs の遺伝子型頻度情報を収録しています。 なお、個人別の遺伝子型情報は含んでいません。遺伝子型決定は理化学研究所ゲノム医科学研究センター(旧:遺伝子多型研究センター)および東京大学医科学研究所の共同研究により行われました。
36疾患の患者集団のサンプルはオーダーメイド医療実現化プロジェクト(the Biobank Japan)により収集されました。

Contents
プロジェクトの概要

遺伝暗号の違いをもとに病気の原因、副作用の原因などを明らかにして、新しい治療薬や診断薬を開発するためのプロジェクト。理化学研究所 ゲノム医科学研究センターは、オーダーメイド医療実現化プロジェクトの協力研究機関として、遺伝子解析の中心的な役割を果たしています。

日本人一般集団934人における515,286カ所のSNPの遺伝子型頻度をデータセットとして公開しています。理化学研究所ゲノム医科学研究センター( 旧:遺伝子多型研究センター)および東京大学医科学研究所より国内外の研究者に広く公開する目的で提供されました。試料収集、遺伝子型決定(genotyping)、バイオインフォマティクス、データの品質管理は、両機関の共同研究により行われました。 イルミナ社製ビーズアレイ技術により作成されたDNAチップ(HumanHap550K)により解析されデータは種々の閾値により選別され、最終的に常染色体上の515,286カ所のSNPの頻度情報を公開しています。


データ公開

2011年 7月29日 筋萎縮性側索硬化症
2009年 7月23日 食道癌
2008年 6月12日 35疾患


研究リスト

研究概要
日本人ALS患者92人における遺伝子型頻度をデータセットとして公開しています。そのデータは種々の閾値により選別された常染色体上の48,939カ所のSNP頻度情報です。SNPタイピングは、マルチプレックスPCR-インベーダー法を用いて解析しました。

サンプル
この研究に用いられた日本人ALS患者92人サンプルは、文部科学省リーディングプロジェクト「オーダーメイド医療実現化プロジェクト」によって収集されました。なお、文部科学省、厚生労働省、経済産業省によって示された「ヒトゲノム・遺伝子解析研究に関する倫理指針」に基づき、研究目的や研究方法など、事前に十分な説明をして了解を得る「インフォームド・コンセント」を取得しています。東京大学医科学研究所および理化学研究所横浜研究所の倫理委員会で審査、承認されています。

方法
標準的な実験方法で末梢血白血球よりDNAを抽出しました。SNPは大西ら(2001)が開発したマルチプレックスPCR-インベーダー法(サード・ウエーブ テクノロジー社)を用いて解析しました。

謝辞
本研究におけるSNPタイピング及びデータ解析は独立行政法人理化学研究所ゲノム医科学研究センターと東京大学医科学研究所との共同で行われたものです。また本研究は、文部科学省リーディングプロジェクト「オーダーメイド医療実現化プロジェクト」(正式名称:個人の医療情報に応じた医療の実現プロジェクト)の一部として行われたものです。

ダウンロードリンク

ファイルの説明

研究概要
日本人食道癌患者182人における遺伝子型頻度をデータセットとして公開しています。イルミナ社製ビーズアレイ技術により作成されたDNAチップ(HumanHap550v3 Genotyping BeadChip plus)により解析されデータは種々の閾値により選別され、最終的に常染色体上の503,734カ所のSNPの頻度情報を公開しています。

サンプル
この研究に用いられた日本人食道癌患者182人サンプルは、文部科学省リーディングプロジェクト「オーダーメイド医療実現化プロジェクト」によって収集されました。なお、文部科学省、厚生労働省、経済産業省によって示された「ヒトゲノム・遺伝子解析研究に関する倫理指針」に基づき、研究目的や研究方法など、事前に十分な説明をして了解を得る「インフォームド・コンセント」を取得しています。東京大学医科学研究所および理化学研究所横浜研究所の倫理委員会で審査、承認されています。

方法
末梢血より通常の方法で抽出したDNA 750ng(50ng/μlの濃度で15μl)をイルミナ社製HumanHap550v3 Genotyping BeadChip plusにプロトコールどおりに反応させました。

謝辞
本研究におけるSNPタイピング及びデータ解析は独立行政法人理化学研究所ゲノム医科学研究センターと東京大学医科学研究所との共同で行われたものです。また本研究は、文部科学省リーディングプロジェクト「オーダーメイド医療実現化プロジェクト」(正式名称:個人の医療情報に応じた医療の実現プロジェクト)の一部として行われたものです。

これらのデータセットは35疾患の日本人患者集団それぞれ 191-195人分のDNAサンプルから得られた遺伝子型頻度情報です。それぞれのデータセットは常染色体上に存在するおよそ20万SNPs の遺伝子型頻度情報を収録しています。なお、個人別の遺伝子型情報は含んでいません。遺伝子型決定は Perlegen Sciences社が実施し、理化学研究所ゲノム医科学研究センター(旧:遺伝子多型研究センター)および東京大学医科学研究所の共同研究により行われました。35疾患の患者集団のサンプルはオーダーメイド医療実現化プロジェクト(the Biobank Japan)により収集されました。


疾患サンプルおよびダウンロードリンク

疾患別にテキスト形式およびExcel形式のダウンロードファイルを提供しています。

  悪性腫瘍
  心血管系疾患
  脳血管障害
  呼吸器疾患
  慢性肝疾患
  眼疾患
  その他の疾患
ファイルの説明
 

Excel形式の場合 ・各シートは染色体別、複数マッピングできるSNP、マップできなかったSNP ・各シートはrsID順に配列。
テキスト形式の場合 ・染色体順、複数マッピングできるSNP,マップできなかったSNPの順に並べ、各染色体毎にrsID順に配列。

項目番号 項目名 内容
1 dbSNP_rsID dbSNPのrs番号(dbSNP build)
2 allele_A アレルAの塩基 perlegen_allel_1あるいはIllumina HumanHap550v3のallelle_Aに対応
3 allele_B アレルBの塩基 perlegen_allel_2あるいはIllumina HumanHap550v3のallele_Bに対応
4 genotype_AA_count 遺伝子型AAの個数
5 genotype_AB_count 遺伝子型ABの個数
6 genotype_BB_count 遺伝子型BBの個数
7 genotype_XX_count 遺伝子型が決定できなかった個数
8 genotype_AA_freq 遺伝子型AAの頻度
9 genotype_AB_freq 遺伝子型ABの頻度
10 genotype_BB_freq 遺伝子型BBの頻度
11 allele_A_freq アレルAの頻度
12 allele_B_freq アレルBの頻度
13 allele_of_MAF マイナーアレル頻度の塩基
14 HWE_p_value 正確確率検定によるHWEのP値
15 genotype_suspicious タイピングエラーの可能性があることを示すフラグ"*"
16 number_of_mapped dbSNPの情報でマッピングされた箇所の数
17 chromosome 染色体番号
18 position_in_chromosome dbSNPの情報でマッピングされた染色体上の位置
19 duplicate_SNP dbSNPのbuild更新でrs番号のマージとなり一致したSNPのrsID
20 perlegen_rsID or Illumina HumanHap550v3_rsID perlegenのrs番号(dbSNP build125の情報では項目1と一致)あるいはIllumina HumanHap550v3のrs番号
21 perlegen_allele_1 or HumanHap550v3_alleleA perlegenの測定アレル1またはHumanHap550v3のアレルA
22 perlegen_allele_2 or HumanHap550v3_alleleB perlegn の測定アレル2またはHumanHap550v3のアレルB
23 perlegen_chromosome or HumanHap550v3_chromosome perlegenの染色体番号またはHumanHap550v3ではデータなし
24 perlegen_accession_id or HumanHap550v3_accession_id perlegenのcontig accession IDで NCBI Build 35のcontig accession IDまたはHumanHap550v3ではデータなし
25 perlegen_contig_position or HumanHap550v3_contig _position perlegenのcontig上のSNP位置でNCBI build35のcontig上の位置またはHumanHap550v3ではデータなし
26 perlegen_strand or HumanHap550v3_strand PerlegenまたはHumanhap550v3のSNPのゲノム配列に対する向き + または - でNCBI Build35または36のcontig
27 perlegen_Assayed_sequence or HumanHap550v3_ AlleleA_ProbeSeq perlegenによってアッセイされた29塩基配列, 中央の塩基がSNPまたはHumanHap550v3のアレルAのプローブ配列


ファイルの説明(マルチプレックスPCR-インベーダー法を用いたALSデータセット)


項目番号 項目名 内容
0 Probe_ID TWT_ID Invader法による実験でのID番号
1 dbSNP_rsID dbSNPのrs番号(dbSNP build)対応するrs番号がない場合は"ambiguous"
2 allele_A アレルAの塩基 インベーダー法_allelle_Aに対応
3 allele_B アレルBの塩基 インベーダー法_allele_Bに対応
4 genotype_AA_count 遺伝子型AAの個数
5 genotype_AB_count 遺伝子型ABの個数
6 genotype_BB_count 遺伝子型BBの個数
7 genotype_XX_count 遺伝子型が決定できなかった個数
8 genotype_AA_freq 遺伝子型AAの頻度
9 genotype_AB_freq 遺伝子型ABの頻度
10 genotype_BB_freq 遺伝子型BBの頻度
11 allele_A_freq アレルAの頻度
12 allele_B_freq アレルBの頻度
13 allele_of_MAF マイナーアレル頻度の塩基
14 HWE_p_value 正確確率検定によるHWEのP値
15 flanking_sequnce SNP周辺の塩基配列

All Right Reserved, Copyright (C) 2008-2012 The Center for Genomic Medicine of RIKEN, The University of Tokyo and Japan Science and Technology Agency(JST)