使い方(3ステップ)
- 例題を選ぶか、ターゲットサイズ(ゲノムサイズ/ターゲット領域合計)を入れます。
- リード数(PE/SE)または総データ量(Gb)を入力します。
- 平均深さが表示されます。必要なら、係数や逆算(必要データ量)も確認できます。
この計算は概算です。実際のカバレッジは均一ではなく、重複・GCバイアス・設計・解析条件で分布が変わります。最終判断は実データのQC(カバレッジ分布)で確認してください。
入力
—
ターゲットサイズ
WGSはゲノムサイズ、Exome/Panelはターゲット領域合計(bp)など。
例: 3.2 Gb(ヒトWGSの目安) / 50 Mb(ヒトエクソームの目安)
入力方式
係数(0〜1)
分からなければ、既定値のままでも使えます(概算)。
—
オプション
≥k× は、均一なランダムカバレッジを仮定したポアソン近似の目安です。実データでは変わります(深度が大きい場合は計算上、正規分布近似に切り替えることがあります)。
結果(平均深さ)
平均深さ(×)
—
ターゲットサイズ
—
入力方式
—
effective factor
—
逆算(必要データ量)
—
≥k×(目安)
—
途中計算(raw → usable → mapped → on-target → unique)
| step | bases(自動単位) |
|---|
≥k× を満たす割合(目安)
| threshold | P(depth ≥ k) |
|---|
平均深さ λ を平均とする Poisson を仮定した目安です(均一ではないため、断定ではありません)。
計算の流れ(How it’s calculated)
- raw_bases(総塩基数)を、リード数(PE/SE)または総データ量(Gb)から求めます。
- usable率・mapping率・on-target率・重複率(1-duplicate)を掛けて、有効な on-target 塩基数(unique)を概算します。
- 平均深さ = unique_on_target_bases / target_size で計算します。
- ≥k× はポアソン近似の目安として表示できます。
平均深さは便利な指標ですが、均一性(ばらつき)は別問題です。最終判断はカバレッジ分布などのQCで確認してください。
よくある質問(FAQ)
30×のWGSに必要なリード数は?
ターゲットサイズ、リード長、係数(mapping率など)で変わります。逆算機能で条件に合わせて見積もれます。
on-target率とは何ですか?
解析に使えるリードのうち、ターゲット領域に乗っている割合の目安です(キットや条件で変わります)。
平均深さが同じなら、どの領域も同じ深さですか?
いいえ。平均はあくまで平均で、実際はばらつきます。ここでは目安として使ってください。
≥k×の割合は正確ですか?
均一なランダムカバレッジを仮定した目安(ポアソン近似)です。実データでは変わります。
関連ツール
- DNA/RNA 濃度↔モル↔コピー数 変換
ライブラリ準備や入力の換算に。
- qPCR 標準曲線 計算機
定量の考え方(標準→曲線→逆算)が近いツールです。
コメント
質問・要望・誤りの指摘があれば、コメントで教えてください。