115年:(醫檢)檢驗(1)
基因註解( annotation )是次世代定序結果判讀中重要的一環,下列何者為進行基因註解的主要目的?
A找出重要且與疾病有關的基因變異
B確認定序的品質
C提高序列比對的準確度
D辨識出基因變異的種類(如點突變,插入/刪除等)
詳細解析
本題觀念:
本題考查次世代定序(Next-Generation Sequencing, NGS)生物資訊分析流程中的**基因註解(Annotation)**步驟及其目的。
在 NGS 的標準分析流程中,主要分為三個階段:
- 初級分析 (Primary Analysis):訊號處理與鹼基判讀 (Base calling),產生原始序列檔案 (FASTQ)。
- 二級分析 (Secondary Analysis):序列比對 (Alignment/Mapping) 與變異位點偵測 (Variant Calling),產生變異檔案 (VCF)。此階段確認了變異的「位置」與「物理類型」(如:A變T,或有插入/缺失)。
- 三級分析 (Tertiary Analysis):基因註解 (Annotation) 與臨床判讀。此階段將偵測到的變異加上生物學意義(如:位於哪個基因?造成什麼氨基酸改變?在族群中是否常見?是否具致病性?),以利篩選出真正具臨床意義的變異。
選項分析
-
A. 找出重要且與疾病有關的基因變異 (正確)
- 解析:這是基因註解在臨床檢驗中的核心目的。變異偵測 (Variant Calling) 步驟會產生成千上萬個變異點,其中絕大多數是無害的多型性 (Polymorphism) 或定序錯誤。基因註解透過比對各大資料庫(如 dbSNP, ClinVar, gnomAD),提供變異的頻率、功能影響(如 Missense, Nonsense)及致病性預測,幫助檢驗師從海量數據中「過濾」並「鎖定」出那些真正導致疾病的重要變異。
-
B. 確認定序的品質 (錯誤)
- 解析:這是品質控制 (Quality Control, QC) 的目的。通常在取得原始數據 (FASTQ) 後,會利用工具(如 FastQC)檢查鹼基品質值 (Q-score)、GC含量等,以剔除品質不佳的讀段 (Reads)。這發生在分析流程的最前端,遠早於註解步驟。
-
C. 提高序列比對的準確度 (錯誤)
- 解析:這是序列比對 (Alignment/Mapping) 階段的優化目標。比對是將讀段定位到參考基因組 (Reference Genome) 上。註解是在比對完成且變異被抓出來之後才進行的,無法回頭改變比對的準確度。
-
D. 辨識出基因變異的種類(如點突變,插入/刪除等) (錯誤)
- 解析:這是變異偵測 (Variant Calling) 的功能。變異偵測軟體(如 GATK)會比較檢體序列與參考基因組,判斷特定位置是單一鹼基置換 (SNP/SNV) 還是插入/缺失 (Indel),並記錄在 VCF 檔案中。雖然註解會進一步描述該變異造成的「蛋白質層級」後果(如錯義突變),但辨識「變異種類(物理上的 DNA 變化)」早在 Calling 階段就已完成。因此,相較於 D,選項 A 才是註解步驟賦予數據臨床價值的「主要目的」。
答案解析
正確答案是 A。
基因註解 (Annotation) 的作用在於賦予變異「生物學意義」。原始的變異呼叫結果 (VCF file) 只有染色體位置與鹼基變化(例如:Chr1: 123456 A>G),這對臨床判讀毫無意義。註解步驟會將此資訊轉換為「基因名稱、氨基酸改變、族群頻率、文獻報導的致病性」等,讓醫事檢驗師或醫師能夠判斷此變異是否為導致病患疾病的元兇。因此,其主要目的是為了從大量變異中篩選並找出與疾病相關的重要變異。
核心知識點
- NGS 資料分析三部曲:
- Primary:Base calling (BCL -> FASTQ) — 產出序列。
- Secondary:Alignment (BAM) + Variant Calling (VCF) — 找出變異。
- Tertiary:Annotation + Interpretation — 解釋變異(賦予臨床意義)。
- 基因註解 (Annotation) 的內容:
- 基因層級:變異位於哪個基因、外顯子 (Exon) 或內含子 (Intron)。
- 功能層級:對蛋白質的影響(Synonymous, Missense, Nonsense, Frameshift)。
- 族群層級:在一般人中的出現頻率 (MA, gnomAD),頻率過高通常排除致病可能。
- 臨床層級:是否在 ClinVar、HGMD 等資料庫中有致病紀錄。