Khác biệt giữa bản sửa đổi của “Trình tự acid nucleic”

Bách khoa toàn thư mở Wikipedia
Nội dung được xóa Nội dung được thêm vào
n →‎top: replaced: 4 loại → bốn loại using AWB
Dòng 3: Dòng 3:
Trong [[di truyền học]], một '''trình tự axit nucleic''', '''trình tự ADN''' hay '''trình tự di truyền''' là chuỗi các ký tự liên tiếp nhau nhằm biểu diễn [[cấu trúc chính]] của một dải hay phân tử [[ADN]] thực hoặc tổng hợp, mà có khả năng mang [[thông tin]] về [[gen]] và [[di truyền]].
Trong [[di truyền học]], một '''trình tự axit nucleic''', '''trình tự ADN''' hay '''trình tự di truyền''' là chuỗi các ký tự liên tiếp nhau nhằm biểu diễn [[cấu trúc chính]] của một dải hay phân tử [[ADN]] thực hoặc tổng hợp, mà có khả năng mang [[thông tin]] về [[gen]] và [[di truyền]].


Để tương ứng với 4 loại [[nucleotide]], người ta dùng 4 ký tự để phân biệt ''A'', ''X'' (dùng ở Việt Nam, chữ ''C'' được dùng ở các tài liệu tiếng Anh), ''G'', và ''T''- tương ứng với tên của 4 gốc [[adenine|'''A'''denin]], [[cytosine|'''X'''itosin]] ('''''C'''ytosine''), [[guanine|'''G'''uanin]], [[thymine|'''T'''imin]] được liên kết hóa trị với mạch chính phốtpho. Trong trường hợp chung, các chuỗi được ghi lên kế nhau không có khoảng trống (''gap'') chèn vào, ví dụ chuỗi AAAGTXTGAX, đi từ đầu 5' đến 3' tính từ trái sang phải. Nếu có khoảng trống, người ta dùng ký hiệu gạch ngang (-) để làm đại diện, ví dụ ATX-G--X. Bất cứ chuỗi ký tự nào của các nucleotide mà dài hơn 4 đều có thể gọi là trình tự ADN. Mặt khác, tùy vào chức năng sinh học, và ngữ cảnh, mà một trình tự có thể mang [[mã di truyền|mang mã]] hoặc [[ADN không mang mã|không mang mã]] (''noncoding DNA''). Các trình tự DNA cũng có thể chứa "[[ADN rác]]" (''junk DNA'').
Để tương ứng với bốn loại [[nucleotide]], người ta dùng 4 ký tự để phân biệt ''A'', ''X'' (dùng ở Việt Nam, chữ ''C'' được dùng ở các tài liệu tiếng Anh), ''G'', và ''T''- tương ứng với tên của 4 gốc [[adenine|'''A'''denin]], [[cytosine|'''X'''itosin]] ('''''C'''ytosine''), [[guanine|'''G'''uanin]], [[thymine|'''T'''imin]] được liên kết hóa trị với mạch chính phốtpho. Trong trường hợp chung, các chuỗi được ghi lên kế nhau không có khoảng trống (''gap'') chèn vào, ví dụ chuỗi AAAGTXTGAX, đi từ đầu 5' đến 3' tính từ trái sang phải. Nếu có khoảng trống, người ta dùng ký hiệu gạch ngang (-) để làm đại diện, ví dụ ATX-G--X. Bất cứ chuỗi ký tự nào của các nucleotide mà dài hơn 4 đều có thể gọi là trình tự ADN. Mặt khác, tùy vào chức năng sinh học, và ngữ cảnh, mà một trình tự có thể mang [[mã di truyền|mang mã]] hoặc [[ADN không mang mã|không mang mã]] (''noncoding DNA''). Các trình tự DNA cũng có thể chứa "[[ADN rác]]" (''junk DNA'').


Việc xác định trình tự ADN là tâm điểm của [[dự án bản đồ gene người]] {{ref|1}}. Các trình tự/chuỗi này có thể được trích rút ra từ dữ liệu thô trong sinh học thông qua quá trình gọi là [[Phương pháp Dideoxy|Phương pháp sắp xếp chuỗi ADN]] (''DNA sequencing'').
Việc xác định trình tự ADN là tâm điểm của [[dự án bản đồ gene người]] {{ref|1}}. Các trình tự/chuỗi này có thể được trích rút ra từ dữ liệu thô trong sinh học thông qua quá trình gọi là [[Phương pháp Dideoxy|Phương pháp sắp xếp chuỗi ADN]] (''DNA sequencing'').

Phiên bản lúc 05:30, ngày 31 tháng 5 năm 2017

Electropherogram printout from automated sequencer showing part of a DNA sequence

Trong di truyền học, một trình tự axit nucleic, trình tự ADN hay trình tự di truyền là chuỗi các ký tự liên tiếp nhau nhằm biểu diễn cấu trúc chính của một dải hay phân tử ADN thực hoặc tổng hợp, mà có khả năng mang thông tin về gendi truyền.

Để tương ứng với bốn loại nucleotide, người ta dùng 4 ký tự để phân biệt A, X (dùng ở Việt Nam, chữ C được dùng ở các tài liệu tiếng Anh), G, và T- tương ứng với tên của 4 gốc Adenin, Xitosin (Cytosine), Guanin, Timin được liên kết hóa trị với mạch chính phốtpho. Trong trường hợp chung, các chuỗi được ghi lên kế nhau không có khoảng trống (gap) chèn vào, ví dụ chuỗi AAAGTXTGAX, đi từ đầu 5' đến 3' tính từ trái sang phải. Nếu có khoảng trống, người ta dùng ký hiệu gạch ngang (-) để làm đại diện, ví dụ ATX-G--X. Bất cứ chuỗi ký tự nào của các nucleotide mà dài hơn 4 đều có thể gọi là trình tự ADN. Mặt khác, tùy vào chức năng sinh học, và ngữ cảnh, mà một trình tự có thể mang mang mã hoặc không mang mã (noncoding DNA). Các trình tự DNA cũng có thể chứa "ADN rác" (junk DNA).

Việc xác định trình tự ADN là tâm điểm của dự án bản đồ gene người [1]. Các trình tự/chuỗi này có thể được trích rút ra từ dữ liệu thô trong sinh học thông qua quá trình gọi là Phương pháp sắp xếp chuỗi ADN (DNA sequencing).

Trong một số trường hợp, trong chuỗi có thể xuất hiện các ký tự khác A, T, X, và G. Chúng biểu diễn cho sự đại diện không rõ ràng, có nghĩa là tại vị trí đó, có thể có hơn một loại nucleotide. Đây là quy ước của Hiệp hội Hóa học thuần túy và Hóa học ứng dụng Quốc tế (IUPAC - International Union of Pure and Applied Chemistry):

       A = adenine           
       C = cytosine            
       G = guanine             
       T = thymine           
       R = G A (purine)        
       Y = T C (pyrimidine)    
       K = G T (keto)    
       M = A C (amino)
       S = G C (strong bonds)
       W = A T (weak bonds)
       B = G T C (all but A)
       D = G A T (all but C)
       H = A C T (all but G)
       V = G C A (all but T)
       N = A G C T (any)

Xem thêm

Tham khảo

^ http://seqcore.brcf.med.umich.edu/doc/educ/dnapr/sequencing.html