Khác biệt giữa bản sửa đổi của “Gen”

Bách khoa toàn thư mở Wikipedia
Nội dung được xóa Nội dung được thêm vào
Không có tóm lược sửa đổi
Không có tóm lược sửa đổi
Dòng 276: Dòng 276:


Khi nhiều allele khác nhau của cùng một gene có mặt trong quần thể một loài thì hiện tượng này được gọi là ''đa hình'' (polymorphism). Phần lớn các allele khác nhau hoạt động tương tự nhau, tuy nhiên ở một số allele có thể làm xuất hiện các tính trạng kiểu hình khác nhau. Allele phổ biến nhất của một gene được gọi là [[kiểu dại]] (wild type), và những allele hiếm được gọi là allele đột biến. [[Biến dị di truyền]] trong tần số tương đối của các allele khác nhau trong một quần thể có nguyên nhân từ cả [[chọn lọc tự nhiên]] và [[biến động di truyền]] (genetic drift, những sự biến đổi ngẫu nhiên vô hướng về tần số allele trong tất cả các quần thể, nhưng đặc biệt là ở các quần thể nhỏ).<ref>{{cite journal|last1=Andrews|first1=Christine A.|title=Natural Selection, Genetic Drift, and Gene Flow Do Not Act in Isolation in Natural Populations|journal=Nature Education Knowledge|date=2010|volume=3|issue=10|page=5|url=http://www.nature.com/scitable/knowledge/library/natural-selection-genetic-drift-and-gene-flow-15186648|series=SciTable|publisher=Nature Publishing Group}}</ref>
Khi nhiều allele khác nhau của cùng một gene có mặt trong quần thể một loài thì hiện tượng này được gọi là ''đa hình'' (polymorphism). Phần lớn các allele khác nhau hoạt động tương tự nhau, tuy nhiên ở một số allele có thể làm xuất hiện các tính trạng kiểu hình khác nhau. Allele phổ biến nhất của một gene được gọi là [[kiểu dại]] (wild type), và những allele hiếm được gọi là allele đột biến. [[Biến dị di truyền]] trong tần số tương đối của các allele khác nhau trong một quần thể có nguyên nhân từ cả [[chọn lọc tự nhiên]] và [[biến động di truyền]] (genetic drift, những sự biến đổi ngẫu nhiên vô hướng về tần số allele trong tất cả các quần thể, nhưng đặc biệt là ở các quần thể nhỏ).<ref>{{cite journal|last1=Andrews|first1=Christine A.|title=Natural Selection, Genetic Drift, and Gene Flow Do Not Act in Isolation in Natural Populations|journal=Nature Education Knowledge|date=2010|volume=3|issue=10|page=5|url=http://www.nature.com/scitable/knowledge/library/natural-selection-genetic-drift-and-gene-flow-15186648|series=SciTable|publisher=Nature Publishing Group}}</ref>

Phần lớn các đột biến bên trong các gene là đột biến trung tính (neutral mutation), không có ảnh hưởng đến kiểu hình của sinh vật (đột biến lặng, silent mutation). Một số đột biến không làm thay đổi trình tự axit amin bởi vì một số codon mã hóa cho cùng một axit amin (đột biến đồng nghĩa, synonymous mutation). Các đột biến khác trở thành trung tính nếu tuy nó làm thay đổi trình tự axit amin, nhưng protein vẫn gập nếp và hoạt động bình thường với axit amin mới (đột biến bảo toàn, conservative mutation). Tuy nhiên, nhiều đột biến là có hại (deleterious mutation) hay thậm chí gây chết (lethal allele), và bị loại bỏ khỏi quần thể bằng quá trình chọn lọc. Rối loạn di truyền (genetic disorders) là kết quả của các đột biến có hại và có thể do đột biến tự phát trong cá thể bị ảnh hưởng, hoặc có thể di truyền sang thế hệ sau. Cuối cùng, có một tỷ lệ nhỏ các đột biến là có lợi (beneficial mutation), tăng cường độ phù hợp (fitness) ở sinh vật, và trở thành một trong những luận điểm quan trọng của thuyết tiến hóa tổng hợp hiện đại, vì trong chọn lọc có hướng dẫn đến tiến hóa thích nghi.<ref name="MBOC" />{{rp|7.6}}


{{tham khảo|2}}
{{tham khảo|2}}

Phiên bản lúc 03:58, ngày 3 tháng 6 năm 2018

The image above contains clickable links
The image above contains clickable links
Gene là một vùng DNA mã hóa chức năng di truyền. Một nhiễm sắc thể chứa một chuỗi dài DNA (cùng các phân tử khác gắn với NST) trong đó chứa rất nhiều gene. Một nhiễm sắc thể ở người có tới gần 500 triệu cặp base của DNA với hàng nghìn gene. 

Gene (hay còn gọi là gen, gien) là một trình tự DNA hoặc RNA mã hóa cho một phân tử có chức năng chuyên biệt. Trong quá trình biểu hiện gene, trước tiên DNA được sao chép sang RNA. Phân tử RNA hoặc là có chức năng biệt hóa trực tiếp hoặc làm khuôn mẫu trung gian để tổng hợp lên protein thực hiện một chức năng nào đó. Sự chuyển giao gene đến các sinh vật thế hệ con cháu là cơ sở của tính thừa kế các tính trạng kiểu hình. Các gene tạo thành từ các trình tự DNA khác nhau gọi là kiểu gene. Kiểu gene cùng với các yếu tố môi trường và phát triển xác định lên tính trạng kiểu hình. Đa số các tính trạng sinh học chịu ảnh hưởng bởi nhiều gene (polygene, tức một tính trạng do nhiều gene khác nhau quyết định) cũng như tương tác gene–môi trường. Một số tính trạng di truyền có thể trông thấy ngay lập tức, ví như màu mắt hoặc số chi, và một số khác thì không, như nhóm máu, nguy cơ mắc các bệnh, hoặc hàng nghìn quá trình sinh hóa cơ bản cấu thành sự sống.

Gene có thể thu nạp các đột biến sinh học nằm trong trình tự của chúng, dẫn đến những biến thể, gọi là các allele, trong quần thể. Các allele này mã hóa một số phiên bản hơi khác nhau của cùng một protein, làm biểu hiện tính trạng kiểu hình khác nhau. Việc sử dụng thuật ngữ "có một gene" (v.d., "các gene tốt," "gene màu tóc") thông thường nhắc tới việc bao gồm một allele khác nữa của cùng chung một gene.

Khái niệm gene liên tục được tinh chỉnh để cho phù hợp với những hiện tượng mới khám phá gần đây.[1] Ví dụ, các vùng điều hòa của một gene có thể nằm rất xa các vùng mã hóa của nó, và các vùng mã hóa này có thể xen kẽ bởi các đoạn exon. Một số virus lưu trữ bộ gene của chúng trong RNA thay vì ở DNA và một số sản phẩm gene là những RNA không mã hóa có chức năng chuyên biệt. Do đó, theo nghĩa rộng, định nghĩa khoa học hiện đại về gene là bất cứ đoạn locus di truyền được, đoạn trình tự trong bộ gene ảnh hưởng tới các tính trạng của sinh vật được biểu hiện thành sản phẩm chức năng hoặc tham gia điều hòa biểu hiện gene.[2][3]

Thuật ngữ gene do nhà thực vật học, sinh lý học thực vậtdi truyền học người Đan Mạch Wilhelm Johannsen giới thiệu năm 1905.[4] Ông lấy gốc từ tiếng Hy Lạp cổ đại: γόνος, gonos, có nghĩa là thế hệ con cháu và sinh sản.

Lịch sử

Chân dung Gregor Mendel
Gregor Mendel

Khám phá các đơn vị di truyền độc lập

Sự tồn tại của các đơn vị độc lập có khả năng di truyền được đề xuất lần đầu tiên bởi nhà thực vật học Gregor Mendel (1822–1884).[5] Từ năm 1854 đến 1863, trong một tu viện ở Brno, ông đã tiến hành trồng (gần 28.000 cây) và nghiên cứu các mẫu thế hệ con cháu của 12.835 cây thực vật đậu Hà Lan, theo dõi các đặc điểm khác biệt truyền từ thế hệ này sang thế hệ khác.[6][7][8] Ông miêu tả các đặc điểm này như là tổ hợp toán học 2n với n là số các đặc điểm khác nhau trong các cây đậu gốc. Mặc dù ông không sử dụng thuật ngữ gene, ông đã giải thích các kết quả theo thuật ngữ các đơn vị rời rạc có khả năng di truyền làm xuất hiện các đặc điểm thực tế quan sát được. Nội dung miêu tả này đã có trước phát hiện phân biệt của Wilhelm Johannsen về giữa kiểu gene (vật liệu di truyền của một sinh vật) và kiểu hình (các đặc điểm trông thấy của sinh vật đó). Mendel cũng lần đầu tiên chứng tỏ quy luật phân ly độc lập, sự khác biệt giữa các tính trạng trộitính trạng lặn, sự khác biệt giữa dị hợp tử (heterozygote) và đồng hợp tử (homozygote), và hiện tượng di truyền không liên tục.

Trước khi có nghiên cứu của Mendel, ngành sinh học đã có một số tiến bộ như: nhờ phát minh kính hiển vi sơ khai của Antonie van Leeuwenhoek (thế kỷ XVII) đã mở đường cho việc quan sát thế giới vi sinh vật, sự ra đời thuyết tế bào của Matthias SchleidenTheodor Schwann (1838, 1839). Nhìn chung quan niệm phổ biến về di truyền thời đó vẫn là di truyền các tính trạng tập nhiễmdi truyền hòa hợp (blending inheritance), cho rằng các cá thể thừa kế từ bố mẹ một hỗn hợp pha trộn các tính trạng, ví dụ như lai cây hoa đỏ với hoa trắng sẽ cho ra hoa hồng. Charles Darwin đã phát triển một lý thuyết về di truyền mà ông gọi là pangenesis (thuyết mầm, thuyết pangen), từ tiếng Hy Lạp cổ pan ("mọi, toàn thể") và genesis ("sự sinh") / genos ("nguồn gốc").[9][10] Darwin sử dụng thuật ngữ gemmule (mầm sinh) để miêu tả các hạt giả thuyết mà chúng được trộn với nhau trong quá trình sinh sản.

Tuy nhiên giới khoa học đương thời đã không hiểu và đánh giá được tầm vóc của khám phá Mendel sau khi ông công bố nghiên cứu vào năm 1866. Mãi đến năm 1900 ba nhà sinh học Hugo de Vries, Carl Correns, và Erich von Tschermak độc lập nhau đã thực hiện các thí nghiệm và đi đến các kết luận tương tự trước khi họ biết tới các nghiên cứu của Mendel.[11] Đặc biệt, năm 1889, Hugo de Vries xuất bản cuốn sách của ông Intracellular Pangenesis,[12] trong đó ông dự đoán rằng các tính trạng riêng biệt có từng đơn vị di truyền độc lập và sự kế thừa các tính trạng này trong sinh vật đến từ các hạt mầm. De Vries gọi những đơn vị này là "pangenes" (Pangens trong tiếng Đức), dựa theo lý thuyết pangenesis năm 1868 của Darwin.

Trong các năm 1902-1903, dựa trên các quan sát của Walther Flemming về nhiễm sắc thể trong quá trình phân bào, Walter Sutton và độc lập bởi Theodor Boveri đã khởi xướng thuyết nhiễm sắc thể. Trong bài báo của ông, Sutton nhấn mạnh vào sự quan trọng khi ông quan sát thấy nhóm NST lưỡng bội chứa hai tập hợp có hình thái (morphology) giống nhau, và trong giảm phân, mỗi giao tử chỉ nhận được một NST từ mỗi cặp NST tương đồng. Sau đó ông sử dụng quan sát này để giải thích các kết quả của Mendel bằng cách giả thiết rằng các gene nằm trên nhiễm sắc thể.[13]

Năm 1905, Wilhelm Johannsen đã giới thiệu các thuật ngữ 'gene', 'genotype' và 'phenotype'[4]William Bateson đưa ra thuật ngữ 'di truyền học' ('genetic')[14].

Trong thập niên 1910, Thomas Hunt Morgan cùng với cộng sự đã xây dựng thành công thuyết di truyền nhiễm sắc thể (chromosome theory of inheritance) dựa trên đối tượng nghiên cứu là ruồi giấm Drosophila melanogaster. Học thuyết này xác nhận rằng gene là đơn vị cơ sở của tính di truyền nằm trên nhiễm sắc thể (ở trong nhân); trên đó các gene sắp xếp theo đường thẳng tạo thành nhóm liên kết.[15]

Sự khám phá DNA

Quá trình nghiên cứu gene và di truyền tiếp tục đạt được những tiến bộ trong thế kỷ XX. Trước đó Friedrich Miescher (1869) đã khám phá ra một hỗn hợp trong nhân tế bào gọi là 'nuclein' mà sau đó Albrecht Kossel (1878) đã cô lập được thành phần không phải protein trong nuclein gọi là axit deoxyribonucleic. DNA được chứng tỏ là những phân tử chứa thông tin di truyền qua các thí nghiệm thực hiện trong thập niên 1940 đến thập niên 1950[16][17] (xem thí nghiệm Avery–MacLeod–McCarty, thí nghiệm Hershey–Chase). Nhờ kết quả nghiên cứu cấu trúc DNA bởi Rosalind FranklinMaurice Wilkins bằng phương pháp tinh thể học tia X, đã giúp James D. WatsonFrancis Crick đề xuất ra mô hình đúng về phân tử sợi xoắn kép DNA mà nguyên tắc ghép cặp nucleobase hàm ý giả thiết cho cơ chế sao chép vật liệu di truyền.[18][19]

Những năm đầu thập niên 1950, đa số các nhà sinh học có quan điểm cho rằng các gene trong một nhiễm sắc thể hoạt động giống như những đoạn rời rạc, không thể phân chia được bằng cách tái tổ hợp và sắp xếp như những hạt trên một chuỗi. Thí nghiệm của Seymour Benzer sử dụng các khuyết tật đột biến ở vùng rII của thể thực khuẩn T4 (1955-1959) đã chứng tỏ từng gene có một cấu trúc thẳng đơn giản và dường như là tương đương với một đoạn của sợi DNA.[20][21]

Bằng các thí nghiệm gây đột biến các gene liên quan đến các con đường sinh hóa trên nấm mốc bánh mỳ Neurospora crassa, năm 1941 George BeadleEdward Tatum xác nhận mỗi gene kiểm soát phản ứng sinh hóa tổng hợp một enzyme đặc thù.[22] Kết quả này đưa hai ông đến giả thiết một gene-một enzyme mà về sau được chính xác hóa là một gene xác định chỉ một chuỗi polypeptide, cấu trúc bậc 1 của protein, trong đó có các enzyme.[23]

Từ những kết quả nghiên cứu thu nạp dần đã hình thành lên luận thuyết trung tâm của sinh học phân tử, phát biểu rằng các protein được dịch mã từ RNA, mà đến lượt RNA được phiên mã từ DNA. Tuy vậy, sau này luận thuyết được chỉ ra có những ngoại lệ, ví dụ như phiên mã ngượcretrovirus. Ngành di truyền hiện đại nghiên cứu ở cấp độ DNA được biết đến là di truyền phân tử.

Năm 1972, Walter Fiers và cộng sự ở Đại học Ghent đã lần đầu tiên xác định được trình tự của một gene: đó là gene mã hóa cho protein vỏ bọc của thể thực khuẩn MS2.[24] Những phát triển sau đó của xác định trình tự DNA bằng kỹ thuật gián đoạn chuỗi bởi Frederick Sanger năm 1977 đã nâng cao hiệu quả giải trình tự và giúp nó trở thành công cụ thường xuyên trong các phòng thí nghiệm.[25] Một kỹ thuật tự động của phương pháp Sanger đã được áp dụng ở giai đoạn đầu của dự án giải mã bộ gene ở người.[26]

Thuyết tổng hợp hiện đại

Một số lý thuyết đã được phát triển đầu thế kỷ XX nhằm kết hợp giữa di truyền Mendel với thuyết tiến hóa Darwin được gọi là thuyết tổng hợp hiện đại, một thuật ngữ do Julian Huxley giới thiệu.[27]

Các nhà sinh tiến hóa sau đó đã chỉnh sửa bổ sung khái niệm này, như quan điểm gene là đối tượng trung tâm của tiến hóa nêu ra bởi George C. Williams. Ông đề xuất một khái niệm gene tiến hóa như là một đơn vị của chọn lọc tự nhiên với định nghĩa: "nó là cái tách biệt và tái kết hợp với tần số phù hợp."[28]:24 Theo quan điểm này, phân tử gene phiên mã như là một đơn vị, và gene tiến hóa kế thừa như là một đơn vị. Các ý tưởng liên quan nhấn mạnh vào vai trò trung tâm của gene trong tiến hóa được Richard Dawkins thảo luận trong các cuốn sách phổ biến khoa học.[29][30]

Cơ sở phân tử

DNA chemical structure diagram showing how the double helix consists of two chains of sugar-phosphate backbone with bases pointing inwards and specifically base pairing A to T and C to G with hydrogen bonds.
Cấu trúc hóa học của một đoạn chuỗi xoắn kép DNA. Hai sợi khung đường-phosphat chạy theo hướng ngược nhau với các cặp base hướng vào trong, sự bắt cặp A với TC với G thông qua liên kết hydro.

DNA

Hầu hết các sinh vật sống mã hóa gene của chúng trong những chuỗi dài DNA (axit deoxyribonucleic). DNA bao gồm một chuỗi cấu thành từ bốn loại tiểu đơn vị nucleotide, mỗi tiểu đơn vị cấu tạo bởi: một đường năm cacbon (2'-deoxyribose), một nhóm phosphat, và một trong bốn base adenine, cytosine, guanine, và thymine.[31]:2.1

Hai sợi DNA xoắn quanh nhau tạo thành chuỗi xoắn kép DNA với bộ khung xoắn đường-phosphat bao ngoài, và các base hướng vào trong mà adenine bắt cặp với thymine và guanine bắt cặp với cytosine. Sự bắt cặp base đặc biệt này xảy ra bởi vì ở mỗi adenine và thymine hình thành 2 liên kết hiđrô với nhau, trong khi ở mỗi cytosine và guanine hình thành 3 liên kết hiđrô với nhau. Do vậy hai sợi trong chuỗi xoắn kép liên kết với nhau tuân theo nguyên tắc bổ sung, với trình tự của các base bắt cặp sao cho các adenine của một sợi được bắt cặp với các thymine sợi kia, và cứ tương tự như thế.[31]:4.1

Do tính chất hóa học của phần dư pentose của các base, các sợi DNA có tính xác định hướng. Một đầu cuối của polyme DNA chứa nhóm hydroxyl lộ ra khỏi deoxyribose; vị trí này được gọi là đầu 3' của phân tử. Đầu cuối còn lại chứa nhóm phosphat lộ ra; hay còn gọi là đầu 5'. Hai sợi của chuỗi xoắn kép chạy theo hướng ngược nhau. Các quá trình tổng hợp axit nucleic, bao gồm tái bản DNAphiên mã diễn ra theo chiều đầu 5'→3', bởi vì các nucleotide mới được ghép vào thông qua phản ứng khử nước khi sử dụng đầu 3' hydroxyl như là chất phản ứng nucleophile (chất cho một cặp electron để tạo thành liên kết hóa học).[32]:27.2

Sự biểu hiện gene được mã hóa trong DNA bắt đầu bằng quá trình dịch mã gene thành RNA, một loại axit nucleic thứ hai rất giống với DNA, nhưng các monome chứa đường ribose thay cho đường deoxyribose. RNA cũng chứa base uracil thay cho thymine. Các phân tử RNA ít bền hơn DNA và thường là sợi đơn trong dạng điển hình. Các gene mã hóa cho các protein chứa một dãy các trình tự ba nucleotide được gọi là các codon, phục vụ như các "từ" trong "ngôn ngữ" di truyền. Mã di truyền xác định lên protein trong quá trình dịch mã giữa codon và axit amin. Mã di truyền gần như là như nhau ở mọi sinh vật sống đã biết.[31]:4.1

Nhiễm sắc thể

A microscopy image of 46 chromosomes striped with red and green bands
Ảnh chụp qua kính hiển vi huỳnh quang cho thấy 23 cặp nhiễm sắc thể ở nữ. DNA được thể hiện màu đỏ, với những vùng giàu các gene nội dịch (housekeeping gene) được thể hiện thêm bằng màu lục. Nhiễm sắc thể lớn nhất có số lượng base lớn gấp 50 lần của NST nhỏ nhất.[33]

Toàn bộ đầy đủ các gene trong một sinh vật hoặc tế bào được biết đến như là bộ gene, mà chúng lưu trữ trong một hoặc nhiều nhiễm sắc thể. Một NST chứa một chuỗi xoắn kép DNA rất dài (cùng với các protein hỗ trợ khác) mà trên đó có hàng nghìn gene được mã hóa.[31]:4.2 Vùng NST tại đó chứa một gene đặc biệt được gọi là locus. Mỗi locus chứa một allele của gene; tuy nhiên, các thành viên trong một quần thể có thể có các allele khác nhau tại locus, mà mỗi allele chỉ hơi khác nhau về trình tự gene.

Phần lớn các gene của sinh vật nhân thực được lưu trong một tập lớn, các sợi NST. Các NST được vo lại trong nhân tế bào như búi với sự hỗ trợ của các protein histone để tạo thành một đơn vị gọi là nucleosome. DNA đóng gói và cô đặc theo cách này được gọi là chromatin (chất nhiễm sắc).[31]:4.2 Cách thức DNA quấn bao quanh các histone, cũng như các sửa đổi hóa học của chính histone, giúp điều hòa một vùng DNA cụ thể nơi quá trình biểu hiện gene có thể thực hiện được. Ngoài các đoạn gene, trong nhiễm sắc thể của sinh vật nhân thực còn chứa các trình tự giúp đảm bảo quá trình tái bản DNA diễn ra bình thường mà không làm suy giảm các vùng đầu cuối DNA và giúp sắp xếp chúng vào các tế bào con trong quá trình phân bào: vùng khởi điểm tái bản (replication origin), telomeretâm động (centromere).[31]:4.2 Vùng khởi điểm tái bản là những vùng trình tự nơi quá trình tái bản DNA được bắt đầu diễn ra (có thể tại một hoặc nhiều vị trí trên NST). Telomere (đầu mút) là những đoạn trình tự dài và lặp lại nằm ở những đoạn đầu hoặc cuối cùng của NST có chức năng ngăn cản sự thoái hóa của các vùng trình tự điều hòa và mã hóa trong quá trình tái bản DNA. Độ dài của các telomere giảm đi mỗi lần bộ gene được sao chép và được phát hiện có liên quan đến quá trình lão hóa tế bào.[34]Vị trí tâm động là nơi các sợi thoi (spindle fibre, hoặc microtubule) bám vào để tách hai chromatid chị em dính nhau ở tâm động trong quá trình phân bào.[31]:18.2

Sinh vật nhân sơ (vi khuẩnvi khuẩn cổ) thông thường lưu giữ bộ gene của chúng trên một sợi nhiễm sắc thể dạng vòng có kích thước lớn (circular chromosome, xem DNA siêu xoắn). Tương tự, ở một số bào quan ở sinh vật nhân thực có chứa một NST mạch vòng còn sót loại mà trên đó có một số ít các gene.[31]:14.4 Thỉnh thoảng sinh vật nhân sơ bổ sung vào NST của chúng thêm những vòng nhỏ DNA gọi là plasmid, mà thường chỉ mã hóa một số gene và có thể trao đổi được giữa các cá thể. Ví dụ, các gene có khả năng giúp vi sinh vật kháng kháng sinh và mang lại cho plasmid khả năng tự sao chép độc lập giữa các tế bào, thậm chí của các chủng loài khác nhau, thông qua cơ chế chuyển gene ngang (horizontal gene transfer).[35]

Trong khi ở nhiễm sắc thể của sinh vật nhân sơ có mật độ tập trung gene tương đối cao, thì ở sinh vật nhân thực thường chứa các vùng DNA mà chức năng của nó không rõ ràng. Sinh vật nhân thực đơn bào đơn giản có tương đối ít lượng DNA như thế, trong khi bộ gene phức tạp của những sinh vật đa bào, bao gồm con người, chứa rất nhiều đoạn DNA mã vẫn chưa giải mã được chức năng của chúng.[36] Các nhà sinh học phân tử thường coi những vùng này là những đoạn DNA rác ("junk DNA"). Tuy nhiên, những phân tích gần đây gợi ý rằng mặc dù các vùng DNA mã hóa protein chỉ chiếm 2% trong bộ gene người, khoảng 80% số lượng base trong bộ gene có thể được biểu hiện, do đó "đoạn rác DNA" có thể bị sử dụng nhầm tên gọi.[3]

Cấu trúc

The image above contains clickable links
The image above contains clickable links
Cấu trúc của một gene mã hóa protein ở sinh vật nhân thực. Trình tự điều hòa kiểm soát ở đâu và vào lúc nào sự biểu hiện xảy ra đối với vùng mã hóa protein (đỏ). Vùng khởi động (promoter) và tăng cường (enhancer) (vàng) điều hòa phiên mã gene thành phân tử pre-mRNA mà được sửa đổi để loại bỏ các intron (xám nhạt) và thêm vào đầu 5' và đuôi poly-A (xám đậm). Các vùng không được dịch mã của mRNA là đầu 5' và đầu 3' (lam) điều hòa dịch mã thành chuỗi polypeptide trước khi thành sản phẩm protein cuối cùng.[37] 
The image above contains clickable links
The image above contains clickable links
Cấu trúc của một operonsinh vật nhân sơ về gene mã hóa protein. Các trình tự điều hòa kiểm soát khi nào quá trình biểu hiện gene diễn ra đối với nhiều vùng mã hóa protein (đỏ). Các vùng promoter, operatorenhancer (vàng) điều hòa phiên mã gene thành một mRNA. Các vùng không dịch mã (lam) của mRNA điều hòa sự dịch mã thành các sản phẩm protein cuối cùng.[37] 

Cấu trúc của một gene chứa nhiều yếu tố mà những trình tự mã hóa protein thực sự chỉ là một phần nhỏ trong đó. Chúng bao gồm các vùng DNA không được phiên mã cũng như các vùng RNA không được dịch mã.

Tại hai bên khung đọc mở, mỗi gene chứa một trình tự điều hòa cần thiết cho sự biểu hiện của nó. Đầu tiên, gene cần một trình tự khởi động (promoter). Các yếu tố phiên mã (transcription factors) nhận ra và liên kết với vùng trình tự khởi động, sau đó RNA polymerase thực hiện khởi phát quá trình phiên mã.[31]:7.1 Việc nhận ra này thường nằm ở hộp TATA trong vùng khởi động. Một gene có thể có nhiều hơn một vùng khởi động, làm cho các RNA thông tin (mRNA) khác nhau ở độ dài của đầu 5'.[38] Những gene thường xuyên được phiên mã có những trình tự khởi động "mạnh" tức là tạo thành liên kết mạnh với các yếu tố phiên mã, do vậy khởi phát phiên mã ở tốc độ cao. Những gene khác có những vùng trình tự khởi động "yếu" mà liên kết yếu với các yếu tố phiên mã và do vậy sự phiên mã đối với các gene này xảy ra ít hơn.[31]:7.2 Các vùng trình tự khởi động ở sinh vật nhân thực có cấu trúc phức tạp hơn và khó nhận diện hơn so với ở sinh vật nhân sơ.[31]:7.3

Thêm vào đó, các gene có thể chứa những vùng điều hòa có độ dài hàng kilobase nằm ở bên trái hoặc bên phải khung đọc mở dẫn đến làm thay đổi mức độ biểu hiện. Những vùng này hoạt động bằng cách liên kết với các yếu tố phiên mã khiến cho DNA tạo thành mạch vòng do đó trình tự điều hòa (và yếu tố phiên mã bám vào) trở lên rất gần với RNA polymerase tại vị trí liên kết.[39] Ví dụ, các vùng tăng cường (enhancer) làm tăng tốc độ phiên mã bằng cách liên kết với một protein kích hoạt (activator protein) giúp kéo phân tử RNA polymerase đến vùng khởi động; ngược lại vùng bất hoạt (silencer) bám với protein ức chế (repressor protein) làm cho DNA trở lên ít hoạt động với RNA polymerase.[40]

Phân tử tiền mRNA (pre-mRNA) chứa những vùng không dịch mã ở cả hai đầu mà trong mỗi đầu chứa vị trí liên kết ribosome, vùng kết thúc (terminator) và các codon khởi đầucodon kết thúc.[41] Thêm vào đó, ở hầu hết khung đọc mở của sinh vật nhân thực chứa các đoạn intron không dịch mã mà sẽ được loại bỏ trước khi các đoạn exon được dịch mã. Các trình tự ở cuối mỗi intron, quyết định các vị trí cắt (splice site, RNA splicing) để tạo ra mRNA thành thục cuối cùng, dùng để mã hóa cho protein hoặc sản phẩm RNA khác.[42]

Nhiều gene ở sinh vật nhân sơ được tổ chức thành các đơn vị operon, với nhiều trình tự mã hóa protein được phiên mã nằm trong nó.[43][44] Các gene trong một operon được phiên mã như là một mRNA liên tục, mà coi nó như là polycistronic mRNA. Thuật ngữ cistron trong bối cảnh này tương đương với khái niệm gene. Sự phiên mã của một operon của mRNA thường bị kiểm soát bởi phân tử ức chế (repressor), mà trạng thái hoạt động hay bị cấm của sự phiên mã phụ thuộc vào sự có mặt những chất chuyển hóa nhất định.[45] Khi phân tử ức chế hoạt động, nó bám vào một trình tự DNA nằm ở vị trí khởi đầu của operon, được gọi là vùng operator, làm cản trở sự phiên mã của operon; khi phân tử ức chế bất hoạt, sự phiên mã ở operon có thể xảy ra (xem ví dụ Lac operon). Các sản phẩm của gene operon thường có những chức năng liên quan và tham gia vào cùng mạng lưới điều hòa gene.[31]:7.3

Định nghĩa theo chức năng

Các nhà sinh học phân tử gặp phải khó khăn khi muốn định nghĩa chính xác phần nào của một trình tự DNA chứa một gene.[1] Các vùng điều hòa của một gene như vùng tăng cường không cần thiết phải nằm gần với trình tự mã hóa trên mạch dài phân tử bởi vì các đoạn DNA trung gian có thể tạo vòng lồi ra (loop out) giúp mang gene và vùng trình tự điều hòa của nó đến gần nhau. Tương tự, các đoạn intron của một gene có thể dài hơn rất nhiều so với các đoạn exon của nó. Các vùng điều hòa thậm chí có thể nằm hoàn toàn trên nhiễm sắc thể khác và hoạt động từ xa (in trans) khi cho phép vùng điều hòa trên một nhiễm sắc thể đến gần với các gene đích nằm trên nhiễm sắc thể khác.[46][47]

Những nghiên cứu ban đầu trong di truyền phân tử gợi ra khả năng một gene tạo một protein. Khái niệm này (ban đầu gọi là giả thuyết một gene-một enzyme) bắt nguồn từ bài báo có tầm ảnh hưởng năm 1941 bởi George Beadle và Edward Tatum công bố kết quả nghiên cứu các thí nghiệm gây đột biến trên nấm mốc bánh mỳ Neurospora crassa.[22] Norman Horowitz, một trong các cộng sự ban đầu tham gia vào nghiên cứu Neurospora, nhớ lại vào năm 2004 rằng “những thí nghiệm này là cơ sở của khoa học mà Beadle và Tatum từng gọi là di truyền sinh hóa. Thực sự các kết quả của họ đã khai sinh ra ngành di truyền phân tử và tất cả những phát triển sau đó.”[48] Khái niệm một gene-một protein đã được tinh chỉnh dần từ lúc khám phá ra các gene có thể mã hóa nhiều protein bằng quá trình điều hòa cắt-nối có chọn lọc (alternative splicing) và các trình tự mã hóa tách thành những đoạn ngắn trên bộ gene mà các mRNA được ghép nối bằng quá trình xử lý cắt-nối chéo (trans-splicing).[3][49][50]

Một định nghĩa có tầm hoạt động rộng thỉnh thoảng được sử dụng để bao quát được tính phức tạp của nhiều hiện tượng phong phú, nơi một gene được định nghĩa như là hợp của các trình tự mã hóa cho một tập nhất quán các sản phẩm chuyên biệt có khả năng xen phủ lẫn nhau.[14] Định nghĩa này phân loại gene theo các sản phẩm có chức năng riêng (như protein hay RNA) hơn là theo những vị trí locus cụ thể trên đoạn DNA, với các yếu tố điều hòa được phân loại như là các vùng kết hợp với gene.[14]

Biểu hiện gene

Trong mọi sinh vật, có hai bước cần thiết để đọc thông tin mã hóa trong DNA của gene và tổng hợp lên sản phẩm protein mà gene mã hóa cho. Đầu tiên, các đoạn DNA của gene được phiên mã thành RNA thông tin (mRNA).[31]:6.1 Thứ hai, mRNA được dịch mã thành protein.[31]:6.2 Các gene mã hóa trong RNA vẫn phải trải qua bước đầu tiên, nhưng không nhất thiết dịch mã thành protein.[51] Quá trình tổng hợp ra một phân tử chức năng sinh học hoặc là RNA hay protein được gọi là biểu hiện gene, và phân tử tạo thành được gọi là sản phẩm gene.

Mã di truyền

Một phân tử RNA chứa các nucleotide. Nhóm ba nucleotide được gọi là bộ ba mã hóa hay codon, mã mỗi nhóm tương ứng với một axit amin cụ thể.
Phác thảo một đoạn của phân tử RNA sợi đơn minh họa cho chuỗi bộ ba base codon. Cứ mỗi bộ ba nucleotide codon tương ứng với một axit amin khi được dịch mã thành protein

Trình tự nucleotide của DNA trong một gene xác định lên trình tự axit amin tương ứng của protein thông qua mã di truyền. Tập hợp các bộ ba nucleotide, gọi là bộ ba mã hóa hay codon, mà mỗi codon mã hóa cho một axit amin.[31]:6 Nguyên lý phát biểu rằng cứ ba base trong trình tự DNA mã hóa cho mỗi axit amin được minh chứng bằng thí nghiệm năm 1961 khi tạo đột biến dịch chuyển khung trong gene rIIB của thể thực khuẩn T4[52] (xem thí nghiệm Crick, Brenner và cộng sự).

Ngoài ra, một "codon khởi động", và ba "codon kết thúc" đánh dấu sự bắt đầu và kết thúc của vùng mã hóa protein. Có tất cả 64 codon khả dĩ (vì có bốn nucleotide ở mỗi một trong ba vị trí, do vậy tổ hợp có tất cả 43 codon) và trong tự nhiên chỉ có 20 axit amin cơ bản; do vậy số bộ ba là thừa và có nhiều codon cùng mã hóa cho một axit amin. Sự tương ứng giữa các codon và axit amino gần như là phổ biến rộng rãi ở mọi sinh vật sống đã biết trên Trái Đất.[53]

Phiên mã

Phiên mã tạo ra phân tử RNA sợi đơn được biết đến là mRNA, mà các trình tự nucleotide trong nó tuân theo nguyên tắc bổ sung với của DNA làm gốc để phiên mã nó.[31]:6.1 mRNA có vai trò làm khuôn mẫu trung gian giữa DNA của gene và sản phẩm protein cuối cùng. DNA của gene được sử dụng làm khuôn để tổng hợp lên mRNA theo nguyên tắc ghép cặp bổ sung. mRNA khớp với trình tự của dải mã hóa (coding strand) trong DNA của gene bởi vì nó được tổng hợp như là sợi bổ sung của dải khuôn mẫu (template strand). Phiên mã được thực hiện bằng enzyme gọi là RNA polymerase, khi nó đọc và thực hiện trượt theo dải khuôn mẫu theo hướng đầu 3' đến đầu 5'; và tổng hợp lên RNA theo hướng ngược lại từ đầu 5' đến đầu 3'. Để khởi phát phiên mã, phân tử polymerase đầu tiên nhận ra và bám vào vùng khởi động của gene. Do vậy, cơ chế chính của điều hòa biểu hiện gene là ngăn chặn hoặc cô lập vùng khởi động, hoặc thông qua các phân tử ức chế (repressor) có chức năng ngăn chặn polymerase, hoặc bằng cách tổ chức DNA sao cho không thể tiếp cận được vùng khởi động.[31]:7

Ở sinh vật nhân sơ, quá trình phiên mã xảy ra trong tế bào chất; đối với phân tử phiên mã rất dài, sự dịch mã có thể bắt đầu tại đầu 5' của RNA trong khi ở đầu 3' của nó vẫn đang trong quá trình phiên mã. Ở sinh vật nhân thực, phiên mã xảy ra trong nhân tế bào, nơi lưu giữ DNA và nhiễm sắc thể. Phân tử RNA được tổng hợp bằng polymerase được gọi là bản sao sơ cấp (primary transcript) và trải qua một quá trình sửa đổi hậu phiên mã (post-transcriptional modification) trước khi trở thành mRNA thành thục và được chuyển ra khỏi nhân vào tế bào chất để chuẩn bị cho dịch mã. Một trong những sửa đổi được thực hiện đó là cắt-nối các đoạn intron là những trình tự trong vùng phiên mã nhưng không mã hóa cho protein. Cơ chế cắt-nối có chọn lọc (alternative splicing) có thể cho các bản sao thành thục từ cùng một gene nhưng mRNA có trình tự khác vào do vậy nó mã hóa cho những protein khác. Đây là cơ chế điều hòa chính ở tế bào nhân thực và cũng xuất hiện ở một vài tế bào nhân sơ.[31]:7.5[54]

Dịch mã

A protein-coding gene in DNA being transcribed and translated to a functional protein or a non-protein-coding gene being transcribed to a functional RNA
Bên trái: Các gene mã hóa protein được phiên mã thành mRNA trung gian, sau đó nó được dịch mã thành protein có chức năng nhất định. Bên phải: Các gene mã hóa cho RNA mà được phiên mã thành những RNA không mã hóa có chức năng chuyên biệt. (PDB: 3BSE, 1OBB, 3TRA​)

Dịch mã là quá trình trong đó một phân tử mRNA thành thục được sử dụng là khuôn mẫu để tổng hợp lên protein mới.[31]:6.2 Dịch mã được thực hện bằng các ribosome, những phức hợp lớn chứa RNA và protein chịu trách nhiệm thực hiện các phản ứng hóa sinh để ghép nối thêm những axit amin mới do tRNA mang đến tạo thành một chuỗi polypeptide đang dài dần ra dựa trên liên kết peptide. Mã di truyền được đọc ba nucleotide trong một lần, theo các đơn vị gọi là codon mã hóa, thông qua tương tác với các phân tử RNA biệt hóa gọi là RNA vận chuyển (tRNA). Mỗi tRNA có ba base không được ghép cặp gọi là các codon đối mã (anticodon) mà bắt cặp bổ sung với codon nó đọc được từ mRNA. tRNA thông qua liên kết cộng hóa trị gắn với axit amin mà chỉ khớp riêng với codon của tRNA đó. Khi tRNA bắt khớp với codon bổ sung trên dải mRNA, ribosome lập tức gắn axit amin nó mang tới vào chuỗi polypeptide đang được tổng hợp, mà có chiều từ đầu amin đến đầu cacboxyl. Trong lúc và sau tổng hợp, hầu hết protein mới hình thành phải trải qua bước uốn gập về cấu trúc ba chiều hoạt động trước khi chúng thực hiện tham gia các chức năng trong tế bào hoặc được đẩy ra khỏi tế bào.[31]:3

Điều hòa

Các gene được điều hòa sao cho chúng chỉ biểu hiện khi các sản phẩm gene ở mức cần thiết, vì quá trình biểu hiện tiêu tốn những nguồn dự trữ hạn chế.[31]:7 Một tế bào điều hòa biểu hiện các gene của nó phụ thuộc vào môi sinh (ví dụ chất dinh dưỡng nhiều hay ít, nhiệt độcác sức ép-stress), môi trường bên trong tế bào (ví dụ chu kỳ phân bào, trao đổi chất, trạng thái lây nhiễm), và vai trò cụ thể của nó trong một sinh vật đa bào. Biểu hiện gene có thể được điều hòa ở bất kỳ một bước nào: từ lúc khởi phát phiên mã, đến xử lý RNA, đến sửa đổi sau dịch mã đối với protein. Sự điều hòa các gene kiểm soát trao đổi chất của đường lactoseE. coli (lac operon) là một trong những cơ chế điều hòa đầu tiên được François JacobJacques Monod miêu tả vào năm 1961.[45]

Các gene sinh RNA không mã hóa

Một gene mã hóa protein điển hình thường đầu tiên sao chép sang RNA như là một phân tử trung gian trong quá trình tổng hợp ra protein cuối cùng.[31]:6.1 Trong trường hợp khác, các phân tử RNA là những sản phẩm có chức năng chuyên biệt, như vai trò trong tổng hợp RNA ribosomeRNA vận chuyển. Một số RNA được biết đến là các ribozyme có khả năng hoạt động như enzyme, và microRNA có vai trò điều hòa. Trình tự DNA từ đó mà RNA được phiên mã thành các RNA có chức năng chuyên biệt được gọi là các gene sinh RNA không mã hóa.[51]

Ở một số virus chúng lưu trữ toàn bộ bộ gene của chúng trong dạng của RNA, và không hề chứa một trình tự DNA nào.[55][56] Bởi vì chúng sử dụng RNA để lưu giữ các gene, các tế bào vật chủ có thể tổng hợp lên các protein cần thiết cho virus ngay khi chúng lây nhiễm vào vật chủ và không cần phải đợi xảy ra giai đoạn phiên mã.[57] Mặt khác, ở các RNA retrovirus, như HIV, chúng đòi hỏi phải có quá trình phiên mã ngược từ bộ gene của chúng là RNA sang DNA trước khi protein của virus được tổng hợp ra. Di truyền học ngoài gene (epigenetics) do RNA trung gian cũng đã được quan sát thấy ở một số thực vật nhưng rất hiếm có ở động vật.[58]

Di truyền

Illustration of autosomal recessive inheritance. Each parent has one blue allele and one white allele. Each of their 4 children inherit one allele from each parent such that one child ends up with two blue alleles, one child has two white alleles and two children have one of each allele. Only the child with both blue alleles shows the trait because the trait is recessive.
Sự kế thừa từ một gene có hai allele khác nhau (lam và trắng). Gene này nằm trên nhiễm sắc thể thường (không phải là NST giới tính). Allele trắng là tính trạng lặn so với tính trạng trội do allele lam quy định. Xác suất cho biểu hiện các tính trạng ở thế hệ con bằng một phần tư, hay 25 phần trăm.

Bộ gene các sinh vật kế thừa từ gene trong thế hệ bố mẹ của chúng. Các sinh vật sinh sản vô tính chỉ đơn giản là kế thừa bản sao đầy đủ của bộ gene bố mẹ chúng. Các sinh vật sinh sản hữu tính có hai bản sao ở mỗi nhiễm sắt thể bởi vì chúng thừa hưởng một bộ đầy đủ từ mỗi con cái và con đực.[31]:1

Di truyền Mendel

Theo di truyền Mendel, các biến dị trong kiểu hình của một sinh vật (các đặc điểm vật lý và cư xử quan sát được) là một phần do những biến đổi trong kiểu gene (đặc biệt là các gene tương ứng). Mỗi gene xác định một tính trạng riêng với các trình tự khác nhau trên cùng một gene (các allele) làm xuất hiện nhiều kiểu hình khác nhau. Hầu hết các sinh vật nhân thực (như ở cây đậu Hà Lan mà Mendel dùng để nghiên cứu) có hai allele cho mỗi tính trạng, mỗi allele được kế thừa từ bố hoặc mẹ.[31]:20

Tại locus các allele có thể là trội hoặc lặn; các allele trội thể hiện những kiểu hình tương ứng khi nó ghép cặp với bất kỳ một allele khác của của tính trạng, trong khi các allele lặn chỉ thể hiện kiểu hình tương ứng khi nó ghép cặp với cùng một bản sao allele khác. Nếu biết kiểu hình của sinh vật, có thể xác định được allele trội và allele lặn. Ví dụ, nếu allele xác định thân cây cao ở đậu Hà Lan là tính trạng trội so với allele xác định thân cây thấp, thì ở thực vật đậu thừa hưởng một allele allele cao từ bố mẹ và một allele thấp từ bố mẹ thì nó sẽ là thân cây cao. Nghiên cứu của Mendel chứng tỏ rằng các allele phân ly độc lập trong hình thành giao tử, hoặc các tế bào gốc, đảm bảo biến đổi ở thế hệ tiếp theo. Mặc dù di truyền Mendel vẫn là một mô hình tốt cho nhiều tính trạng xác định bởi các gene riêng rẽ (bao gồm một số bệnh di truyền hay gặp) nó không kể đến những quá trình sinh hóa trong tái bản DNA và phân bào.[59][60]

Tái bản DNA và phân bào

Các sinh vật sinh trưởng, phát triển và sinh sản dựa vào sự phân bào; quá trình trong đó một tế bào phân chia thành hai tế bào con. Để thực hiện được như vậy đầu tiên trong nhân tế bào cần tiến hành sao chép từng gene trong bộ gene thông qua cơ chế tái bản DNA.[31]:5.2 Quá trình tái bản được thực hiện nhờ những enzyme chuyên biệt mà trong số đó là DNA polymerase, phân tử này thực hiện "đọc" một sợi trong hai sợi xoắn kép DNA đã được tháo xoắn, hay còn gọi sợi này là sợi khuôn, và tổng hợp lên một sợi bổ sung mới. Bởi vì chuỗi xoắn kép DNA được liên kết với nhau bởi các cặp base bổ sung, từ trình tự của một sợi có thể hoàn toàn xác định lên trình tự bổ sung; do vậy enzyme chỉ cần đọc một sợi là có thể tạo ra một bản sao đầy đủ. Quá trình tái bản DNA tuân theo nguyên tắc bán bảo toàn; tức là, bản sao của bộ gene thừa kế trong mỗi tế bào con chứa một sợi gốc từ bố mẹ và một sợi DNA mới tổng hợp.[31]:5.2

Tốc độ tái bản DNA trong tế bào sống lần đầu tiên được xác định là ở tốc độ kéo dài DNA của thể thực khuẩn T4 trong E. coli bị nhiễm phage và các nhà sinh học phát hiện thấy nó có một tốc độ nhanh đáng kinh ngạc.[61] Trong giai đoạn sao chép DNA ở nhiệt độ 37 °C, tốc độ kéo dài bằng 749 nucleotide trên một giây.

Sau khi quá trình tái bản DNA kết thúc, tế bào phải trải qua sự chia tách của hai bản sao bộ gene và phân chia thành hai tế bào có màng phân biệt.[31]:18.2 Ở sinh vật nhân sơ (vi khuẩnvi khuẩn cổ) quá trình này tương đối đơn giản thể hiện qua sự phân chia đôi (binary fission), trong đó mỗi bộ gene trên mạch vòng gắn vào màng tế bào và được tách ra thành các tế bào khi màng tế bào lộn vào trong (invagination) và tách tế bào chất ra thành hai phần ngăn nhau bởi màng tế bào. Quá trình phân chia đổi xảy ra cực kỳ nhanh so với tốc độ phân bào ở sinh vật nhân thực. Tế bào của sinh vật nhân thực phân chia diễn ra phức tạp hơn như trong chu kỳ tế bào; sự tái bản DNA xảy ra trong pha S, trong khi quá trình tách nhiễm sắc thể và bào tương xảy ra trong pha M.[31]:18.1

Di truyền phân tử

Bản đồ di truyền liên kết ở Drosophila melanogaster của Thomas Hunt Morgan. Đây là nghiên cứu thành công đầu tiên trong việc lập bản đồ gene (xác định vị trí các gene trên NST) và cung cấp bằng chứng quan trọng cho lý thuyết di truyền trên nhiễm sắc thể. Bản đồ chỉ ra vị trí tương đối của các allele trên NST số 2 của Drosophila. Khoảng cách giữa các gene (đơn vị đo centimorgan) tỷ lệ thuận với tần số tái tổ hợp của sự kiện trao đổi giữa các allele.[62]

Sự tái bản và truyền vật liệu di truyền từ một thế hệ tế bào sang thế hệ tiếp theo là cơ sở của di truyền phân tử, và là mối liên hệ giữa bức tranh phân tử với bức tranh cổ điển của gene. Sinh vật thừa hưởng những đặc tính từ bố mẹ bởi vì các tế bào con chứa các bản sao của gene từ trong tế bào của bố mẹ chúng. Ở các sinh vật sinh sản vô tính, ở thế hệ con sẽ chứa bản sao di truyền hay dòng hóa từ các sinh vật bố mẹ. Ở sinh vật sinh sản hữu tính, một giai đoạn đặc biệt của quá trình phân bào gọi là giảm phân tạo thành các tế bào giao tử hoặc tế bào mầm phôi đơn bội, và chỉ chứa gene trong nhiễm sắc thể đơn bội.[31]:20.2 Giao tử phát sinh từ con cái gọi là trứng hay ova, và giao tử phát sinh từ con đực gọi là tinh trùng. Hai giao tử kết hợp với nhau tạo thành hợp tử lưỡng bội trứng đã được thụ tinh, một tế bào trong nó chứa hai tập hợp gene, với một bản sao của mỗi gene đến từ con cái và một bản sao còn lại từ con đực.[31]:20

Trong quá trình phân bào giảm phân, thỉnh thoảng xuất hiện sự kiện tái tổ hợp di truyền hay trao đổi chéo ở một số đoạn giữa hai nhiễm sắc thể tương đồng, kéo theo sự trao đổi các gen giữa chúng. Ở sự kiện này, một đoạn DNA trên một chromatid được hoán vị bằng một đoạn DNA có độ dài bằng nhau nằm trên chromatid tương đồng khác chị em. Hiện tượng này có thể dẫn đến sự tổ chức lại các allele đã có liên kết với nhau.[31]:5.5 Quy luật phân ly độc lập của Mendel khẳng định mỗi gene từ bố hoặc mẹ cho mỗi tính trạng sẽ xắp sếp một cách độc lập trong giao tử; hay các allele của các gene khác nhau thì phân ly một cách độc lập với nhau trong quá trình hình thành giao tử. Điều này chỉ đúng cho những gene mà không nằm trên cùng một nhiễm sắc thể, hoặc nằm trên cùng một nhiễm sắc thể nhưng cách rất xa nhau. Hai gene nằm càng gần nhau trên cùng một nhiễm sắc thể, chúng sẽ càng có mặt cùng nhau trong giao tử và các tính trạng chúng biểu hiện sẽ xuất hiện cùng nhau thường xuyên; những gene nằm rất gần nhau hoặc cạnh nhau về cơ bản không bao giờ bị tách biệt bởi vì rất hiếm khi điểm trao đổi chéo sẽ xuất hiện giữa hai gene này. Đây là cơ sở của hiện tượng di truyền liên kết gene hoàn toàn (genetic linkage).[63]

Ruồi giấm Drosophila melanogaster đã được nhà di truyền học người Mỹ, Thomas Hunt Morgan (1866-1945), sử dụng trong nghiên cứu di truyền học từ những năm đầu của thế kỷ XX, trong khi đang làm việc tại Học viện Công nghệ California. Nhờ sử dụng ruồi giấm này, Morgan và các cộng sự của mình đã xây dựng thành công học thuyết di truyền nhiễm sắc thể. Lý thuyết này đã khẳng định gene - đơn vị di truyền then chốt đóng ba vai trò: (i) Gene là đơn vị chức năng, nghĩa là gene được xem như một thể thống nhất toàn vẹn kiểm soát một tính trạng cụ thể. (ii) Gene là đơn vị tái tổ hợp, nghĩa là gene không bị chia nhỏ bởi sự trao đổi chéo (vì theo quan điểm này, trao đổi chéo không xảy ra bên trong phạm vi một gene mà chỉ xảy ra giữa các gene); như thế gene được coi là đơn vị cấu trúc cơ sở của vật chất di truyền, nhiễm sắc thể. (iii) Gene là đơn vị đột biến, nghĩa là nếu đột biến xảy ra trong gene dù ở bất kỳ vị trí nào hoặc với phạm vi ra sao, chỉ gây ra một trạng thái cấu trúc mới tương ứng với một kiểu hình mới, kiểu hình đột biến, khác với kiểu hình bình thường. Tuy nhiên, quan niệm này vẫn còn chưa rõ ràng và không thực sự chính xác theo quan điểm của di truyền học hiện đại[62]

Các biến đổi ở mức phân tử

Đột biến

Giai đoạn tái bản DNA diễn ra phần lớn có độ chính xác cao, tuy vậy cũng có lỗi (đột biến) xảy ra.[31]:7.6 Tần suất lỗi ở tế bào sinh vật nhân thực có thể thấp ở mức 10−8 trên nucleotide trong mỗi lần tái bản,[64][65] trong khi ở một số virus RNA có thể cao tới mức 10−3.[66] Điều này có nghĩa là ở mỗi thế hệ, trong bộ gene ở người thu thêm 1–2 đột biến mới.[66] Những đột biến nhỏ xuất hiện từ quá trình tái bản DNA và hậu quả từ phá hủy DNA và bao gồm đột biến điểm trong đó một base bị thay đổi và đột biến dịch chuyển khung trong đó một base được thêm vào hay bị xóa. Hoặc là những đột biến này làm thay đổi gene theo cách làm sai nghĩa (missense mutation, thay đổi một codon làm nó mã hóa cho axit amin khác) hoặc làm cho gene trở nên vô nghĩa (nonsense mutation, làm quá trình tái bản DNA sớm kết thúc khi đọc đến codon kết thúc và sản phẩm gene là protein không hoạt động được).[67] Những đột biến lớn hơn có thể gây ra lỗi trong tái tổ hợp dẫn đến những bất thường ở nhiễm sắc thể (chromosomal abnormality) bao gồm nhân đôi một gene (gene duplication), xóa, sắp xếp lại hoặc đảo ngược những đoạn dài trong một NST. Thêm vào đó, cơ chế sửa chữa DNA có thể dẫn ra vài đột biến mới khi thực hiện sửa chữa những sai hỏng vật lý ở phân tử. Sự sửa chữa, ngay cả khi đi kèm với đột biến, là quan trọng hơn đối với sự tồn tại hơn là khôi phục lại bản sao chính xác, ví dụ khi thực hiện sửa chữa chuỗi xoắn kép bị gãy.[31]:5.4

Khi nhiều allele khác nhau của cùng một gene có mặt trong quần thể một loài thì hiện tượng này được gọi là đa hình (polymorphism). Phần lớn các allele khác nhau hoạt động tương tự nhau, tuy nhiên ở một số allele có thể làm xuất hiện các tính trạng kiểu hình khác nhau. Allele phổ biến nhất của một gene được gọi là kiểu dại (wild type), và những allele hiếm được gọi là allele đột biến. Biến dị di truyền trong tần số tương đối của các allele khác nhau trong một quần thể có nguyên nhân từ cả chọn lọc tự nhiênbiến động di truyền (genetic drift, những sự biến đổi ngẫu nhiên vô hướng về tần số allele trong tất cả các quần thể, nhưng đặc biệt là ở các quần thể nhỏ).[68]

Phần lớn các đột biến bên trong các gene là đột biến trung tính (neutral mutation), không có ảnh hưởng đến kiểu hình của sinh vật (đột biến lặng, silent mutation). Một số đột biến không làm thay đổi trình tự axit amin bởi vì một số codon mã hóa cho cùng một axit amin (đột biến đồng nghĩa, synonymous mutation). Các đột biến khác trở thành trung tính nếu tuy nó làm thay đổi trình tự axit amin, nhưng protein vẫn gập nếp và hoạt động bình thường với axit amin mới (đột biến bảo toàn, conservative mutation). Tuy nhiên, nhiều đột biến là có hại (deleterious mutation) hay thậm chí gây chết (lethal allele), và bị loại bỏ khỏi quần thể bằng quá trình chọn lọc. Rối loạn di truyền (genetic disorders) là kết quả của các đột biến có hại và có thể do đột biến tự phát trong cá thể bị ảnh hưởng, hoặc có thể di truyền sang thế hệ sau. Cuối cùng, có một tỷ lệ nhỏ các đột biến là có lợi (beneficial mutation), tăng cường độ phù hợp (fitness) ở sinh vật, và trở thành một trong những luận điểm quan trọng của thuyết tiến hóa tổng hợp hiện đại, vì trong chọn lọc có hướng dẫn đến tiến hóa thích nghi.[31]:7.6

  1. ^ a b Gericke, Niklas Markus; Hagberg, Mariana (5 tháng 12 năm 2006). “Definition of historical models of gene function and their relation to students' understanding of genetics”. Science & Education. 16 (7–8): 849–881. Bibcode:2007Sc&Ed..16..849G. doi:10.1007/s11191-006-9064-4.
  2. ^ Pearson H (tháng 5 năm 2006). “Genetics: what is a gene?”. Nature. 441 (7092): 398–401. Bibcode:2006Natur.441..398P. doi:10.1038/441398a. PMID 16724031.
  3. ^ a b c Pennisi E (tháng 6 năm 2007). “Genomics. DNA study forces rethink of what it means to be a gene”. Science. 316 (5831): 1556–1557. doi:10.1126/science.316.5831.1556. PMID 17569836.
  4. ^ a b Johannsen, W. (1905). Arvelighedslærens elementer ("The Elements of Heredity". Copenhagen). Rewritten, enlarged and translated into German as Elemente der exakten Erblichkeitslehre (Jena: Gustav Fischer, 1905; Scanned full text.
  5. ^ Noble D (tháng 9 năm 2008). “Genes and causation” (Free full text). Philosophical Transactions of the Royal Society of London. Series A, Mathematical and Physical Sciences. 366 (1878): 3001–3015. Bibcode:2008RSPTA.366.3001N. doi:10.1098/rsta.2008.0086. PMID 18559318.
  6. ^ Magner, Lois N. (2002). History of the Life Sciences . New York: Marcel Dekker, Inc. tr. 380. ISBN 978-0-2039-1100-6.
  7. ^ Gros, Franc̜ois (1992). The Gene Civilization . New York: McGraw Hill. tr. 28. ISBN 978-0-07-024963-9.
  8. ^ Moore, Randy (2001). “The "Rediscovery" of Mendel's Work” (PDF). Bioscene. 27 (2): 13–24. Bản gốc (PDF) lưu trữ ngày 11 tháng 2 năm 2016. Đã bỏ qua tham số không rõ |deadurl= (gợi ý |url-status=) (trợ giúp)
  9. ^ “genesis”. Từ điển tiếng Anh Oxford . Nhà xuất bản Đại học Oxford. (Subscription or participating institution membership required.)
  10. ^ Magner, Lois N. (2002). A History of the Life Sciences . Marcel Dekker, CRC Press. tr. 371. ISBN 978-0-203-91100-6.
  11. ^ Henig, Robin Marantz (2000). The Monk in the Garden: The Lost and Found Genius of Gregor Mendel, the Father of Genetics. Boston: Houghton Mifflin. tr. 1–9. ISBN 978-0395-97765-1.Quản lý CS1: ref=harv (liên kết)
  12. ^ Vries, H. de, Intracellulare Pangenese, Verlag von Gustav Fischer, Jena, 1889. Translated in 1908 from German to English by C. Stuart Gager as Intracellular Pangenesis, Open Court Publishing Co., Chicago, 1910
  13. ^ “The Chromosomes in Heredity” (PDF). Biological Bulletin. 4: 231-251. 1903.
  14. ^ a b c Gerstein MB và đồng nghiệp (tháng 6 năm 2007). “What is a gene, post-ENCODE? History and updated definition”. Genome Research. 17 (6): 669–681. doi:10.1101/gr.6339607. PMID 17567988. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  15. ^ Fisher, R. A.; De Beer, G. R. (1947). “Thomas Hunt Morgan. 1866-1945”. Obituary Notices of Fellows of the Royal Society. 5 (15): 451–466. doi:10.1098/rsbm.1947.0011. JSTOR 769094.
  16. ^ Avery, OT; MacLeod, CM; McCarty, M (1944). “Studies on the Chemical Nature of the Substance Inducing Transformation of Pneumococcal Types: Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type III”. The Journal of Experimental Medicine. 79 (2): 137–58. doi:10.1084/jem.79.2.137. PMC 2135445. PMID 19871359. Reprint: Avery, OT; MacLeod, CM; McCarty, M (1979). “Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Inductions of transformation by a desoxyribonucleic acid fraction isolated from pneumococcus type III”. The Journal of Experimental Medicine. 149 (2): 297–326. doi:10.1084/jem.149.2.297. PMC 2184805. PMID 33226.
  17. ^ Hershey, AD; Chase, M (1952). “Independent functions of viral protein and nucleic acid in growth of bacteriophage”. The Journal of General Physiology. 36 (1): 39–56. doi:10.1085/jgp.36.1.39. PMC 2147348. PMID 12981234.
  18. ^ Judson, Horace (1979). The Eighth Day of Creation: Makers of the Revolution in Biology. Cold Spring Harbor Laboratory Press. tr. 51–169. ISBN 0-87969-477-7.
  19. ^ Watson, J. D.; Crick, FH (1953). “Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid” (PDF). Nature. 171 (4356): 737–8. Bibcode:1953Natur.171..737W. doi:10.1038/171737a0. PMID 13054692.
  20. ^ Benzer S (1955). “Fine Structure of A Genetic Region in Bacteriophage”. Proc. Natl. Acad. Sci. U.S.A. 41 (6): 344–54. doi:10.1073/pnas.41.6.344. PMC 528093. PMID 16589677.
  21. ^ Benzer S (1959). “On the Topology of the Genetic Fine Structure”. Proc. Natl. Acad. Sci. U.S.A. 45 (11): 1607–20. doi:10.1073/pnas.45.11.1607. PMC 222769. PMID 16590553.
  22. ^ a b Beadle G.W, Tatum E.L (15 tháng 11 năm 1941). “Genetic Control of Biochemical Reactions in Neurospora”. PNAS. 27 (11): 499–506. Bibcode:1941PNAS...27..499B. doi:10.1073/pnas.27.11.499. PMC 1078370. PMID 16588492.Quản lý CS1: sử dụng tham số tác giả (liên kết)
  23. ^ Berg P, Singer M. George Beadle, an uncommon farmer: the emergence of genetics in the 20th century, CSHL Press, 2003. ISBN 0-87969-688-5, ISBN 978-0-87969-688-7
  24. ^ M, Fiers W và đồng nghiệp (tháng 5 năm 1972). “Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein”. Nature. 237 (5350): 82–8. Bibcode:1972Natur.237...82J. doi:10.1038/237082a0. PMID 4555447. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  25. ^ Sanger, F; và đồng nghiệp (1977). “DNA sequencing with chain-terminating inhibitors”. Proceedings of the National Academy of Sciences of the United States of America. 74 (12): 5463–7. Bibcode:1977PNAS...74.5463S. doi:10.1073/pnas.74.12.5463. PMC 431765. PMID 271968. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  26. ^ Adams, Jill U. (2008). “DNA Sequencing Technologies”. Nature Education Knowledge. SciTable. Nature Publishing Group. 1 (1): 193.
  27. ^ Huxley, Julian (1942). Evolution: the Modern Synthesis. Cambridge, Mass.: MIT Press. ISBN 978-0262513661.
  28. ^ Williams, George C. (2001). Adaptation and Natural Selection a Critique of Some Current Evolutionary Thought . Princeton: Princeton University Press. ISBN 9781400820108.
  29. ^ Dawkins, Richard (1977). The selfish gene . London: Oxford University Press. ISBN 0-19-857519-X.
  30. ^ Dawkins, Richard (1989). The extended phenotype . Oxford: Oxford University Press. ISBN 0-19-286088-7.
  31. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah Alberts, Bruce; Johnson, Alexander; Lewis, Julian; Raff, Martin; Roberts, Keith; Walter, Peter (2002). Molecular Biology of the Cell . New York: Garland Science. ISBN 978-0-8153-3218-3. Đã bỏ qua tham số không rõ |name-list-format= (gợi ý |name-list-style=) (trợ giúp)
  32. ^ Stryer L, Berg JM, Tymoczko JL (2002). Biochemistry (ấn bản 5). San Francisco: W.H. Freeman. ISBN 0-7167-4955-6.
  33. ^ Bolzer, Andreas; và đồng nghiệp (2005). “Three-Dimensional Maps of All Chromosomes in Human Male Fibroblast Nuclei and Prometaphase Rosettes”. PLoS Biology. 3 (5): e157. doi:10.1371/journal.pbio.0030157. PMC 1084335. PMID 15839726. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp) Ấn phẩm cho phép truy cập mở - đọc miễn phí
  34. ^ Braig M, Schmitt CA (tháng 3 năm 2006). “Oncogene-induced senescence: putting the brakes on tumor development”. Cancer Research. 66 (6): 2881–4. doi:10.1158/0008-5472.CAN-05-4006. PMID 16540631.
  35. ^ Bennett, PM (tháng 3 năm 2008). “Plasmid encoded antibiotic resistance: acquisition and transfer of antibiotic resistance genes in bacteria”. British Journal of Pharmacology. 153 Suppl 1: S347–57. doi:10.1038/sj.bjp.0707607. PMC 2268074. PMID 18193080.
  36. ^ International Human Genome Sequencing Consortium (tháng 10 năm 2004). “Finishing the euchromatic sequence of the human genome”. Nature. 431 (7011): 931–45. Bibcode:2004Natur.431..931H. doi:10.1038/nature03001. PMID 15496913.
  37. ^ a b Shafee, Thomas; Lowe, Rohan (2017). “Eukaryotic and prokaryotic gene structure”. WikiJournal of Medicine. 4 (1). doi:10.15347/wjm/2017.002. ISSN 2002-4436.
  38. ^ Mortazavi A và đồng nghiệp (tháng 7 năm 2008). “Mapping and quantifying mammalian transcriptomes by RNA-Seq”. Nature Methods. 5 (7): 621–8. doi:10.1038/nmeth.1226. PMID 18516045. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  39. ^ Pennacchio, L. A.; và đồng nghiệp (2013). “Enhancers: Five essential questions”. Nature Reviews Genetics. 14 (4): 288–95. doi:10.1038/nrg3458. PMC 4445073. PMID 23503198. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  40. ^ Maston, G. A.; và đồng nghiệp (2006). “Transcriptional Regulatory Elements in the Human Genome”. Annual Review of Genomics and Human Genetics. 7: 29–59. doi:10.1146/annurev.genom.7.080505.115623. PMID 16719718. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  41. ^ Mignone, Flavio; và đồng nghiệp (28 tháng 2 năm 2002). “Untranslated regions of mRNAs”. Genome Biology. 3 (3): reviews0004. doi:10.1186/gb-2002-3-3-reviews0004. ISSN 1465-6906. PMC 139023. PMID 11897027. “Và đồng nghiệp” được ghi trong: |last= (trợ giúp)
  42. ^ Bicknell AA và đồng nghiệp (tháng 12 năm 2012). “Introns in UTRs: why we should stop ignoring them”. BioEssays. 34 (12): 1025–34. doi:10.1002/bies.201200073. PMID 23108796. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  43. ^ Salgado, H.; và đồng nghiệp (2000). “Operons in Escherichia coli: Genomic analyses and predictions”. Proceedings of the National Academy of Sciences. 97 (12): 6652–6657. Bibcode:2000PNAS...97.6652S. doi:10.1073/pnas.110147297. PMC 18690. PMID 10823905. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  44. ^ Blumenthal, Thomas (tháng 11 năm 2004). “Operons in eukaryotes”. Briefings in Functional Genomics & Proteomics. 3 (3): 199–211. doi:10.1093/bfgp/3.3.199. ISSN 2041-2649. PMID 15642184.
  45. ^ a b Jacob F; Monod J (tháng 6 năm 1961). “Genetic regulatory mechanisms in the synthesis of proteins”. Journal of Molecular Biology. 3 (3): 318–56. doi:10.1016/S0022-2836(61)80072-7. PMID 13718526.
  46. ^ Spilianakis CG và đồng nghiệp (tháng 6 năm 2005). “Interchromosomal associations between alternatively expressed loci”. Nature. 435 (7042): 637–45. Bibcode:2005Natur.435..637S. doi:10.1038/nature03574. PMID 15880101. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  47. ^ Williams, A; và đồng nghiệp (tháng 4 năm 2010). “Interchromosomal association and gene regulation in trans”. Trends in Genetics. 26 (4): 188–97. doi:10.1016/j.tig.2010.01.007. PMC 2865229. PMID 20236724. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  48. ^ Horowitz NH và đồng nghiệp (2004). “A centennial: George W. Beadle, 1903-1989”. Genetics. 166 (1): 1–10. doi:10.1534/genetics.166.1.1. PMC 1470705. PMID 15020400. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  49. ^ Marande W, Burger G (tháng 10 năm 2007). “Mitochondrial DNA as a genomic jigsaw puzzle”. Science. AAAS. 318 (5849): 415. Bibcode:2007Sci...318..415M. doi:10.1126/science.1148033. PMID 17947575.
  50. ^ Parra G và đồng nghiệp (tháng 1 năm 2006). “Tandem chimerism as a means to increase protein complexity in the human genome”. Genome Research. 16 (1): 37–44. doi:10.1101/gr.4145906. PMC 1356127. PMID 16344564. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  51. ^ a b Eddy SR (tháng 12 năm 2001). “Non-coding RNA genes and the modern RNA world”. Nat. Rev. Genet. 2 (12): 919–29. doi:10.1038/35103511. PMID 11733745.
  52. ^ Crick F và đồng nghiệp (1961). “General nature of the genetic code for proteins”. Nature. 192: 1227–32. doi:10.1038/1921227a0. PMID 13882203. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  53. ^ Crick, Francis (1962). The genetic code. WH Freeman and Company. PMID 13882204.
  54. ^ Woodson SA (tháng 5 năm 1998). “Ironing out the kinks: splicing and translation in bacteria”. Genes & Development. 12 (9): 1243–7. doi:10.1101/gad.12.9.1243. PMID 9573040.
  55. ^ Koonin, Eugene V.; và đồng nghiệp (tháng 1 năm 1993). “Evolution and Taxonomy of Positive-Strand RNA Viruses: Implications of Comparative Analysis of Amino Acid Sequences”. Critical Reviews in Biochemistry and Molecular Biology. 28 (5): 375–430. doi:10.3109/10409239309078440. PMID 8269709. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  56. ^ Domingo, Esteban (2001). “RNA Virus Genomes”. ELS. doi:10.1002/9780470015902.a0001488.pub2. ISBN 0470016175.
  57. ^ Domingo, E; và đồng nghiệp (tháng 6 năm 1996). “Basic concepts in RNA virus evolution”. FASEB Journal. 10 (8): 859–64. PMID 8666162. “Và đồng nghiệp” được ghi trong: |first1= (trợ giúp)
  58. ^ Morris, KV; Mattick, JS (tháng 6 năm 2014). “The rise of regulatory RNA”. Nature Reviews Genetics. 15 (6): 423–37. doi:10.1038/nrg3722. PMC 4314111. PMID 24776770.
  59. ^ Miko, Ilona (2008). “Gregor Mendel and the Principles of Inheritance”. Nature Education Knowledge. SciTable. Nature Publishing Group. 1 (1): 134.
  60. ^ Chial, Heidi (2008). “Mendelian Genetics: Patterns of Inheritance and Single-Gene Disorders”. Nature Education Knowledge. SciTable. Nature Publishing Group. 1 (1): 63.
  61. ^ McCarthy D và đồng nghiệp (1976). “DNA elongation rates and growing point distributions of wild-type phage T4 and a DNA-delay amber mutant”. J. Mol. Biol. 106 (4): 963–81. doi:10.1016/0022-2836(76)90346-6. PMID 789903. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  62. ^ a b Mader, Sylvia (2007). Biology Ninth Edition. New York: McGraw-Hill. tr. 209. ISBN 978-0-07-325839-3.
  63. ^ Lobo, Ingrid; Shaw, Kelly (2008). “Discovery and Types of Genetic Linkage”. Nature Education Knowledge. SciTable. Nature Publishing Group. 1 (1): 139.
  64. ^ Nachman MW, Crowell SL (tháng 9 năm 2000). “Estimate of the mutation rate per nucleotide in humans”. Genetics. 156 (1): 297–304. PMC 1461236. PMID 10978293.
  65. ^ Roach JC và đồng nghiệp (tháng 4 năm 2010). “Analysis of genetic inheritance in a family quartet by whole-genome sequencing”. Science. 328 (5978): 636–9. Bibcode:2010Sci...328..636R. doi:10.1126/science.1186802. PMC 3037280. PMID 20220176. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  66. ^ a b Drake JW và đồng nghiệp (tháng 4 năm 1998). “Rates of spontaneous mutation”. Genetics. 148 (4): 1667–86. PMC 1460098. PMID 9560386. “Và đồng nghiệp” được ghi trong: |authors= (trợ giúp)Quản lý CS1: sử dụng tham số tác giả (liên kết)
  67. ^ “What kinds of gene mutations are possible?”. Genetics Home Reference. United States National Library of Medicine. 11 tháng 5 năm 2015. Truy cập ngày 19 tháng 5 năm 2015.
  68. ^ Andrews, Christine A. (2010). “Natural Selection, Genetic Drift, and Gene Flow Do Not Act in Isolation in Natural Populations”. Nature Education Knowledge. SciTable. Nature Publishing Group. 3 (10): 5.