Cấu trúc bậc một của protein

Cấu trúc bậc một của protein là chuỗi thẳng của các amino acid trong một chuỗi peptide hay protein.^[1] Theo quy ước, cấu trúc bậc một của một protein được tính bắt đầu từ đầu amino-tận cùng (N) đến đầu carboxyl-tận cùng (C). Quá trình sinh tổng hợp protein thường được thực hiện bởi ribosome trong tế bào. Peptide cũng có thể được tổng hợp trong phòng thí nghiệm. Cấu trúc bậc một của protein có thể được giải trình tự trực tiếp, hoặc suy ra từ trình tự DNA.

Sự hình thành

Sinh học

amino acid được polyme hóa thông qua các liên kết peptide tạo thành một mạch "xương sống" dài, với các chuỗi bên amino acid khác nhau nhô ra dọc theo nó. Trong các hệ thống sinh học, các protein được tạo ra trong quá trình dịch mã bởi các ribosome của tế bào. Một số sinh vật cũng có thể tạo ra các chuỗi peptide ngắn bằng tổng hợp peptide không ribosome, thường sử dụng các amino acid khác với 20 loại tiêu chuẩn, và có thể được vòng hóa, biến đổi hoặc liên kết chéo.

Hóa học

Peptide có thể được tổng hợp hóa học thông qua một loạt các phương pháp dùng trong phòng thí nghiệm. Các phương pháp hóa học thường tổng hợp peptide theo trình tự ngược lại với tổng hợp protein sinh học (túc là bắt đầu từ đầu cuối C ngược trở lại).

Ký hiệu

Trình tự protein thường được ký hiệu bằng một chuỗi các chữ cái, liệt kê các amino acid bắt đầu từ đầu cuối thiết bị đầu amino đến đầu tận cùng carboxyl. Có thể sử dụng mã ba chữ cái hoặc mã một chữ cái để thể hiện 20 amino acid tự nhiên, cũng như ký hiệu một tổ hợp hoặc amino acid còn mơ hồ (tương tự ký hiệu axit nucleic).^[1]^[2]^[3]

Peptide có thể được giải trình tự trực tiếp, hoặc suy ra từ chuỗi DNA. Các cơ sở dữ liệu trình tự lớn được lập ra để lưu và so sánh các chuỗi protein đã biết.

Ký hiệu cho 20 amino acid tự nhiên
amino acid	3 chữ cái^[4]	1-chữ cái^[4]
Alanine	Ala	A
Arginine	Arg	R
Asparagine	Asn	N
Axit aspartic	Asp	D
Cysteine	Cys	C
Axit glutamic	Glu	E
Glutamine	Gln	Q
Glycine	Gly	G
Histidine	His	H
Isoleucine	Ile	I
Leucine	Leu	L
Lysine	Lys	K
Methionine	Met	M
Phenylalanine	Phe	F
Proline	Pro	P
Serine	Ser	S
Threonine	Thr	T
Tryptophan	Trp	W
Tyrosine	Tyr	Y
Valine	Val	V

Ký hiệu cho các amino acid không chắc chắn
Ký hiệu	Mô tả	amino acid thể hiện
X	Bất cứ acid nào, hoặc không biết	Tất cả
B	Aspartate hoặc Asparagine	D, N
Z	Glutamate hoặc Glutamine	E, Q
J	Leucine hoặc Isoleucine	I, L
Φ	Kỵ nước	V, I, L, F, W, Y, M
Ω	Hợp chất có vòng	F, W, Y, H
Ψ	Hợp chất không vòng	V, I, L, M
π	Nhỏ	P, G, A, S
ζ	Ưa nước	S, T, H, N, Q, E, D, K, R
+	Tích điện dương	K, R, H
-	Tích điện âm	D, E

Chú thích

^ ^a ^b SANGER F (1952). “The arrangement of amino acids in proteins”. Adv. Protein Chem. 7: 1–67. doi:10.1016/S0065-3233(08)60017-0. PMID 14933251.
^ Aasland, Rein; Abrams, Charles; Ampe, Christophe; Ball, Linda J.; Bedford, Mark T.; Cesareni, Gianni; Gimona, Mario; Hurley, James H.; Jarchau, Thomas (ngày 20 tháng 2 năm 2002). “Normalization of nomenclature for peptide motifs as ligands of modular protein domains”. FEBS Letters. 513 (1): 141–144. doi:10.1016/S0014-5793(01)03295-1. ISSN 1873-3468.
^ Aasland R, Abrams C, Ampe C, Ball LJ, Bedford MT, Cesareni G, Gimona M, Hurley JH, Jarchau T, Lehto VP, Lemmon MA, Linding R, Mayer BJ, Nagai M, Sudol M, Walter U, Winder SJ (ngày 1 tháng 7 năm 1968). “A One-Letter Notation for Amino Acid Sequences*”. European Journal of Biochemistry. 5 (2): 151–153. doi:10.1111/j.1432-1033.1968.tb00350.x. ISSN 1432-1033. PMID 11911894.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
^ ^a ^b Hausman, Robert E.; Cooper, Geoffrey M. (2004). The cell: a molecular approach. Washington, D.C: ASM Press. tr. 51. ISBN 0-87893-214-3.

[sanger-1] SANGER F (1952). “The arrangement of amino acids in proteins”. Adv. Protein Chem. 7: 1–67. doi:10.1016/S0065-3233(08)60017-0. PMID 14933251.

[letter-2] Aasland, Rein; Abrams, Charles; Ampe, Christophe; Ball, Linda J.; Bedford, Mark T.; Cesareni, Gianni; Gimona, Mario; Hurley, James H.; Jarchau, Thomas (ngày 20 tháng 2 năm 2002). “Normalization of nomenclature for peptide motifs as ligands of modular protein domains”. FEBS Letters. 513 (1): 141–144. doi:10.1016/S0014-5793(01)03295-1. ISSN 1873-3468.

[3] Aasland R, Abrams C, Ampe C, Ball LJ, Bedford MT, Cesareni G, Gimona M, Hurley JH, Jarchau T, Lehto VP, Lemmon MA, Linding R, Mayer BJ, Nagai M, Sudol M, Walter U, Winder SJ (ngày 1 tháng 7 năm 1968). “A One-Letter Notation for Amino Acid Sequences*”. European Journal of Biochemistry. 5 (2): 151–153. doi:10.1111/j.1432-1033.1968.tb00350.x. ISSN 1432-1033. PMID 11911894.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)

[Hausman-4] Hausman, Robert E.; Cooper, Geoffrey M. (2004). The cell: a molecular approach. Washington, D.C: ASM Press. tr. 51. ISBN 0-87893-214-3.

[1]

[2]

[3]

[4]