Giáo trình Sinh học phân tử

Chương 1

Các đại phân tử sinh học

I. Nucleic acid

Nucleic acid, vật chất mang thông tin di truyền của các hệ thống sống, là một polymer hình thành từ các monomer là nucleotide. Mỗi nucleotide gồm ba thành phần: nhóm phosphate, đường pentose (đường 5 carbon) và một nitrogen base. Các nitrogen base thuộc hai nhóm: các purine gồm adenine (A) và guanine (G), các pyrimidine gồm thymine (T), cytosine (C) và uracil (U). Các nucleotide được nối với nhau bằng liên kết phosphodiester tạo thành chuỗi dài.

Nucleic acid gồm hai loại phân tử có cấu tạo rất giống nhau là deoxyribonucleic acid (DNA) và ribonucleic acid (RNA).

 1. Deoxyribonucleic acid 

Phân tử DNA là một chuỗi xoắn kép gồm hai sợi đơn. Mỗi sợi đơn là một chuỗi nucleotide (Hình 1.1). Mỗi nucleotide gồm ba thành phần: nhóm phosphate, đường deoxyribose và một trong bốn base (A, C, G và T) (Hình 1.2). Hai sợi đơn kết hợp với nhau nhờ các liên kết hydrogen hình thành giữa các base bổ sung nằm trên hai sợi: A bổ sung cho T và C bổ sung cho G. Mỗi sợi đơn có một trình tự định hướng với một đầu 5’phosphate tự do, đầu kia là 3’ hydroxyl tự do (quy ước là 5’®3’). Hướng của hai sợi đơn trong chuỗi xoắn kép ngược nhau, nên được gọi là hai sợi đối song.

Những phân tích cấu trúc hiện đại đã cho thấy cấu trúc của DNA không phải luôn luôn tương ứng với dạng được gọi là B mà Watson và Crick đã đưa ra. Do sự tác động của các hợp chất có khối lượng nhỏ hoặc protein, dạng B có thể chuyển sang dạng A (nén nhiều hơn) hoặc là dạng Z (xoắn trái). Chúng có thể tự gấp lại hoặc xoắn mạnh, ví dụ một sợi đôi DNA có độ dài là 20 cm được nén trong một chromosome có kích thước là 5 mm.

doc 219 trang thiennv 11/11/2022 3140
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Sinh học phân tử", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docgiao_trinh_sinh_hoc_phan_tu.doc

Nội dung text: Giáo trình Sinh học phân tử

  1. Hình 1.4. Các mức độ tổ chức của phân tử protein - Cấu trúc bậc 2. Là tương tác không gian giữa các gốc amino acid ở gần nhau trong chuỗi polypeptide. Cấu trúc được bền vững chủ yếu nhờ liên kết hydrogen hình thành giữa các liên kết peptide ở kề gần nhau, cách nhau những khoảng xác định. Cấu trúc bậc 2 của phân tử protein: xoắn ( -helix), lá phiến  và xoắn collagen. Loại -helix là sợi ở dạng xoắn ốc, cuộn xung quanh một trục, mỗi vòng xoắn có 3,6 gốc amino acid. Những sợi collagen chạy song song tạo nên những bó sợi dai của gân. Collagen cũng có trong xương và trong các mô nối. Elastin là một protein, gồm những sợi protein tương đối ngắn, gắn kết với nhau nhờ liên kết cộng hóa trị. Những chuỗi polypeptide quay theo dạng xoắn ốc, tự duỗi xoắn khi có áp lực. - Cấu trúc bậc 3. Là tương tác không gian giữa các gốc amino acid ở xa nhau trong chuỗi polypeptide, là dạng cuộn lại trong không gian của toàn chuỗi polypeptide. Nhiều chuỗi polypeptide trong cơ thể sống tồn tại không phải ở dạng thẳng mà gấp khúc và qua đó tạo nên cấu trúc không gian ba chiều. Tuy nhiên, cấu trúc này hoàn toàn xác định, chủ yếu là do trình tự các amino acid và môi trường. Khi một chuỗi polypeptide tách ra khỏi ribosome sau khi tổng hợp và được đưa vào trong tế bào chất như là môi trường tạo hình thì nó sẽ hình thành nên cấu trúc tự nhiên rất nhanh, đặc biệt đối với cấu trúc hình cầu, đem lại cho protein những đặc tính sinh lý quan trọng. Có thể do chuyển động nhiệt của các chuỗi polypeptide mà các nhóm của các gốc amino acid tiếp xúc với
  2. nhau, dẫn đến có thể kết hợp với nhau. Trong nhiều protein hình cầu có chứa các gốc cysteine, sự tạo thành các liên kết disulfite giữa các gốc cysteine ở xa nhau trong chuỗi polypeptide sẽ làm cho chuỗi bị cuộn lại đáng kể. Các liên kết khác, như liên kết Van der Waals, liên kết tĩnh điện, phân cực, kỵ nước và hydrogen giữa các mạch bên của các gốc amino acid đều tham gia làm bền vững cấu trúc bậc 3. Cấu trúc hình cầu của protein được gọi là cấu trúc bậc ba, đó chính là cấu trúc của enzyme. - Cấu trúc bậc 4. Là tương tác không gian giữa các chuỗi của các phân tử protein gồm hai hay nhiều chuỗi polypeptide hình cầu. Mỗi chuỗi polypeptide này được gọi là một tiểu đơn vị (subunit). Sự kết hợp giữa các phân tử này lỏng lẻo và chủ yếu là do liên kết hydrogen và kỵ nước. Bằng cách này hai phân tử xác định có thể kết hợp với nhau tạo thành một dimer. Chẳng hạn: hemoglobin được tạo nên từ hai chuỗi với mỗi chuỗi có 141 gốc amino acid và hai chuỗi  với mỗi chuỗi là 146 gốc amino acid. Cấu trúc của một hoặc nhiều chuỗi polypeptide có ý nghĩa quan trọng đối với độ hòa tan và chức năng của chúng. Cấu trúc protein được hiểu là sự sắp xếp của những chuỗi riêng lẻ hoặc nhiều chuỗi. Chúng phụ thuộc nhiều vào độ pH của môi trường. Protein và chuỗi polypeptide hòa tan tốt khi những nhóm ưa nước hướng ra phía ngoài, nhóm kỵ nước hướng vào bên trong. Khi một protein thay đổi cấu trúc thì những nhóm kỵ nước quay ra ngoài, protein mất khả năng hòa tan trong nước, ví dụ trường hợp kết tủa không ở dạng tinh thể của protein sữa trong môi trường chua. Lactic acid được sản sinh do vi khuẩn làm giảm pH sữa, làm thay đổi protein sữa. Nhiều nhóm kỵ nước được hướng ra bên ngoài, protein mất khả năng tan trong nước. Vì vậy, việc thường xuyên duy trì giá trị pH trong tế bào chất rất quan trọng, vì chỉ có như vậy chức năng hoạt động của các enzyme trong tế bào chất mới được đảm bảo. 2. Chức năng của protein Mỗi một hoạt động trong tế bào phụ thuộc vào một hoặc nhiều phân tử protein đặc hiệu. Một trong các cách phân loại protein là dựa vào chức năng sinh học của chúng. Bảng 1.2 tóm tắt sự phân loại protein theo chức năng và đưa ra một số ví dụ đại diện cho mỗi loại. Bảng 1.2. Các chức năng sinh học của protein và một số ví dụ
  3. 2.1. Chức năng enzyme Phần lớn protein là enzyme. Hiện nay, có hơn 3.000 loại enzyme đã được biết. Enzyme là chất xúc tác sinh học có vai trò làm tăng tốc độ phản ứng. Mỗi một bước trong trao đổi chất đều được xúc tác bởi enzyme. Enzyme có thể làm tăng tốc độ phản ứng lên 1016 lần so với tốc độ phản ứng không xúc tác. Sự kết hợp giữa enzyme và cơ chất xảy ra ở vị trí hoạt động của enzyme. 2.2. Protein điều khiển Một số protein không thực hiện bất kỳ sự biến đổi hóa học nào, tuy nhiên nó điều khiển các protein khác thực hiện chức năng sinh học, chẳng hạn insulin điều khiển nồng độ đường glucose trong máu. Đó là một protein nhỏ (5,7 kDa), gồm hai chuỗi polypeptide nối với nhau bằng các liên kết disulfite. Khi không đủ insulin thì sự tiếp nhận đường trong tế bào bị hạn chế. Vì vậy, mức đường trong máu tăng và dẫn đến sự thải đường mạnh mẽ qua nước tiểu (bệnh tiểu đường). Một nhóm protein khác tham gia vào sự điều khiển biểu hiện gen. Những protein này có đặc tính là gắn vào những trình tự DNA hoặc để hoạt hóa hoặc ức chế sự phiên mã thông tin di truyền sang mRNA, ví dụ chất ức chế (repressor) đình chỉ sự phiên mã. 2.3. Protein vận chuyển Làm nhiệm vụ vận chuyển chất đặc hiệu từ vị trí này sang vị trí khác, ví dụ vận chuyển O2 từ phổi đến các mô do hemoglobin hoặc vận chuyển acid béo từ mô dự trữ đến các cơ quan khác nhờ protein trong máu là serum albumin. Các chất được vận chuyển qua màng được thực hiện bằng các protein đặc hiệu, chẳng hạn vận chuyển glucose hoặc các amino acid qua màng (Hình 1.5). 2.4. Protein dự trữ Các protein là nguồn cung cấp các chất cần thiết được gọi là protein dự trữ. Protein là polymer của các amino acid và nitrogen thường là yếu tố hạn chế cho sinh trưởng, nên cơ thể phải có protein dự trữ để cung cấp đầy đủ nitrogen khi cần. Chẳng hạn, ovalbumin là protein dự trữ trong lòng trắng trứng cung cấp đủ nitrogen cho phôi phát triển. Casein là protein sữa cung cấp nitrogen cho động vật có vú còn non. Hạt ở thực vật bậc cao cũng
  4. chứa một lượng protein dự trữ lớn (khoảng 60%), cung cấp đủ nitrogen cho quá trình nảy mầm của hạt. Hình 1.5. Hai kiểu vận chuyển cơ bản. (a): vận chuyển bên trong hoặc giữa các tế bào hoặc mô. (b): vận chuyển vào hoặc ra khỏi tế bào. Protein cũng có thể dự trữ các chất khác ngoài thành phần amino acid (N, C, H, O và S), ví dụ ferritin là protein tìm thấy trong mô động vật kết hợp với Fe. Một phân tử ferritin (460 kDa) gắn với 4.500 nguyên tử Fe (chiếm 35% khối lượng). Protein có vai trò
  5. giữ lại kim loại Fe cần thiết cho sự tổng hợp những protein có chứa Fe quan trọng như hemoglobin. 2.5. Protein vận động và co rút Một số protein mang lại cho tế bào khả năng vận động, tế bào phân chia và co cơ. Các protein này có đặc điểm: chúng ở dạng sợi hoặc dạng polymer hóa để tạo sợi, chẳng hạn actin và myosin. Tubulin là thành phần cơ bản của thoi vô sắc (sợi xuất hiện khi phân chia các nhiễm sắc thể về các cực). 2.6. Protein cấu trúc Có chức năng tạo độ chắc và bảo vệ tế bào và mô. Chẳng hạn: -keratin là protein không tan, cấu tạo nên tóc, sừng và móng. Collagen là protein hình sợi có trong xương. Ở động vật collagen chiếm 1/3 protein tổng số. Fibroin (-keratin) là thành phần cơ bản của kén tằm. Một chức năng phổ biến khác của protein là cấu tạo nên màng sinh học. 2.7. Protein bảo vệ Trong việc giải độc các kim loại nặng, phytochelatin có một ý nghĩa quan trọng, đây là những polypeptide đơn giản có nguồn gốc từ glutation và có công thức chung như sau: (-glutamyl-cysteinyl)n-glycine Do có nhiều nhóm SH nên chúng có khả năng kết hợp chặt với các kim loại nặng, làm cho những kim loại nặng này không thể gây rối loạn trao đổi chất. Sự tổng hợp phytochelatin được kích thích bởi những kim loại nặng như Cd, Cu, Ag, Bi và Au. Protein bảo vệ có vai trò quan trọng trong các phản ứng miễn dịch. Động vật có xương sống có một cơ chế phức tạp và phát triển cao để ngăn ngừa những tác nhân vi sinh vật gây bệnh. Chức năng này có liên quan đến đặc tính của chuỗi polypeptide. Khi một protein lạ (có nguồn gốc virus, vi khuẩn hoặc nấm) xâm nhập vào máu hoặc vào mô thì phản ứng tự vệ của cơ thể sẽ xuất hiện rất nhanh. Protein lạ được gọi là kháng nguyên (antigen) chứa một vùng có trật tự xác định các nguyên tử có thể kết hợp với tế bào lympho và kích thích tế bào này sản sinh kháng thể. Những tế bào lympho tồn tại trong hệ thống miễn dịch với số lượng 10 9 và trên bề mặt của nó có những vùng nhận biết nơi mà kháng nguyên sẽ được kết hợp (Hình 1.6). Những vùng nhận biết này rất khác nhau và đặc hiệu cho từng loại kháng nguyên. Trong cơ thể luôn có sẵn một lượng lớn các tế bào lympho khác nhau và chúng có thể tổng hợp rất nhanh các kháng thể đặc hiệu khi
  6. kháng nguyên xuất hiện. Mỗi loại kháng thể có một vị trí kết hợp duy nhất đặc trưng với kháng nguyên. Khả năng bảo vệ của hệ miễn dịch đã làm cho protein lạ của tác nhân gây bệnh trở thành vô hại. Những kháng thể này được gọi là globulin miễn dịch. Chúng chiếm khoảng 20% protein tổng số trong máu. Một nhóm protein bảo vệ khác là protein làm đông máu thrombin và fibrinogen, ngăn cản sự mất máu của cơ thể khi bị thương. Cá ở các vùng cực của Trái đất có protein chống đông (antifreeze protein) có tác dụng bảo vệ máu khi nhiệt độ xuống dưới 0oC. 2.8. Protein lạ/ngoại lai Ví dụ monellin là một loại protein được tìm thấy ở một loại cây ở châu Phi, được coi là chất ngọt nhân tạo cho con người. Ở một số sinh vật biển như họ Trai tiết ra loại protein keo (glue protein), cho phép nó gắn chặt lên bề mặt. III. Lipid Mặc dù không mang hoạt tính sinh học cao như protein nhưng lipid cũng đóng một vai trò đặc biệt trong hệ thống sống. Chúng là nhân tố chính tạo nên các màng sinh học mà nếu thiếu thì mọi hoạt động của protein sẽ không thể phối hợp nhịp nhàng. Đơn vị cấu trúc của lipid là các acid béo. Mỗi acid béo được cấu tạo từ một mạch carbohydrate (gồm các nguyên tử C và H) gắn với một nhóm carboxyl có tính acid. Các acid béo khác nhau bởi độ dài của chúng, bởi số lượng và vị trí các liên kết đôi. Các acid béo không có liên kết đôi được gọi là các acid béo bão hòa, các acid béo không bão hòa có ít nhất một liên kết đôi.
  7. Hình 1.6. Sơ đồ biểu diễn của kháng thể và kháng nguyên. a: kháng thể gồm 4 chuỗi polypeptide. b: kháng thể kết hợp với kháng nguyên. c: kết hợp giữa kháng nguyên và kháng thể. Màng sinh học có chức năng là giới hạn những vùng trao đổi chất và tham gia vào việc vận chuyển các chất. Màng sinh học cũng có khả năng chuyển đi những tín hiệu. Protein màng cũng có thể là các enzyme. Chức năng này được thể hiện ở màng trong của ty thể và lạp thể. Màng sinh học bao gồm lớp kép lipid với những protein phân bố ở trong đó (Hình 1.7) Các lipid màng được hình thành từ một chuỗi dài acid béo nối với những nhóm có đặc tính ưa nước cao và được gọi là những phân tử lưỡng cực vì một đầu tương tác với nước, còn đầu kia thì kỵ nước. Bảng 1.3. Cấu trúc một số acid béo tiêu biểu trong hệ thống sống
  8. Hình 1.7. Sơ đồ biểu diễn một đoạn cắt của màng sinh học IV. Polysaccharide Các polysaccharide có nhiều chức năng quan trọng trong tế bào, chúng tham gia vào cấu tạo tế bào và là nguồn dự trữ năng lượng chủ yếu. Các polysaccharide được hình thành từ nhiều monomer, là các đường đơn giản (monosaccharide) nối với nhau bằng liên kết glycoside. Liên kết này được hình thành từ sự kết hợp giữa C 1 của một phân tử đường với nhóm hydroxyl của phân tử kế tiếp. Nguồn dự trữ tinh bột ở các tế bào động vật là glycogen, trong khi đó ở thực vật là tinh bột. Một polymer khác của glucose là cellulose thì tạo nên thành tế bào thực vật và là hợp chất hữu cơ hiện dịn nhiều nhất trong sinh quyển. Chúng ta vừa điểm qua riêng rẽ từng thành phần cấu tạo tế bào chính. Trong thực tế, hoạt động của chúng phối hợp mật thiết với nhau. Các nucleic acid trong tế bào thường kết hợp chặt chẽ với các protein tạo thành nucleoprotein. DNA của tế bào
  9. eukaryote thì được bọc bởi những protein đặc hiệu là các histone. Màng tế bào cũng không phải chỉ có phospholipid, chính các protein gắn trong màng đã tạo ra những đặc trưng riêng của màng sinh học. Một điểm cần lưu ý là nếu như cấu trúc và các tính chất hóa lý của nucleic acid, lipid và polysaccharide tương đối đồng nhất thì các protein lại hết sức đa dạng cả về cấu trúc và chức năng. Một phân tử protein thường bao gồm nhiều vùng mang những đặc tính khác nhau: vùng ưa nước hay kỵ nước, vùng gắn một đường, vùng có hoạt tính xúc tác, vùng liên kết với nucleic acid hay với một protein khác. Từ mỗi chức năng của tế bào, từ sự hình thành vật chất mang thông tin di truyền, truyền đạt thông tin di truyền, sự chuyển hóa năng lượng, sự liên lạc giữa các tế bào đều có sự tham gia của các protein. Điều kỳ diệu của sự sống là toàn bộ các hoạt động vô cùng đa dạng ấy được thực hiện bởi một phân tử duy nhất. Tài liệu tham khảo/đọc thêm 1. Hồ Huỳnh Thùy Dương. 1998. Sinh học phân tử. NXB Giáo dục, Hà Nội. 2. Alberts B, Bray D, Lewis J, Raff M, Roberts K and Watson JD. 2002. Molecular Biology of the Cell. 3rd ed. Garland Publishing, Inc. New York, USA. 3. Lewin B. 2000. Gene VII. Oxford University Press, Oxford, UK. 4. Lodish H, Berk A, Matsudaira P, Kaiser CA, Krieger M, Scott MP, Zipursky SL and Darnell J. 2004. Molecular Cell Biology. 5th ed. WH Freeman and Company, New York, USA. 5. Watson JD, Baker TA, Bell SP, Gann A, Levine M and Loscik R. 2004. Molecular Biology of the Gene. The Benjamin Cummings/Cold Spring Habor Laboratory Press, San Francisco, CA, USA. 6. Weaver RF. 2003. Molecular Biology. 2nd ed. McGraw-Hill Company Inc. New York, USA. 1S (Svedberg): đơn vị đo vận tốc lắng. Hệ số lắng của một tiểu đơn vị phụ thuộc không những vào khối lượng của tiểu đơn vị đó mà còn phụ thuộc vào hình dạng và độ rắn của nó, điều này giải thích tại sao sự kết hợp của hai tiểu đơn vị 50S và 30S lại tạo ra một ribosome 70S. Chương 2 Cấu trúc genome Genome (hệ gen, bộ gen) là thuật ngữ được dùng với các nghĩa khác nhau như sau:
  10. - Nguyên liệu di truyền của một cơ thể: 1) nhiễm sắc thể trong tế bào vi khuẩn (hoặc một trong mỗi loại nhiễm sắc thể nếu hơn một loại có mặt, ví dụ: các nhiễm sắc thể lớn hoặc bé của Vibrio cholerae), 2) DNA hoặc RNA trong một virion, 3) nhiễm sắc thể cùng với mọi plasmid được kết hợp (ví dụ: nhiễm sắc thể và hai plasmid nhỏ trong vi khuẩn Buchnera). - Tất cả các gen (khác nhau) trong tế bào hoặc virion. - Bộ nhiễm sắc thể đơn bội hoặc genome đơn bội trong tế bào. Chuỗi genome hoàn chỉnh (nghĩa là trình tự hoàn chỉnh của các nucleotide trong genome) đã được công bố cho một số loài vi khuẩn. Các trình tự khác cũng đã được công bố, ví dụ genome của cây cúc dại (Arabidopsis thaliana) và genome người. Genome chứa toàn bộ thông tin di truyền và các chương trình cần thiết cho cơ thể hoạt động. Ở các sinh vật nhân thật (eukaryote), 99% genome nằm trong nhân tế bào và phần còn lại nằm trong một số cơ quan tử như ty thể và lạp thể. Đa số genome vi khuẩn và phần genome chứa trong các cơ quan tử thường có kích thước nhỏ và ở dạng vòng khép kín. Ngược lại, phần genome trong nhân thường rất lớn và phân bố trên các nhiễm sắc thể dạng thẳng. Dự án genome là dự án xác định cấu trúc di truyền chính xác của một genome cơ thể sống, nghĩa là trình tự DNA của tất cả các gen của nó. Dự án genome của một số sinh vật mô hình (model organisms) đã được hoàn thành như sau: - Các genome vi khuẩn. Các trình tự hoàn chỉnh của genome Escherichia coli đã được xác định theo phương thức tổ hợp/tập hợp (consortium) của các phòng thí nghiệm. Năm 1995, hai trình tự genome hoàn chỉnh của vi khuẩn Haemophilus influenzae và Mycoplasma genitalium cũng được hoàn thành. Loài M. genitalium có một genome đơn giản (khoảng 580.067 base), do nó dựa vào vật chủ để vận hành nhiều bộ máy trao đổi chất của mình. Loài H. influenzae là một vi khuẩn đặc trưng hơn, và có genome khoảng 1.830.121 base với 1.749 gen. - Chuỗi genome hoàn chỉnh của nấm men Saccharomyces cerevisiae đã được hoàn chỉnh trong năm 1996, nhờ một consortium của các phòng thí nghiệm. Genome của chúng dài 12.146.000 base. - Các dự án genome ở động vật như: chuột, cừu, lợn, giun tròn (Caenorhabditis elegans), ruồi giấm (Drosophila melanogaster) , hoặc ở thực vật như: lúa nước, lúa mì, ngô, táo, cúc dại , mà nổi bật nhất trong số đó là dự án genome người cũng đã được thực hiện. Ngày 12. 2. 2001 genome người đã được công bố với khoảng 30.000 gen, ít hơn nhiều so với dự kiến trước đây (hàng trăm ngàn gen), và chỉ gấp hai lần giun tròn hoặc ruồi giấm. Người ta đã xác định hệ gen người giống 98% so với tinh tinh và có đến 99% là giống nhau giữa các dân tộc, các cá thể. Do đó, vấn đề hình thành và phát triển nhân
  11. cách, chỉ số thông minh phải chủ yếu trên cơ sở xã hội và sự rèn luyện của từng người để phát triển tiềm năng sinh học của bản thân. Trình tự genome của những sinh vật mô hình rất có ý nghĩa trong những nghiên cứu của một chuyên ngành khoa học mới đó là genome học (genomics). Dựa vào đây, các nhà sinh học phân tử có thể phân tích cấu trúc, hoạt động và chức năng của các gen, làm sáng tỏ được vai trò của DNA lặp lại, DNA không chứa mã di truyền, DNA nằm giữa các gen Điều đặc biệt có ý nghĩa là khi so sánh các genome với nhau, có thể hiểu được hoạt động của genome trong các cơ thể sống, mối quan hệ giữa chúng, sự đa dạng sinh học và mức độ tiến hóa. Kết quả bước đầu so sánh genome giữa các loài sinh vật với nhau đã cho thấy có ba đặc điểm nổi bật: 1) các gen phân bố trong genome không theo qui luật, 2) kích thước của genome thay đổi không tỷ lệ thuận (tương quan) với tính phức tạp của loài, 3) số lượng nhiễm sắc thể cũng rất khác nhau ngay giữa những loài rất gần nhau. I. Thành phần và đặc điểm của genome Genome chứa mọi thông tin di truyền đặc trưng cho từng loài, thậm chí cho từng cá thể trong loài. Genome có thể bao gồm các phân tử DNA hoặc RNA. Đối với sinh vật bậc cao, kích thước genome thay đổi từ 10 9 bp (động vật có vú) đến 10 11 bp (thực vật). Khác với tế bào tiền nhân (prokaryote), các gen trong genome của eukaryote thường tồn tại nhiều bản sao và thường bị gián đoạn bởi các đoạn mã mù không mang thông tin di truyền (các intron). Vì vậy, một trong những vấn đề đang được quan tâm là cần phải biết số lượng các gen khác nhau có mặt trong genome cũng như số lượng các gen hoạt động trong từng loại mô, từng giai đoạn phát triển và tỷ lệ các gen so với kích thước genome 1. Genome của cơ quan tử Hầu hết genome của cơ quan tử, nhưng không phải luôn luôn, có dạng phân tử DNA mạch vòng đơn của một chuỗi duy nhất. Genome của cơ quan tử mã hóa cho một số, không phải tất cả, các protein được tìm thấy trong cơ quan tử. Do có nhiều cơ quan tử trong một tế bào, cho nên có nhiều genome của cơ quan tử trên một tế bào. Mặc dù bản thân genome của cơ quan tử là duy nhất. Nhưng nó cấu tạo gồm một chuỗi lặp lại1 liên quan với mọi chuỗi không lặp lại2 của nhân. Về nguyên tắc, các gen cơ quan tử được phiên mã và dịch mã bởi các cơ quan tử. 1.1. Genome của ty thể DNA ty thể (mitochondrial DNA-mtDNA) là một genome độc lập, thường là mạch vòng, được định vị trong ty thể. - DNA ty thể của tế bào động vật mã hóa đặc trưng cho 13 protein, 2 rRNA và 22 tRNA.
  12. - DNA ty thể của nấm men S. cerevisiae dài hơn mtDNA của tế bào động vật năm lần do sự có mặt của các đoạn intron dài. Các genome ty thể có kích thước tổng số rất khác nhau, các tế bào động vật có kích thước genome nhỏ (khoảng 16,5 kb ở động vật có vú) (Hình 2.1). Có khoảng một vài trăm ty thể trên một tế bào. Mỗi ty thể có nhiều bản sao DNA. Số lượng tổng số của DNA ty thể so với DNA nhân là rất nhỏ (<1%). Trong nấm men S. cerevisiae, genome ty thể có kích thước khá lớn (khoảng 80 kb) và khác nhau tùy thuộc vào từng chủng. Có khoảng 22 ty thể trên một tế bào, tương ứng khoảng 4 genome trên một cơ quan tử. Ở những tế bào sinh trưởng, tỷ lệ mtDNA có thể cao hơn (khoảng 18%). Kích thước của genome ty thể ở các loài thực vật là rất khác nhau, tối thiểu khoảng 100 kb. Kích thước lớn của genome đã gây khó khăn cho việc phân lập nguyên vẹn DNA, nhưng bản đồ cắt hạn chế (restriction map) trong một vài loài thực vật đã cho thấy genome ty thể thường là một chuỗi đơn, được cấu tạo như một mạch vòng. Trong mạch vòng này có những chuỗi tương đồng ngắn và sự tái tổ hợp giữa chúng đã sinh ra các phân tử tiểu genome (subgenome) mạch vòng nhỏ hơn, cùng tồn tại với genome “chủ” (master genome) hoàn chỉnh, đã giải thích cho sự phức tạp của các DNA ty thể ở thực vật. Hình 2.1. DNA ty thể của người. Bao gồm 22 gen tRNA, 2 gen rRNA, và 13 vùng mã hóa protein.