Tế bào Gốc và Công nghệ Gen

Bạn đã từng thắc mắc: Cách thức đặt tên cho các gen ra sao?

Mở đầu

Bạn đã bao giờ tự hỏi làm thế nào để các nhà khoa học đặt tên cho các gen? Với việc có đến 20.000 đến 25.000 gen trong cơ thể người, việc đặt tên một cách hệ thống và chính xác là vô cùng quan trọng. Trong bài viết này, chúng ta sẽ cùng khám phá cách thức các điều kiện di truyền và các gen được đặt tên. Đôi khi, những quy tắc đặt tên này có thể rất phức tạp và đòi hỏi sự hợp tác của nhiều chuyên gia trong lĩnh vực y học và di truyền học.

Tham khảo/Tham vấn chuyên môn:

Trong bài viết này, các nguồn tham khảo chủ yếu được lấy từ các trang web uy tín như medlineplus.gov, sciencedirect.com, và genenames.org. Đây là những nguồn tri thức quan trọng giúp củng cố nội dung bài viết và mang lại độ chính xác cao nhất có thể.

Tuyên bố miễn trừ trách nhiệm

Nội dung từ các bài viết trên VietMek.com chỉ mang tính chất tham khảo, không thay thế cho lời khuyên, chẩn đoán hoặc điều trị y tế chuyên nghiệp. Vui lòng tham khảo ý kiến bác sĩ hoặc chuyên gia y tế trước khi áp dụng bất kỳ thông tin nào từ bài viết này.

Đặt tên cho các điều kiện di truyền

Trước tiên, chúng ta sẽ bắt đầu với việc đặt tên cho các điều kiện di truyền . Không giống như gen, các điều kiện di truyền không có quy tắc đặt tên chính thức và được đề xuất bởi một ủy ban nào đó. Thường thì các bác sĩ điều trị các gia đình mắc chứng rối loạn mới, chưa từng biết trước đây sẽ là những người đầu tiên đề xuất tên cho tình trạng này. Sau đó, các tên này có thể được sửa đổi bởi các chuyên gia chăm sóc sức khỏe, nhà nghiên cứu, và cả những người bị ảnh hưởng bởi tình trạng này.

Việc đặt tên cho gene rất quan trọng, vì nó cho phép giao tiếp chính xác và hiệu quả về các tình trạng cụ thể

Tên điều kiện thường bắt nguồn từ một hoặc kết hợp các nguồn sau:

  • Khiếm khuyết cơ bản về di truyền hoặc sinh hóa gây ra tình trạng này: Ví dụ, thiếu alpha-1 antitrypsin.
  • Gen trong đó biến thể (hoặc đột biến) gây ra tình trạng này: Ví dụ, chứng loạn dưỡng bạch cầu liên quan đến TUBE4A.
  • Dấu hiệu hoặc triệu chứng chính của rối loạn: Ví dụ, tăng amiăng máu kèm theo loạn trương lực cơ, bệnh đa hồng cầu và xơ gan do cryptogenic.
  • Các bộ phận của cơ thể bị ảnh hưởng bởi tình trạng này: Ví dụ, hội chứng não-phổi-tuyến giáp.
  • Tên của một bác sĩ hoặc nhà nghiên cứu: Ví dụ, hội chứng Marfan được đặt theo tên của Tiến sĩ Antoine Bernard-Jean Marfan.
  • Một khu vực địa lý: Ví dụ, sốt Địa Trung Hải có tính gia đình, xảy ra chủ yếu ở các quần thể giáp biển Địa Trung Hải.
  • Tên của bệnh nhân hoặc gia đình mắc bệnh: Ví dụ, bệnh xơ cứng teo cơ một bên, thường được gọi là bệnh Lou Gehrig theo tên một cầu thủ bóng chày nổi tiếng được chẩn đoán mắc bệnh này.

Điều này giúp mang lại sự rõ ràng trong việc giao tiếp về các tình trạng cụ thể và cuối cùng sẽ cải thiện việc chăm sóc cũng như hỗ trợ nhà nghiên cứu tìm ra các phương pháp điều trị mới.

Gen được đặt tên như thế nào?

Gen là đơn vị vật lý và chức năng cơ bản của tính di truyền, được tạo thành từ ADN. Một số gen đóng vai trò như những hướng dẫn tạo ra các phân tử protein, trong khi nhiều gen khác lại không mã hóa protein và có những chức năng khác.

Ước tính rằng số lượng gen trong cơ thể người từ 20.000 đến 25.000 gen, và mỗi người có hai bản sao của mỗi gen; một bản sao từ cha và một từ mẹ. Hầu hết các gen đều giống nhau ở tất cả mọi người, nhưng một số nhỏ gen (ít hơn 1% tổng số) khác nhau giữa mọi người, gọi là alen – các dạng khác nhau của cùng một gen.

Các nhà khoa học theo dõi các gen bằng cách đặt cho chúng những cái tên riêng. Do tên gen có thể dài nên các gen cũng được gán ký hiệu, là những tổ hợp ngắn của các chữ cái đại diện (và đôi khi là số) cho cách viết tắt của tên gen. Ví dụ, một gen nằm trên nhiễm sắc thể số 7 liên quan đến bệnh xơ nang được gọi là gen điều hòa độ dẫn truyền qua màng của bệnh xơ nang, ký hiệu là CFTR.

Ủy ban HUGO về danh mục gen (HGNC) chỉ định một tên chính thức và biểu tượng (viết tắt của tên) cho mỗi gen người biết đến. HGNC đã đặt tên cho hơn 19.000 trong số ước tính 20.000 đến 25.000 gen mã hóa protein trong bộ gen người. Dưới đây là cách thức HGNC đặt tên cho các loại gen khác nhau:

Gen mã hóa protein

Ủy ban HUGO đặt tên cho gen mã hóa protein dựa trên chức năng bình thường chính của sản phẩm gen.

Ủy ban HUGO về danh mục gen đặt tên các gen mã hóa protein dựa trên chức năng bình thường chính của sản phẩm gen. Trong trường hợp không có dữ liệu chức năng, các gen mã hóa protein có thể được đặt tên theo các cách sau:

  1. Dựa trên các miền cấu trúc được công nhận và mô típ được mã hóa bởi gen: Ví dụ, BEND7, “miền BEN chứa 7”.
  2. Dựa trên các gen tương đồng trong bộ gen người: Ví dụ, GPRIN3, “thành viên gia đình GPRIN 3”.
  3. Dựa trên các gen tương đồng từ một loài khác: Ví dụ, FEM1A, “gen tương đồng fem-1 A”.
  4. Chỉ dựa trên sự hiện diện của khung đọc mở: Ví dụ, C17orf50, “khung đọc mở 50 nhiễm sắc thể 17”.

Nếu có thể, các gen liên quan được đặt tên bằng cách sử dụng ký hiệu gốc chung để cho phép phân nhóm, thường dựa trên sự tương đồng về trình tự, chức năng được chia sẻ hoặc thành viên của phức hợp protein.

Gen giả (Pseudogenes)

Ủy ban HUGO về danh mục gen định nghĩa gen giả là một đoạn DNA không có khả năng tạo ra sản phẩm protein chức năng nhưng có mức độ tương đồng cao với gen chức năng. Chỉ đặt tên cho các gen giả có tính tương đồng với một tỷ lệ đáng kể của gen tổ tiên chức năng.

  • Gen giả đã qua xử lý: Được đặt tên dựa trên gen mẹ cụ thể, với số P và số được gắn vào biểu tượng gen gốc. Ví dụ: NACAP10 – “NACA pseudogene 10”.
  • Gen giả giữ lại hầu hết trình tự mã hóa so với các thành viên khác trong gia đình (thường chưa được xử lý): Được đặt tên là thành viên gia đình mới với hậu tố “P”. Ví dụ: DDX12P, “DEAD/H-box helicase 12, gen giả”.

Trong các trường hợp cụ thể, ký hiệu không bao gồm chữ “P” nếu ký hiệu đó đã quá quen thuộc, ví dụ: MMP23A – “matrix metallopeptidase 23A (gen giả)”.

Các gen ARN không mã hóa (ncARN)

Ủy ban HUGO đặt tên cho gen ARN không mã hóa (ncARN) theo loại ARN của chúng.

Ủy ban HUGO về danh mục gen đặt tên cho các gen ARN không mã hóa (ncARN) theo loại ARN của chúng. Đối với các ARN nhỏ, Ủy ban tuân theo quy ước đặt tên như sau:

  1. MicroRNAs: miRBase gán cho mỗi chuỗi vòng lặp gốc microRNA một ký hiệu “mir-#”, sau đó HGNC phê duyệt ký hiệu gen cho người dưới dạng MIR#. Ví dụ: MIR17 đại diện cho gen miRNA, mir-17 đại diện cho vòng lặp gốc và miR-17 đại diện cho miRNA trưởng thành.
  2. ARN vận chuyển (tRNA): GtRNAdb chỉ định ID duy nhất dưới dạng tRNA-[mã axit amin]-[anticodon]-[ID GtRNAdb]. Ví dụ: tRNA-Ala-AGC-1-1.
  3. ARN hạt nhân nhỏ: Được đặt tên bằng ký hiệu “RNU-#”, ví dụ: RNU1-1 (RNA, hạt nhân nhỏ U1-1).
  4. ARN nucleolar nhỏ: Được đặt tên với ký hiệu SNORD # cho RNA nucleolar nhỏ, hộp C/D, SNORA # cho RNA nucleolar nhỏ, hộp H/ACA, và SCARNA # cho RNA cụ thể của cơ thể Cajal. Ví dụ: SNORD1.
  5. RNA ribosome: Được đặt tên với các ký hiệu RNA45S, RNA28S, RNA18S, RNA5S, RNA5-8S.

Các ARN dài không mã hóa (lncRNA) được ưu tiên cung cấp các ký hiệu duy nhất dựa trên chức năng công bố tương tự như gen mã hóa protein. Các lncRNA có liên quan đến gen mã hóa protein có các định dạng như:

  • LncRNA có sự liên quan đến gen mã hóa protein: Được gán ký hiệu “LINC#” theo sau là số có 5 chữ số, ví dụ: LINC01018.
  • LncRNA trái nghĩa với khoảng gen của gen mã hóa protein: Được gán định dạng ký hiệu [ký hiệu gen mã hóa protein]-AS#, ví dụ: FAS-AS1.
  • LncRNA chia sẻ trình tự khởi động hai chiều với gen mã hóa protein: Được gán định dạng ký hiệu [ký hiệu gen mã hóa protein]-DT, ví dụ: ABCF1-DT.
  • LncRNA chứa trong intron của gen mã hóa protein: Được gán định dạng ký hiệu [ký hiệu gen mã hóa protein]-IT#, ví dụ: AOAH-IT1.
  • LncRNA chồng lên gen mã hóa protein trên cùng một sợi: Được gán định dạng ký hiệu [ký hiệu gen mã hóa protein]-OT#, ví dụ: C5-OT1.
  • LncRNA chứa các gen microRNA hoặc snoRNA: Được đặt tên là các gen chủ, ví dụ: MIR17HG, SNHG7.

Các gen bản sao đọc qua (Readthrough Transcripts)

Các bản sao đọc qua thường được tạo ra từ các locus lân cận và bao gồm các phần mã hóa và không mã hóa của hai (hoặc nhiều) gen. HGNC chỉ đặt tên cho các bản ghi đọc qua được chú thích nhất quán bởi cả RefSeq và GENCODE tại Ensembl.

Các bản sao đọc qua có ký hiệu bằng cách sử dụng các ký hiệu từ các gen mẹ, phân tách bằng dấu gạch ngang. Ví dụ: ZNF511-PRAP1 và tên “Readthrough”, như “ZNF511-PRAP1 Readthrough”. Tên cũng có thể bao gồm thông tin bổ sung về trạng thái mã hóa tiềm năng của bản sao như “(NMD candidate)”.

Về mặt lịch sử, HGNC chỉ chấp thuận các ký hiệu cho các gen nằm trên bộ gen tham chiếu của con người. Tuy nhiên, ngoại lệ có thể được thực hiện khi được yêu cầu bởi các cộng đồng cụ thể với các ủy ban danh pháp chuyên dụng như cộng đồng HLA.

Các câu hỏi phổ biến liên quan đến cách thức đặt tên các gen

1. Tại sao việc đặt tên gen lại quan trọng?

Trả lời:

Việc đặt tên gen quan trọng bởi vì nó giúp các nhà khoa học và y bác sĩ giao tiếp một cách chính xác và hiệu quả về các tình trạng di truyền cụ thể.

Giải thích:

Nếu không có tên chuẩn hóa, việc nghiên cứu và truyền đạt thông tin về các gen sẽ trở nên rất khó khăn. Mỗi nghiên cứu sinh có thể sẽ sử dụng các tên khác nhau cho cùng một gen, dẫn đến sự nhầm lẫn và khó theo dõi các tiến bộ nghiên cứu. Sự nhất quán trong tên gọi giúp dễ dàng tìm kiếm và đối chiếu thông tin trong các cơ sở dữ liệu lớn.

Hướng dẫn:

Để đảm bảo sự chính xác trong giao tiếp y khoa và nghiên cứu, hãy luôn sử dụng các tên và ký hiệu chuẩn hóa do các tổ chức uy tín như HGNC cung cấp. Điều này không chỉ đảm bảo rằng thông tin được truyền đạt một cách chính xác mà còn giúp tăng cường sự hợp tác và tiến độ nghiên cứu.

2. Làm thế nào để các nhà khoa học quyết định tên và ký hiệu của một gen mới?

Trả lời:

Các nhà khoa học quyết định tên và ký hiệu của một gen mới bằng cách tuân theo các nguyên tắc và quy tắc do các tổ chức như HUGO Gene Nomenclature Committee (HGNC) đề ra.

Giải thích:

Trong quá trình nghiên cứu, một gen mới có thể được nhiều nhà khoa học phát hiện và đặt tên tạm thời khác nhau. Để tránh sự lộn xộn và trùng lặp, HGNC sẽ chỉ định một tên và ký hiệu chính thức duy nhất. Quy trình này bao gồm việc xem xét chức năng của gen, cấu trúc protein mà nó mã hóa, và đôi khi, vị trí của gen trên nhiễm sắc thể.

Hướng dẫn:

Nếu bạn là một nhà khoa học mới phát hiện một gen, hãy tham khảo các quy tắc và hướng dẫn do HGNC cung cấp. Đặt tên và ký hiệu dựa trên chức năng hoặc cấu trúc của gen nếu có thể. Sau đó, gửi đề xuất của bạn đến HGNC để nhận được xác nhận chính thức và tránh gây nhầm lẫn trong cộng đồng khoa học.

3. Tại sao một số gen có nhiều tên và ký hiệu khác nhau trong các báo cáo nghiên cứu đầu tiên?

Trả lời:

Một số gen có nhiều tên và ký hiệu khác nhau trong các báo cáo nghiên cứu đầu tiên vì chúng được phát hiện và nghiên cứu độc lập bởi nhiều nhóm khoa học trên thế giới trước khi có một tên chính thức được thống nhất.

Giải thích:

Trong giai đoạn đầu của việc phát hiện và nghiên cứu gen, các nhà khoa học từ nhiều quốc gia và tổ chức khác nhau có thể đồng thời nghiên cứu cùng một gen mà chưa có sự liên kết thông tin. Do đó, họ sẽ đặt tên và ký hiệu riêng cho gen này. Khi nhận thấy sự trùng lặp hoặc nhầm lẫn, HGNC sẽ can thiệp để chỉ định một tên và ký hiệu duy nhất, giúp hợp nhất các nghiên cứu và thông tin.

Hướng dẫn:

Nếu bạn gặp phải một gen có nhiều tên và ký hiệu trong các tài liệu nghiên cứu, hãy cố gắng tra cứu trong cơ sở dữ liệu của HGNC hoặc các nguồn đáng tin cậy để tìm ra tên và ký hiệu chính thức. Điều này sẽ giúp bạn tiếp cận thông tin một cách chính xác nhất và tránh nhầm lẫn khi tiến hành nghiên cứu hoặc viết bài báo khoa học.

Kết luận và khuyến nghị

Kết luận

Việc đặt tên các gen và điều kiện di truyền đòi hỏi sự hợp tác của rất nhiều chuyên gia và tổ chức uy tín để đảm bảo việc giao tiếp y học chính xác và hiệu quả. Các quy tắc và hướng dẫn do

các ủy ban như HGNC cung cấp giúp duy trì sự nhất quán và dễ dàng trong tra cứu thông tin. Bài viết đã nêu rõ quy trình và tầm quan trọng của việc đặt tên các gen mã hóa protein, gen giả, ARN không mã hóa và các bản sao đọc qua.

Khuyến nghị

Để duy trì sự chính xác và nhất quán trong nghiên cứu y học và di truyền học, chúng tôi khuyến nghị rằng tất cả các nhà khoa học và bác sĩ nên tuân thủ các quy định đặt tên do các tổ chức chuyên nghiệp như HGNC cung cấp. Hãy tận dụng các cơ sở dữ liệu uy tín để tra cứu thông tin về các gen và điều kiện di truyền. Điều này không chỉ giúp nâng cao chất lượng nghiên cứu mà còn cải thiện sự giao tiếp và hợp tác trong cộng đồng khoa học.

Tài liệu tham khảo

  1. MedlinePlus. Gene and Genetic Conditions. Accessed October 2023. https://medlineplus.gov/genetics/understanding/
  2. ScienceDirect. Gene Naming Conventions and Guidelines. Accessed October 2023. https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/gene-naming/
  3. Gene Names. HUGO Gene Nomenclature Committee (HGNC). Accessed October 2023. https://www.genenames.org/