Lần đầu tiên Việt Nam xây dựng thành công quy trình công nghệ giải trình tự hệ gene virus SARS-CoV-2 bằng kỹ thuật giải trình tự hệ gene đoạn dài PacBio.
Với việc làm chủ công nghệ này, cho phép các nhà khoa học Việt Nam có thể giải trình tự hệ gene những đối tượng virus gây bệnh mới trong tương lai nhanh chóng và chính xác mà không cần hệ gene tham chiếu.
Quy trình công nghệ giải trình tự hệ gene virus SARS-CoV-2 bằng hệ máy giải trình tự thế hệ mới PacBio là kết quả của đề tài khoa học được Viện Hàn lâm Khoa học và công nghệ Việt Nam giao Viện Công nghệ sinh học (CNSH) thực hiện, nhằm đáp ứng nhu cầu hỗ trợ xử lý dịch bệnh COVID-19 tại Việt Nam.
Cây phát sinh chủng loại gồm các chủng SARS-CoV-2 được thu thập tại Việt Nam cho đến ngày 1/4/2021. Tham chiếu MN908947.3 của NCBI cũng được đưa vào sử dụng làm so sánh (màu đen), trong khi đó các hệ gen SARS-CoV-2 do Viện CNSH giải và cung cấp được đưa vào so sánh (đóng khung đỏ). Các trình tự được tô màu theo phân loại GISAID. Cây phân loại cho thấy sự tiến hóa của SARS-CoV-2 cũng như thời điểm các chủng lần lượt xâm nhập vào Việt Nam. |
GS.TS Trương Nam Hải- Chủ nhiệm đề tài cho biết, Viện CNSH phối hợp với Viện Pasteur TPHCM và Viện Vệ sinh Dịch tễ Trung ương (NIHE) xây dựng quy trình kỹ thuật giải trình tự toàn bộ hệ gene virus SARS-CoV-2 bằng công nghệ giải trình tự đoạn dài của PacBio.
Công nghệ đó gồm 6 bước: (1) Nuôi cấy và tách chiết ARN virus. (2) Tổng hợp cDNA sợi đôi từ ARN virus. Hai bước này được thực hiện tại Viện Pasteur TPHCM và NIHE trong điều kiện phòng sạch an toàn sinh học cấp III. (3) Chuẩn bị thư viện DNA để giải trình tự gene. (4) Giải trình tự toàn bộ hệ gene virus SARS-CoV-2. (5) Lắp ráp de novo hệ gene virus. (6) Chú giải và phân tích hệ gene virus. Bốn bước sau thực hiện tại Viện CNSH trong khoảng 48h.
Cũng theo GS.TS Trương Nam Hải, tại Việt Nam, để giải trình tự hệ gene virus SARS-CoV-2, các đơn vị trong nước sử dụng công nghệ giải trình tự đoạn ngắn. Sau đó lắp ráp và tham chiếu với hệ gene trước đó. Công nghệ này mất nhiều thời gian để đọc được trọn vẹn hệ gene (3-4 ngày) và vẫn có sai sót trong khi đọc.
"Một số đơn vị khác có thể giải trình tự bằng thiết bị thế hệ mới dựa trên nguyên lý giải trình tự các đoạn ngắn. Tức là họ giải trình tự các đoạn ngắn, sau đó lắp ráp các đoạn này với nhau thành đoạn dài để giải trình tự của một hệ gene. Và để giải trình tự đó thì hiện nay các đơn vị phải sử dụng trình tự tham chiếu mà đã giải trước đó (như trước đó Trung Quốc là quốc gia giải trình tự thành công chủng ở Vũ Hán).
Sau khi giải các đoạn ngắn xong thì dùng trình tự tham chiếu để lắp lên để thành hệ gene của chủng mà mình đang đi giải trình tự. Cách làm này thường lâu, giải trình tự đoạn ngắn thường rất khó để đọc được trọn vẹn hệ gene một cách đầy đủ, cho nên nhiều khi phải sử dụng thêm một trình tự nữa là giải trình tự sanger để đọc đầy đủ nhất hệ gene mà mình quan tâm. Bên cạnh đó, phương pháp này cũng có các lỗi đọc, cho nên việc chỉnh sửa nó cũng mất thêm thời gian"- GS Trương Nam Hải cho biết.
GS.TS Trương Nam Hải cũng cho hay, đề tài giải trình tự toàn bộ hệ gene của bốn chủng virus SARS-CoV-2, với chiều dài trên 29500 nucleotide/hệ gene. Kết quả lắp ráp hệ gene cho thấy không có lỗi đọc hay đoạn trống, kết quả giải trình tự đạt độ chính xác 99,99%.
"Hiện nay đây là thiết bị duy nhất ở Việt Nam, nó không phải đọc đoạn ngắn, mà đọc đoạn dài. Đọc đoạn ngắn thì chỉ đọc 100-200 nucleotide/đoạn thôi, sau đó lắp ráp thành hệ gene đầy đủ. Nhưng giải đoạn dài thì có thể đọc hàng nghìn, hàng chục nghìn nucleotide/đoạn, và việc đọc đoạn dài thì khi lắp ráp để ra một hệ gene nó đơn giản và chính xác hơn, độ chính xác tương đương 99,99%- tức là lỗi đọc hầu như không có, lắp ráp rất nhanh. Thời gian để giải trình tự, lắp ráp, phân tích thì mất khoảng 2 ngày là có thể xong hệ gene của một virus"- GS Hải cho biết.
Với việc xây dựng và làm chủ kỹ thuật giải trình tự hệ gene đoạn dài của PacBio đối với virus SARS-CoV-2, theo đánh giá của các nhà khoa học đã mở ra khả năng giải trình tự hệ gene virus nhanh, chính xác mà không cần dựa vào trình tự gene tham chiếu quốc tế. Điều này cho phép các nhà khoa học Việt Nam có thể giải trình tự những đối tượng virus gây bệnh mới trong tương lai mà không cần hệ gene tham chiếu. Dữ liệu giải trình tự hệ gene góp phần vào việc xác định nguồn gốc virus và số lượng nguồn lây (F0) trong các ổ dịch, là cơ sở khoa học, thông tin quan trọng trong xây dựng chiến lược, phương án phòng, chống hiệu quả sự lây lan của virus trong cộng đồng.
PGS.TS Hà Quý Quỳnh- Trưởng ban Ứng dụng và triển khai công nghệ, Viện Hàn lâm Khoa học và công nghệ Việt Nam nhấn mạnh: "Việc nghiên cứu thành công quy trình công nghệ giải mã gene virus SARS-CoV-2 thì đã góp phần cùng với phác đồ điều trị để mà chúng ta có thể dập được dịch. Cụ thể, việc giải mã trình tự gene cùng với truy vết cho phép chúng ta xác định nguồn gốc lây lan của virus – các F0, từ đó chúng ta có cơ sở khoa học để chúng ta khoanh vi, cách ly số người liên quan và chúng ta cũng có cơ sở khoa học để triển khai các phác đồ điều trị tối ưu".
Với việc làm chủ quy trình công nghệ, năng lực và điều kiện hiện có, Viện Hàn lâm Khoa học và công nghệ Việt Nam cũng cho biết, sẵn sàng tham gia hợp tác với các đơn vị ngành y tế trong việc giải trình tự hệ gene của virus SARS-CoV-2 với quy mô lớn trong các trường hợp cấp bách, nhằm phục vụ hiệu quả công tác phòng chống dịch COVID-19 tại Việt Nam.
TẠ LAN
TP.HCM thêm 11 người dương tính SARS-CoV-2 liên quan hội thánh Phục Hưng |
TP.HCM ghi nhận thêm 51 người nhiễm SARS-CoV-2 |
Ba người trong một gia đình ở Bình Dương cùng dương tính với SARS-CoV-2 |