BỘ GIÁO DỤC VÀ ĐÀO TẠO
VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Nguyễn Khánh Hoàng Việt
NGHIÊN CỨU ĐÁNH GIÁ SỰ ĐA DẠNG VÀ VAI TRÒ CỦA
MỘT SỐ MODULE TRONG CẤU TRÚC ENZYME THỦY PHÂN
CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG DẠ CỎ CỦA DÊ
Chuyên ngành: Công nghệ sinh học
Mã số: 9.42.02.01
LUẬN ÁN TIẾN SĨ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. GS. TS. Trương Nam Hải
2. PGS. TS. Đỗ Thị Huyền
Hà Nội – 2020
i
LỜI CAM ĐOAN
Luận án này là công trình nghiên cứu được thực hiện chủ yếu bởi cá nhân tôi
dưới sự hướng dẫn khoa học của GS. TS. Trƣơng Nam Hải và PGS. TS. Đỗ Thị
Huyền. Phần lớn kết quả nghiên cứu đã được đăng tải trên các bài báo khoa học,
một phần khác chưa được công bố. Các số liệu và kết quả nghiên cứu được trình
bày trong luận văn này hoàn toàn trung thực.
Tôi xin hoàn toàn chịu trách nhiệm về lời cam đoan này.
Nghiên cứu sinh
Nguyễn Khánh Hoàng Việt
ii
LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc tới GS. TS. Trƣơng Nam Hải, nguyên
Viện trưởng Viện Công nghệ sinh học và PGS. TS. Đỗ Thị Huyền, trưởng phòng
Kỹ thuật di truyền, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công
nghệ Việt Nam đã định hướng nghiên cứu, hướng dẫn, chỉ bảo tận tình và tạo mọi
điều kiện cho tôi hoàn thành luận án này.
Tôi xin bày tỏ lòng cảm ơn sâu sắc tới các cán bộ, thầy cô tại Học viện Khoa
học và Công nghệ, và Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công
nghệ Việt Nam đã giảng dạy và chỉ bảo cho tôi kiến thức chuyên môn và các kỹ
năng cần thiết, cũng như tạo mọi điều kiện thuận lợi cho tôi trong quá trình học tập
và làm thủ tục bảo vệ luận án.
Tôi xin chân thành cảm ơn tập thể Phòng Kỹ thuật di truyền, Viện Công
nghệ sinh học - nơi tôi thực hiện luận án này - đã giúp đỡ, chỉ bảo tận tình cũng như
chia sẻ những kinh nghiệm chuyên môn quý báu.
Để hoàn thành luận án này, tôi xin gửi lời cảm ơn tới thủ trưởng và các đồng
chí tại nơi tôi công tác là Viện Công nghệ mới, Viện Khoa học và Công nghệ quân
sự đã luôn động viên, khuyến khích, hỗ trợ về mọi mặt cho tôi trong suốt thời gian
học tập và nghiên cứu luận án.
Tôi xin cảm ơn sự hỗ trợ kinh phí từ Đề tài độc lập cấp Nhà nước (Mã số:
ĐTĐLCN.15/14) và Đề tài thuộc hướng KH&CN ưu tiên cấp Viện Hàn lâm KHCNVN (Mã số: VAST02.05/18-19) do PGS. TS. Đỗ Thị Huyền làm chủ nhiệm.
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè và những người thân đã
luôn bên cạnh động viên, giúp đỡ, chia sẻ những khó khăn và tạo điều kiện tốt nhất
cho tôi học tập, nghiên cứu và hoàn thiện luận án của mình.
Hà Nội, ngày
tháng
năm 2020
Nghiên cứu sinh
Nguyễn Khánh Hoàng Việt
iii
MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ii
MỤC LỤC ................................................................................................................ iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT…………….…………….….vii
DANH MỤC CÁC BẢNG…………………………………………………………..……….ix
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ……...………………………………………… xx
MỞ ĐẦU .................................................................................................................... 1
CHƢƠNG 1. TỔNG QUAN ..................................................................................... 5
1.1. Tổng quan về cellulose ....................................................................................... 5
1.1.1. Thành phần và cấu trúc của cellulose .................................................... 5
1.1.2. Vai trò của sinh khối cellulose trong nền kinh tế sinh học ...................... 8
1.2. Cellulase ............................................................................................................ 10
1.2.1. Khái quát chung về celllulase ................................................................... 10
1.2.2. Nguồn gốc của cellulase ........................................................................... 12
1.2.3. Cấu trúc của cellulase .............................................................................. 14
1.2.4. Cellulosome .............................................................................................. 20
1.2.5. Cơ chế thủy phân cellulose ....................................................................... 21
1.2.6. Ứng dụng của cellulase ............................................................................ 23
1.3. Ứng dụng của Metagenomics trong khai thác gen ........................................ 25
1.3.1. Khái quát về Metagenomics .................................................................. 25
1.3.2. Các phương pháp tiếp cận gen mới bằng kỹ thuật Metagenomics ........ 28
1.3.2.1. Metagenomics dựa vào chức năng ....................................................28
1.3.2.2. Metagenomics dựa vào giải trình tự DNA đa hệ gen ........................29
1.3.3. Ứng dụng của Metagenomics trong khai thác gen ................................ 30
1.3.3.1. Khai thác gen mới ứng dụng trong công nghiệp ...............................30
1.3.3.2. Khai thác gen mới mã hóa cho cellulase ...........................................31
1.3.3.3. Sàng lọc gen mã hóa cellulase từ dạ cỏ dê ........................................32
CHƢƠNG 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU ................... 35
2.1. Đối tƣợng, vật liệu hóa chất và thiết bị máy móc .......................................... 35
2.1.1. Đối tượng và vật liệu nghiên cứu ......................................................... 35
2.1.2. Hóa chất và thiết bị máy móc ............................................................... 35
iv
2.1.2.1. Hoá chất và môi trường .....................................................................35
2.1.2.2. Máy móc và thiết bị ............................................................................37
2.2. Phƣơng pháp nghiên cứu ................................................................................. 38
2.2.1. Các phương pháp sinh học phân tử, vi sinh vật .................................... 38
2.2.1.1. Biến nạp DNA plasmid vào vi khuẩn E. coli......................................38
2.2.1.2. Tách chiết DNA plasmid từ tế bào vi khuẩn E. coli ...........................38
2.2.1.3. Cắt và ghép nối gen ...........................................................................38
2.2.1.4. Điện di trên gel agarose ....................................................................39
2.2.1.5. Tinh chế DNA từ gel agarose.............................................................40
2.2.1.6. Tối ưu mã và tổng hợp gen mã hóa enzyme thủy phân cellulose ......40
2.2.1.7. Thiết kế vector biểu hiện ....................................................................40
2.2.2. Các phương pháp hóa sinh protein ....................................................... 43
2.2.2.1. Biểu hiện protein tái tổ hợp trong E. coli ..........................................43
2.2.2.2. Điện di protein trên gel polyacrylamide ............................................43
2.2.2.3. Tinh chế protein bằng sắc kí ái lực his-tag .......................................44
2.2.2.4. Xác định độ sạch của enzyme bằng Quantity One.............................45
2.2.2.5. Định lượng protein bằng phương pháp Bradford .............................45
2.2.2.6. Xác định hoạt tính endoglucanase .....................................................46
2.2.2.7. Đánh giá ảnh hưởng của SFn3 và SXFn3 đến CMC và giấy lọc ......48
2.2.2.8. Ảnh hưởng của nhiệt độ, pH, ion kim loại, hóa chất lên enzyme ......50
2.2.2.9. Xác định độ bền nhiệt của enzyme .....................................................51
2.2.2.10. Xác định thông số động học của enzyme .........................................51
2.2.3. Các phương pháp tin sinh học .............................................................. 43
2.2.3.1. Phương pháp nghiên cứu Pfam của các trình tự ...............................52
2.2.3.2. Nghiên cứu vùng bảo thủ và cấu trúc bậc ba của các trình tự ..........52
2.2.3.3. Dự đoán khả năng chịu kiềm/acid .....................................................53
2.2.3.4. Dự đoán khả năng chịu nhiệt của enzyme .........................................54
2.2.4. Xử lý số liệu .......................................................................................... 54
CHƢƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ......................................................... 55
3.1. Đánh giá sự đa dạng GH và cấu trúc module của cellulase ......................... 55
3.1.1. Đánh giá sự đa dạng và cấu trúc các họ GH cellulase ......................... 55
3.1.2. Đánh giá đa dạng cấu trúc cellulase hoàn thiện có cấu trúc module ... 57
3.1.3. Đánh giá đa dạng nguồn gốc các ORF mã hóa cellulase ..................... 61
3.1.4. Đánh giá mức độ tương đồng của các trình tự axit amin suy diễn ....... 64
v
3.1.5. Ước đoán một số tính chất vật lý của enzyme suy diễn từ trình tự ........ 65
3.2. Nghiên cứu lựa chọn các trình tự có cấu trúc module điển hình ................ 68
3.2.1. Khảo sát cấu trúc bậc 3 của trình tự chứa module FN3 .......................... 68
3.2.2. Khảo sát giá trị pI, pH của trình tự chứa module FN3 ............................ 70
3.3. Tách dòng gen XFn3Egc .................................................................................. 72
3.3.1. Phân tích tối ưu mã bộ ba của trình tự XFn3Egc ................................. 72
3.3.2. Tạo vector biểu hiện pETSUMO mang các gen .................................... 74
3.3.3. Chọn dòng các plasmid pETSUMO mang gen ...................................... 74
3.3.3.1. Chọn dòng vector pETSUMO-Fn3 ....................................................75
3.3.3.2. Chọn dòng vector pETSUMO-Egc ....................................................76
3.3.3.3. Chọn dòng vector pETSUMO-Fn3Egc ..............................................76
3.3.3.4. Chọn dòng vector pETSUMO-XFn3Egc............................................77
3.3.3.5. Chọn dòng vector pETSUMO-XFn3 ..................................................78
3.4. Biểu hiện các gen trong tế bào E. coli ............................................................. 79
3.4.1. Khảo sát điều kiện biểu hiện các gen .................................................... 79
3.4.2. Kiểm tra protein tái tổ hợp được biểu hiện ở pha tan ........................... 81
3.4.3. Kiểm tra hoạt tính endoglucanase ........................................................ 82
3.5. Tinh chế protein tái tổ hợp và xác định hoạt tính ......................................... 85
3.5.1. Tinh chế protein tái tổ hợp ................................................................... 85
3.5.1.1. Tinh chế protein SFn3 ........................................................................85
3.5.1.2. Tinh chế protein SFn3Egc .................................................................86
3.5.1.3. Tinh chế protein SXFn3Egc ...............................................................87
3.5.1.4. Tinh chế protein SXFn3 .....................................................................89
3.5.2. Đánh giá hoạt tính của các protein sau tinh chế .................................. 90
3.5.2.1. Đánh giá hoạt tính riêng rẽ của các protein trên cơ chất CMC .......90
3.5.2.2. Đánh giá SFn3, SXFn3 làm tăng hoạt tính của enzyme trên CMC ...91
3.5.2.3. Đánh giá SFn3, SXFn3 làm tăng hoạt tính enzyme trên giấy lọc......92
3.5.3. Đánh giá khả năng Fn3 làm tăng ái lực của enzyme với cơ chất ......... 94
3.5.3.1. Trên cơ chất CMC..............................................................................95
3.5.3.2. Trên cơ chất giấy lọc .........................................................................97
3.5.3.3. Đánh giá khả năng nới lỏng cấu trúc tinh thể trên bề mặt giấy lọc ..98
3.5.4. Ảnh hưởng của nhiệt độ, pH lên sự hấp phụ SFn3, SXFn3 với cơ chất 99
3.5.4.1. Ảnh hưởng của pH lên sự hấp phụ của SFn3, SXFn3 với cơ chất ....99
3.5.4.2. Ảnh hưởng của nhiệt độ đến sự hấp phụ SFn3, SXFn3 với cơ chất 100
vi
3.6. Đánh giá một số tính chất của enzyme có cấu trúc hoàn thiện ............... 101
3.6.1. Ảnh hưởng của pH đến hoạt tính của SXFn3Egc ................................ 101
3.6.2. Ảnh hưởng của nhiệt độ đến hoạt tính của SXFn3Egc ........................ 103
3.6.3. Đánh giá độ bền nhiệt của SXFn3Egc ................................................ 104
3.6.4. Ảnh hưởng của ion kim loại, hóa chất đến hoạt tính của SXFn3Egc .. 105
3.6.5. Đặc điểm động học của XFn3Egc ...................................................... 108
KẾT LUẬN ............................................................................................................ 110
DANH MỤC CÔNG TRÌNH LIÊN QUAN ĐẾN LUẬN ÁN ……….…………. 112
TÀI LIỆU THAM KHẢO .................................................................................... 113
PHỤ LỤC ............................................................................................................... 136
vii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Tên viết tắt
BAC
BG
BLAST
bp
CBH
Tên tiếng Anh
Bacterial
artificial
chromosome
Beta-glucosidase
Basic Local
Search Tool
Alignment
CBM
CD
CE
Base pair
Cellobiohydrolase
Carbohydrate
binding
domain
Cellulose binding module
Catalytic domain
Carbohydrate esterase
cDNA
Complementary DNA
CMC
Carboxymethyl cellulose
COG/KOG
Clusters of Orthologous
Groups/euKaryotic
Orthologous Groups
CBD
CSDL
DNA
Deoxyribonucleic acid
DNS/DNSA 3,5-Dinitrosalicylic acid
2’-deoxyribonucleoside 5’dNTP
triphosphate
Ethylene diamine tetraacetic
EDTA
acid
EG
Endoglucanase
Evolutionary genealogy of
genes:
Non-supervised
eggNOG
Orthologous Groups
Fn3
GB
His (H)
HPLC
HTS
Ig
Fibronectin type III module
Gigabyte
Histidine
High performance liquid
chromatography
High throughput sequencing
Immunoglobulin module
Nghĩa tiếng Việt
Nhiễm sắc thể nhân tạo của vi
khuẩn
Beta-glucosidase
Công cụ so sánh mức độ tương
đồng về trình tự nucleotit/axit
amin trực tuyến của NCBI
Cặp base
Cellobiohydrolase
Vùng liên kết với carbohydrate
Vùng liên kết với cellulose
Vùng xúc tác
Carbohydrate esterase
DNA được tổng hợp từ khuôn
mRNA nhờ enzyme phiên mã
ngược reverse transcriptase
Carboxymethyl cellulose
Cơ sở dữ liệu protein của sinh vật
nhân sơ và nhân chuẩn đơn bào/cơ
sở dữ liệu từ 7 hệ gen sinh vật
nhân chuẩn (3 loài động vật, 1 loài
thực vật, Arabidopsis thaliana, 2
loài nấm và các ký sinh trùng nội
bào)
Cơ sở dữ liệu
Axit deoxyribonucleic
Axit 3,5-dinitrosalicylic
2’-deoxyribonucleoside
5’triphosphate
Axit ethylene diamine tetraacetic
Endoglucanase
Cơ sở dữ liệu chứa các nhóm
orthologous (các gen trong các
loài khác nhau được tiến hóa từ
một tổ tiên chung)
Module FN3
Gigabyte (109 byte)
Axit amin histidin
Sắc ký lỏng hiệu năng cao
Giải trình tự thông lượng cao
Module Ig
viii
Tên viết tắt
KEGG
Tên tiếng Anh
Isopropy-β-D
thiogalactosidase
Kilobase
Kilodalton
Kyoto Encyclopedia
Genes and Genomes
Km
Michaelis constant
LB
Luria-Betani
LBA
Luria-Betani ampicillin
MB
Megabyte
MEGAN
MEtaGeneomic ANalyser
IPTG
Kb
kDa
Nghĩa tiếng Việt
Isopropy-β-D-thiogalactosidase
of
NGS
National
Center
for
Biotechnology Information
Next-generation sequencing
NR
Non-redundant
OD
ORF
PCR
Optimal density
Open reading frame
Polymarase chain reaction
PE
Pair-end
PFAM
Protein families
pH
Hydrogen power
pNPG
p-nitrophenol-β-glucoside
4-nitrophenyl
β-Dxylopyranoside
NCBI
pNPX
RDP
Ribosomal Database Project
RNA
SDS
Ribonucleic acid
Sodium dodecyl sulphate
SDS-polyacrylamide
gel
electrophoresis
Tetramethylethylenediamine
Maximum velocity
Vietnam
Sugar
and
Sugarcane Association
Weight/volume
SDS-PAGE
TEMED
Vmax
VSSA
w/v
Kilobase (1000 cặp bazơ)
Đơn vị đo trọng lượng của protein
Cơ sở dữ liệu về bộ gen, con
đường sinh học, bệnh tật và các
chất hóa học
Nồng độ cơ chất để tốc độ phản
ứng đạt ½ tốc độ tối đa
Môi trường nuôi cấy LB
Môi trường nuôi cấy LB bổ sung
ampicillin
Megabyte (106 byte)
Phần mềm phân tích tối ưu các
trình tự đa hệ gen
Trung tâm quốc gia về thông tin
công nghệ sinh học
Đọc trình tự thế hệ mới
Cơ sở dữ liệu chứa các trình tự
hoàn toàn giống nhau đã được hợp
nhất từ ngân hàng gen
Mật độ quang học
Khung đọc mở
Phản ứng chuỗi trùng hợp
Read (đoạn trình tự ADN ngắn
riêng rẽ) có cả hai đầu tương đồng
với contig (đoạn trình tự ADN
thường được gộp từ các read)
Các họ protein
Chỉ số đo nồng độ ion H+, ion OHtrong dung dịch
p-nitrophenol-β-glucoside
4-nitrophenyl β-D-xylopyranoside
Cơ sở dữ liệu trình tự rARN tiểu
đơn vị nhỏ của vi khuẩn và vi
khuẩn cổ
Axit ribonucleic
Sodium dodecyl sulphate
Điện di trên gel polyacrylamide
biến tính
Tetramethylethylenediamine
Vận tốc tối đa
Hiệp hội Mía đường Việt Nam
Khối lượng/thể tích
ix
DANH MỤC BẢNG
Bảng 1.1.
Tỷ lệ cellulose trong một số nguồn lignocellulose phổ biến
11
Bảng 1.2.
Một số vi sinh vật thủy phân cellulose được xác định từ dạ cỏ
14
Bảng 1.3.
Một số ứng dụng của cellulase
23
Bảng 2.1.
Các cặp mồi dùng để thiết kế tách dòng gen bằng PCR
35
Bảng 2.2.
Thành phần phản ứng cắt thu vector pET22b-SUMO và gen 39
XFn3Egc
Bảng 2.3.
Vị trí các gen và phương pháp thu nhận gen để tách dòng
41
Bảng 2.4.
Thành phần phản ứng và chương trình PCR khuếch đại các gen
41
Bảng 2.5.
Thành phần gel polylacrylamide biến tính và không biến tính
44
Bảng 3.1.
Tổng hợp các trình tự được chú giải mã hóa cho các enzyme thủy 56
phân cellulose bởi dữ liệu COG và KEGG
Bảng 3.2.
Kết quả so sánh trình tự tương đồng của vùng X trên trình tự
70
Bảng 3.3.
Ước đoán một số tính chất của trình tự 13359
71
Bảng 3.4.
Tổng hợp đặc điểm của các gen tách dòng và ước đoán đặc điểm 79
của protein do các gen mã hóa
x
DANH MỤC HÌNH
Hình 1.1. Thành tế bào ở thực vật với thành phần chính là lignocellulose bao
gồm cellulose, hemicellulose và lignin liên kết chặt chẽ với nhau
5
Hình 1.2. Cấu trúc phân tử và sự liên kết giữa các sợi cellulose
6
Hình 1.3. Sự liên kết của các sợi cellulose
7
Hình 1.4. Lượng nhiên liệu được yêu cầu sản xuất từ nguồn nguyên liệu tái
tạo từ năm 2008 đến năm 2022 tại Mỹ
10
Hình 1.5. Cấu trúc Cellulase Cel7A từ Trichoderma reesei
15
Hình 1.6. Cấu trúc module của một số cellulase từ Thermobifida fusca
16
Hình 1.7. Cấu trúc tinh thể beta-glucanase từ loài A. aculeatus có chứa FN3
17
Hình 1.8
19
Cấu trúc tinh thể của cellulase BlCel5B của Bacillus licheniformis
Hình 1.9. Một mô hình cấu trúc cellulosome tham gia thủy phân cellulose
21
Hình 1.10. Cơ chế phân hủy/khử polimer hóa cellulose bằng cellulase
23
Hình 2.1. Các bước chính được thực hiện trong công trình nghiên cứu
38
Hình 2.2. Các gen XFn3, Fn3Egc, Fn3, Egc được thiết kế để tách dòng và
biểu hiện riêng rẽ từ gen có cấu trúc module XFn3Egc
Hình 2.3. Sơ đồ qui trình đưa các gen Fn3, Egc, Fn3Egc, XFn3Egc, XFn3 vào
vector biểu hiện pETSUMO
41
42
Hình 2.4. Đường chuẩn thể hiện sự phụ thuộc OD595 vào hàm lượng BSA
46
Hình 2.5. Đường chuẩn glucose biểu thị sự phụ thuộc OD540 vào glucose
47
Hình 2.6. Sự phụ thuộc tốc độ vào nồng độ cơ chất theo Lineweaver-Burk
52
Hình 3.1. Cấu trúc của 148 trình tự hoàn thiện có chứa module FN3 hoặc Ig
60
Hình 3.2. Phân tích cấu trúc của vi khuẩn dạ cỏ dê chứa các gen phân giải
cellulose
Hình 3.3. Các loài vi khuẩn phổ biến nhất mang gen cellulase được khai thác
từ dữ liệu đa hệ gen dạ cỏ dê Việt Nam
Hình 3.4. Độ tương đồng của 243 trình tự có chứa cấu trúc module FN3 và Ig
dựa trên cơ sở dữ liệu CAZy
Hình 3.5. Độ tương đồng của 243 trình tự có chứa cấu trúc module FN3 và Ig
dựa trên cơ sở dữ liệu CAZy
62
63
64
65
Hình 3.6. Đặc điểm suy diễn về khả năng bền nhiệt (a), khoảng pH hoạt động 66
xi
(b) và giá trị pI của các trình tự có cấu trúc module (c)
Hình 3.7. Kết quả khảo sát vùng bảo thủ trên các trình tự bằng SwissProt
69
Hình 3.8. Kết quả khảo sát vùng bảo thủ trên các trình tự bằng Phyre2
70
Hình 3.9. Khả năng sử dụng các mã bộ ba trên gen (A) và mức độ phù hợp mã
bộ ba (B) của gen mã hóa XFn3Egc
Hình 3.10. Trình tự gen XFn3Egc và trình tự acid amin của nó sau khi được tối
ưu các mã bộ ba để biểu hiện trên chủng E. coli
Hình 3.11. Điện di đồ kiểm tra gen Fn3, Egc, Fn3Egc, XFn3 XFn3Egc và
vector
Hình 3.12. Điện di đồ kiểm tra các dòng plasmid pETSUMO-fn3 (A) và sản
phẩm cắt kiểm tra plasmid pETSUMO-Fn3 (B)
Hình 3.13. Điện di đồ kiểm tra các dòng plasmid pETSUMO-Egc (A) và sản
phẩm cắt kiểm tra plasmid pETSUMO-Egc (B)
Hình 3.14. Điện di đồ kiểm tra các dòng plasmid pETSUMO-Fn3Egc (A) và
sản phẩm cắt kiểm tra plasmid pETSUMO-Fn3Egc (B)
Hình 3.15. Điện di đồ kiểm tra các dòng plasmid pETSUMO-XFn3Egc (A) và
sản phẩm cắt kiểm tra plasmid pETSUMO-XFn3Egc (B)
Hình 3.16. Điện di đồ kiểm tra các dòng plasmid pETSUMO-XFn3 (A) và sản
phẩm cắt plasmid pETSUMO-XFn3 (B)
Hình 3.17. Điện di đồ kiểm tra protein SFn3, SEgc, SFn3Egc, SXFn3,
SXFn3Egc của các dòng E. coli tái tổ hợp tương ứng
Hình 3.18. Điện di đồ SFn3, SEgc, SFn3Egc, SXFn3Egc, SXFn3 được biểu
hiện trong E. coli BL21
Hình 3.19. Thử hoạt tính SFn3, SFn3Egc, SXFn3Egc, SXFn3 được biểu hiện
Hình 3.20. Điện di đồ kiểm tra sản phẩm các phân đoạn tinh chế enzyme SFn3
bằng cột sắc ký ái lực His-tag trên gel polyacrylamide 12,6%
Hình 3.21. Kiểm tra độ sạch của SFn3 tái tổ hợp bằng phần mềm Quantity One
Hình 3.22. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế enzyme
SFn3Egc bằng cột sắc ký ái lực His-tag
Hình 3.23. Kiểm tra độ sạch SFn3Egc tái tổ hợp bằng phần mềm Quantity One
Hình 3.24. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế
SXFn3Egc bằng cột sắc ký ái lực His-tag trên gel polyacrylamide
72
73
74
75
76
77
78
78
81
82
84
86
86
87
87
88
xii
12,6% có SDS
Hình 3.25. Kiểm tra độ sạch SXFn3Egc tái tổ hợp bằng Quantity One
88
Hình 3.26. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế enzyme
SXFn3 bằng cột sắc ký ái lực His-tag trên gel polyacrylamide 89
12,6%
Hình 3.27. Kiểm tra độ sạch của SXFn3 tái tổ hợp bằng Quantity One
Hình 3.28. Thử hoạt tính các protein SFn3, SFn3Egc, SXFn3Egc, SXFn3 sau
tinh chế trên đĩa thạch CMC-agar
Hình 3.29. Kiểm tra hoạt tính riêng rẽ và phối trộn của các protein sau tinh chế
trên cơ chất CMC
Hình 3.30. Kiểm tra hoạt tính riêng rẽ và phối trộn của các protein sau tinh chế
trên cơ chất giấy lọc
Hình 3.31. Đánh giá vai trò của SFn3 và SXFn3 khi hấp phụ trên cơ chất CMC
đến hoạt tính của các protein SFn3Egc, SXFn3Egc
Hình 3.32. Kiểm tra khả năng SFn3, SXFn3 làm tăng ái lực của enzyme với cơ
chất CMC
Hình 3.33. Đánh giá vai trò của SFn3 và SXFn3 khi hấp phụ trên cơ chất giấy
lọc đến hoạt tính của các protein SFn3Egc, SXFn3Egc
Hình 3.34. Ảnh SEM cấu trúc và bề mặt các sợi cellulose của giấy lọc
89
90
92
93
95
96
98
99
Hình 3.35. Ảnh hưởng của pH lên sự hấp phụ của SFn3 và SXFn3 với giấy lọc 100
Hình 3.36. Ảnh hưởng của nhiệt độ lên sự hấp phụ của SFn3, SXFn3 với giấy lọc 101
Hình 3.37. Ảnh hưởng của pH đến hoạt tính của SXFn3Egc
102
Hình 3.38. Ảnh hưởng của nhiệt độ đến hoạt tính của SXFn3Egc
103
Hình 3.39. Hoạt tính còn lại của SXFn3Egc khi được ủ ở 30oC, 40oC, 50oC,
60oC trong thời gian từ 30 phút đến 90 phút
Hình 3.40. Ảnh hưởng của một số ion kim loại lên hoạt tính của SXFn3Egc
Hình 3.41. Ảnh hưởng của nồng độ ion Mn2+ đến hoạt tính tương đối của
endoglucanase SXFn3Egc trên cơ chất CMC
105
106
107
Hình 3.42. Ảnh hưởng của một số hóa chất lên hoạt tính của enzyme
108
Hình 3.43. Động học enzyme tái tổ hợp SXFn3Egc trên nguồn cơ chất CMC
109
1
MỞ ĐẦU
Vi sinh vật nói chung và vi khuẩn nói riêng có ý nghĩa thực tiễn vô cùng to
lớn đối với loài người thông qua các ứng dụng trong nhiều lĩnh vực như là y học,
nông nghiệp, công nghiệp, xử lý ô nhiễm môi trường. Do đó, các nghiên cứu về sự
đa dạng các trình tự từ vi sinh vật nhằm phát hiện những gen mới để khai thác và
ứng dụng chúng vào phục vụ cuộc sống luôn là chủ đề quan trọng được các nhà sinh
học đặc biệt quan tâm. Mặc dù vậy, các phát hiện gần đây cho thấy phần lớn
(khoảng 99%) các loài vi sinh vật trong môi trường là chưa nuôi cấy được. Do vậy,
nghiên cứu dựa vào phương pháp nuôi cấy thông thường sẽ không thể khai thác
được toàn bộ nguồn gen có tiềm năng của vi sinh vật. Trong giai đoạn gần đây,
thông qua kỹ thuật Metagenomics giải trình tự toàn bộ hệ gen của tất cả các vi sinh
vật được thu nhận trực tiếp từ mẫu môi trường, các gen từ vi sinh vật, kể cả vi sinh
vật không nuôi cấy đã được nghiên cứu, đánh giá một cách tổng thể.
Tại nước ta, cùng với sự phát triển của ngành nông nghiệp với qui mô sản
xuất ngày càng lớn và tập trung như hiện nay, các phụ phẩm nông nghiệp mà trong
đó nguồn sinh khối lignocellulose chiếm phần lớn đang chủ yếu bị đốt bỏ gây lãng
phí và ảnh hưởng xấu đến môi trường. Trong khi đó, nhân loại đang phải đối mặt
với tình trạng suy kiệt nguồn nguyên liệu hóa thạch cũng như hệ quả nghiêm trọng
của việc tích tụ khí thải nhà kính. Việc nghiên cứu sử dụng nguồn năng lượng
carbonhydrate từ nguyên liệu có khả năng tái tạo với trữ lượng khổng lồ như
lignocellulose là hết sức cấp thiết để tạo ra các sản phẩm thay thế các nhiên liệu
được sản xuất từ nguyên liệu hóa thạch.
Lignocellulose nói chung hay cellulose nói riêng là sinh khối có cấu trúc
vững chắc, được chuyển hóa theo nhiều bước để tạo thành sản phẩm cuối cùng mà
trong đó giai đoạn đường hóa đóng vai trò then chốt. Trong quá trình này, cellulase
được xác định là nhân tố chính quyết định tới hiệu suất chuyển hóa và giá thành của
sản phẩm. Do vậy, trong những năm gần đây trên thế giới có rất nhiều công trình
nghiên cứu tìm kiếm nguồn cellulase mới có hoạt tính cao, có ái lực mạnh với cơ
chất để chuyển hóa hiệu quả cellulose. Khác với enzyme khác, phần lớn các
cellulase có cấu trúc module, có nghĩa là ngoài vùng có chức năng xúc tác, enzyme
còn chứa thêm một số module khác có cấu trúc độc lập và ít được nghiên cứu, điển
2
hình như module FN3, Ig, CBM. Hiện nay trên thế giới, nghiên cứu về vai trò của
các module chưa biết chức năng đến hoạt tính xúc tác của cellulase chưa được công
bố nhiều. Nhiều giả thiết cho rằng, chúng không chỉ tồn tại như một vùng nối liên
kết các vùng hoạt tính mà chúng còn thể hiện nhiều chức năng sinh học quan trọng
khác như ổn định cấu trúc, làm tăng ái lực của enzyme với cơ chất. Vì vậy, nghiên
cứu làm rõ vai trò sinh học của các module này trong cấu trúc của cellulase là hết
sức có ý nghĩa cho việc lựa chọn hoặc thiết kế các enzyme để nâng cao hiệu quả
thủy phân nguồn sinh khối cellulose.
Từ năm 2014 đến năm 2017, bằng nguồn kinh phí của Đề tài độc lập cấp
Nhà nước (Mã số: ĐTĐLCN.15/14), phòng Kỹ thuật di truyền (Viện CNSH, Viện
HLKH&CNVN) đã giải mã DNA đa hệ gen của hệ vi khuẩn trong dạ cỏ dê chăn thả
tự nhiên trên núi tại tỉnh Ninh Bình và Thanh Hóa. Kết quả, từ 8,6 Gb dữ liệu trình
tự, đề tài đã khai thác được 816 trình tự mã hóa cho cellulase. Trong nghiên cứu
này, chúng tôi hướng tới việc đánh giá đa dạng các trình tự cellulase có cấu trúc
module, tìm ra cấu trúc module đặc thù mới cho nghiên cứu vai trò của module đến
hoạt tính của enzyme. Do đó, chúng tôi đã thực hiện Luận án: “Nghiên cứu đánh
giá sự đa dạng và vai trò của một số module trong cấu trúc enzyme thủy phân
cellulose từ khu hệ vi sinh vật trong trong dạ cỏ của dê”.
● Mục tiêu nghiên cứu:
- Nghiên cứu đánh giá đa dạng cellulase và cellulase có cấu trúc module từ
khu hệ vi khuẩn trong dạ cỏ dê bằng kỹ thuật Metagenomics;
- Nghiên cứu vai trò của module chưa rõ chức năng (FN3 hoặc Ig) lên hoạt
tính của cellulase.
● Nội dung nghiên cứu:
Để đạt được mục tiêu của đề tài, chúng tôi đã thực hiện các nội dung nghiên
cứu chính sau:
1. Phân tích, đánh giá đa dạng họ GH, nguồn gốc cellulase và các cellulase
có cấu trúc module được mã hóa từ các khung đọc mở trong dữ liệu giải trình tự
DNA đa hệ gen của vi sinh vật dạ cỏ dê tại Việt Nam.
3
2. Phân tích lựa chọn trình tự có cấu trúc module điển hình cho nghiên cứu
biểu hiện, xác định vai trò của vùng chưa biết chức năng.
3. Nghiên cứu biểu hiện, tinh chế enzyme từ trình tự được lựa chọn
(SXFn3Egc) và các gen chứa module của nó (Fn3, XFn3, Egc, Fn3Egc) dưới dạng
dung hợp với SUMO.
4. Nghiên cứu vai trò của module chưa biết chức năng đến khả năng phân
giải cellulose của enzyme.
5. Nghiên cứu, đánh giá một số tính chất của enzyme tái tổ hợp được biểu
hiện từ trình tự được lựa chọn có cấu trúc module.
● Những đóng góp mới của Luận án:
1. Từ 816 ORF mã hóa cellulase của vi khuẩn dạ cỏ dê Việt Nam, 243 ORF
mã hóa cellulase được xác định có cấu trúc chứa module chưa rõ chức năng là FN3
hoặc Ig. Trong số các cellulase hoàn thiện chứa module FN3, 99,2% FN3 đi kèm
với module xúc tác betaglucosidase GH3 và chỉ có một FN3 đi kèm với module xúc
tác endoglucanase GH5. Toàn bộ module Ig đều đi kèm với module xúc tác
endoglucanase GH9. Cấu trúc mã hóa endoglucanase GH5 chứa module FN3 là cấu
trúc mới ít được phát hiện và nghiên cứu.
2. Đã tổng hợp và biểu hiện trình tự mã hóa endoglucanase GH5 (XFn3Egc)
và các cấu trúc chứa module khác nhau (Fn3, XFn3, Fn3Egc, Egc) trong E. coli để
nghiên cứu vai trò của FN3 trong cấu trúc của enzyme. Module FN3 được xác định
có khả năng làm tăng tính tan và ổn định cấu trúc vùng xúc tác, nới lỏng các cấu
trúc tinh thể trên bề mặt giấy lọc, giúp enzyme tiếp cận cơ chất tốt hơn. Module
FN3 còn làm tăng ái lực của enzyme lên cơ chất tan là CMC.
3. SXFn3Egc hoạt động tối ưu ở 40oC, pH 4. Enzyme ổn định và bền ở nhiệt
độ dưới 60oC trong 90 phút. Km đạt 1,26 mg/ml và Vmax đạt 148,12 µmol/min/ml.
Hoạt tính enzyme tăng 2 lần khi sử dụng 40 mM Mn2+ và giảm khi bổ sung các ion
kim loại (Ca2+, Mg2+, Ni2+, K+, Co2+, Cu2+, Zn2+, Fe3+), và 6 loại hóa chất (SDS,
urea, 2-mercaptoethanol, EDTA, tween 80, triton X-100).
● Ý nghĩa khoa học và thực tiễn của Luận án:
* Ý nghĩa khoa học:
4
Luận án đã khai thác và nghiên cứu cấu trúc của endoglucanase GH5 chứa
module FN3 là cấu trúc mới, ít được nghiên cứu và công bố trên thế giới. Module
FN3 trong cấu trúc này được chứng minh có khả năng ổn định cấu trúc vùng xúc
tác, nới lỏng các cấu trúc tinh thể trên bề mặt giấy lọc, giúp enzyme tiếp cận cơ chất
tốt hơn. Module FN3 còn làm tăng ái lực của enzyme với cơ chất tan là CMC.
* Ý nghĩa thực tiễn:
Xác định được vai trò của module FN3 trong cấu trúc endoglucanase GH5 là
cơ sở để thiết kế các enzyme chứa các module bổ sung hoặc enzyme cocktail phù
hợp có khả năng phân giải cellulose hiệu quả, ứng dụng trong sản xuất các nhiên
liệu sinh học thế hệ mới và xử lý ô nhiễm môi trường.
5
CHƢƠNG 1. TỔNG QUAN
1.1. Tổng quan về cellulose
1.1.1. Thành phần và cấu trúc của cellulose
Cellulose cùng với hemicellulose và lignin là 3 thành phần chính cấu thành
nên sinh khối lignocellulose (Hình 1.1). Đây là thành phần cấu tạo chủ yếu của
thành tế bào thực vật thân gỗ và các thực vật khác như cỏ, lúa, ngô… Các thành
phần của lignocellulose trong các loài thực vật khác nhau thường có tỷ lệ khác nhau
nhưng cellulose thường chiếm tỷ lệ cao nhất (38-50%) so với hemicellulose (2332%) và lignin (15-25%) [1], [2]. Đặc biệt, cellulose chiếm tỷ lệ khá cao ở một số
nguyên liệu như giấy thải từ bột giấy hoá học (60-70%), giấy (85-99%), sợi cotton
(95-97%) [3]. Ở thực vật, cellulose được tạo thành nhờ quá trình quang hợp và
thường phân bố ít ở lá so với ở thân cây [4]. Cellulose là thành phần có vai trò quan
trọng để giữ cho cấu trúc của thành tế bào thực vật ổn định [5]. Bên cạnh đó,
cellulose cũng được tổng hợp bởi một số vi khuẩn và động vật nguyên sinh có vai
trò chủ yếu để tạo màng bảo vệ tế bào. Cellulose từ vi khuẩn được xác định có cấu
trúc siêu mịn, độ tinh khiết và khả năng phân hủy sinh học cao hơn so với cellulose
từ nguồn thực vật [6].
Cellulose
Thành tế
bào thực vật
VI SỢI
Thực vật
Liên kết hydro
Tế bào thực vật
Hình 1.1. Thành tế bào ở thực vật với thành phần chính là lignocellulose bao gồm
cellulose, hemicellulose và lignin liên kết chặt chẽ với nhau [7]
6
Cellulose và hemicellulose là các đại phân tử mạch thẳng cấu tạo từ các gốc
đường khác nhau, còn lignin là một polymer dạng vòng được tổng hợp từ tiền
phenylpropanoid. Các thành phần này liên kết với nhau chủ yếu bằng các liên kết
hydro để tạo cấu trúc khối vững chắc là lignocellulose [8]. Cellulose có công thức
cấu tạo là (C6H10O5)n hay được viết dưới dạng [C6H7O2(OH)3]n (do mỗi mắt xích
của cellulose có chứa 3 nhóm –OH). Khối lượng phân tử của cellulose rất lớn
(khoảng 1.000.000 – 2.400.000 đvC), tùy thuộc vào giá trị n. Giá trị n thể hiện số
lượng các đơn phân và phụ thuộc vào loại nguyên liệu cellulose. Thông thường, mỗi
chuỗi cellulose ở thành tế bào thực vật nói chung có khoảng 5.000-7.000 đơn phân.
Ví dụ, trong gỗ có khoảng 10.000 đơn phân và trong bông có khoảng 15.000 đơn
phân. Do đó, khối lượng phân tử trung bình của cellulose ở bông có thể lên tới
khoảng 2.400.000 đvC [9]. Các đơn phân β-D-glucose liên kết với nhau bằng liên
kết β-1,4-glucoside tạo thành một chuỗi thẳng. Nhóm hydroxyl của chuỗi này tạo
liên kết hydro với phân tử oxy của chuỗi bên cạnh (liên kết hydro liên phân tử) hoặc
trên cùng chuỗi (liên kết hydro nội phân tử) hình thành cấu trúc tinh thể chắc chắn,
khó bị phân hủy [10], [11], [12] (Hình 1.2).
Hình 1.2. Cấu trúc hóa học và sự liên kết giữa các phân tử cellulose [12]
Từ năm 1913, Nishikawa và Ono đã phát hiện ra cấu trúc và sự sắp xếp của
các sợi cellulose dựa trên phương pháp nhiễu xạ tia X [13]. Phát hiện cho thấy
cellulose riêng lẻ có xu hướng tự sắp xếp theo cách có tổ chức cao dẫn đến trạng
7
thái kết tinh. Dựa trên phát hiện này, các nhà khoa học đã xây dựng mô hình
Fringed fibrillar. Trong mô hình này, các sợi cellulose liên kết với nhau tạo thành 2
vùng có cấu trúc khác nhau là vùng kết tinh và vùng vô định hình (Hình 1.3). Tại
vùng kết tinh, cellulose rất bền dưới tác động của điều kiện ngoại cảnh, không bị tấn
công bởi enzyme và hóa chất. Các mạch cellulose liên kết với nhau nhờ lực Van der
Waals và liên kết hydro (do nhóm hydroxyl thứ nhất của mạch này nối với với
nhóm hydroxyl ở mạch khác). Trong vùng vô định hình, các mạch cellulose liên kết
với nhau nhờ lực Van der Waals có lực liên kết không mạnh nên dễ bị tác động bởi
các yếu tố bên ngoài [14]. Ngoài ra, vùng vô định hình dễ bị tấn công bởi các tác
nhân thủy phân hơn vùng kết tinh do tại vùng này không tạo được liên kết hydro và
sự thay đổi góc của các liên kết cộng hóa trị (β-glycoside) làm giảm độ bền nhiệt
động của liên kết [14].
Vùng kết tinh
Không gian giữa
các sợi cellulose
Vùng vô định hình
Hình 1.3. Sự liên kết của các sợi cellulose tạo thành các vùng vô định hình và vùng
kết tinh [13]
Tính chất hóa học và khả năng phản ứng của cellulose được xác định bởi sự
có mặt của ba nhóm hydroxyl (OH) trong các đơn phân glucose (gồm một nhóm
chính và hai nhóm thứ cấp). Các nhóm hydroxyl đóng một vai trò quan trọng cho sự
hòa tan của cellulose [13]. Cellulose không hòa tan trong nước và các dung môi hữu
cơ do các nhóm -OH tạo ra liên kết hydro nội phân tử và giữa các phân tử cellulose
kề nhau làm cho cấu trúc của cellulose rất bền vững. Để phá hủy cellulose, các liên
kết hydro cần được phá vỡ đầu tiên [15]. Khi thủy phân cellulose bằng H2SO4 đặc,
cellulose sẽ chuyển thành glucose; khi thủy phân cellulose với axit loãng, cellulose
sẽ tạo thành các cellobiose là một disaccharide bao gồm hai phân tử β-glucose liên
kết với nhau bởi liên kết β-1,4-glucoside [16].
- Xem thêm -