一种利用木糖生产乙醇的基因工程菌及其构建方法和应用

文档序号：744830 发布日期：2021-04-23 浏览：17次 >En<

阅读说明：本技术 一种利用木糖生产乙醇的基因工程菌及其构建方法和应用 (Genetically engineered bacterium for producing ethanol by using xylose and construction method and application thereof ) 是由李正军史理陇李弘飞普楠陶观宝于 2019-10-22 设计创作，主要内容包括：本发明涉及一种重组菌的构建方法,所述方法包括对受体菌进行下述A1-A6的改造,得到所述重组菌；A1、敲除所述受体菌的核酮糖磷酸异构酶基因；A2、敲除所述受体菌的丙酮酸氧化酶基因；A3、敲除所述受体菌的乙酸激酶基因；A4、增加所述受体菌中木酮糖裂解酶基因编码蛋白质的表达量；A5、增加所述受体菌中磷酸转乙酰酶编码蛋白质的表达量；A6、增加所述受体菌中双功能乙醛乙醇脱氢酶基因编码蛋白质的表达量；所述受体菌为含有所述核酮糖磷酸异构酶基因、所述丙酮酸氧化酶基因基因和所述乙酸激酶基因的细菌或真菌。本发明构建的重组菌能够提高利用木糖产生乙醇的效率。(The invention relates to a construction method of a recombinant bacterium, which comprises the following steps of carrying out A1-A6 transformation on a receptor bacterium to obtain the recombinant bacterium; a1, knocking out a ribulose phosphate isomerase gene of the recipient bacterium; a2, knocking out the pyruvate oxidase gene of the recipient bacterium; a3, knocking out the acetate kinase gene of the recipient bacterium; a4, increasing the expression level of the protein coded by the xylulose lyase gene in the recipient bacterium; a5, increasing the expression level of protein coded by phosphotransacetylase in the recipient bacterium; a6, increasing the expression level of bifunctional acetaldehyde ethanol dehydrogenase gene encoding protein in the recipient strain; the recipient bacterium is a bacterium or fungus containing the ribulose phosphate isomerase gene, the pyruvate oxidase gene and the acetate kinase gene. The recombinant strain constructed by the invention can improve the efficiency of producing ethanol by using xylose.)

技术领域

本发明属于生物技术、基因工程和发酵工程领域，涉及一种生产乙醇的基因工程菌及其构建方法和应用，更具体地，涉及一种利用木糖生产乙醇的基因工程菌及其构建方法和应用。

背景技术

木糖(D-xylose)是木聚糖的主要构成单位，在植物体内有大量储存，分子式是C₅H₁₀O₅。木糖分布广泛，主要以聚合体的形式存在。木质纤维素原料中，大约30％的组分由木糖构成，储量非常丰富，是自然界中继葡萄糖之后的第二大糖类物质。木糖在玉米芯中含量较高，利用玉米芯为原料制备木糖工艺较为成熟。

自然界中大部分的微生物可以代谢葡萄糖，但是只有小部分微生物能够代谢木糖。因此与葡萄糖相比，木糖在发酵工业中的应用十分受限。开发高效利用木糖的代谢途径将会对其工业应用产生重要推动作用。自然界中已经发现的木糖代谢途径主要有三条：(1)在大肠杆菌等微生物中，木糖首先由木糖异构酶转化为木酮糖，再在木酮糖激酶的作用下生成木酮糖-5-磷酸，由此进入磷酸戊糖途径分解。(2)在酵母等微生物中，木糖首先被木糖还原酶还原为木糖醇，再经木糖醇脱氢酶氧化为木酮糖，接下来由木酮糖激酶催化生成木酮糖-5-磷酸，进入磷酸戊糖途径分解。(3)新月柄杆菌中，木糖在木糖脱氢酶、木糖酸内酯酶和木糖酸脱水酶的催化下生成2-酮-3-脱氧-木糖酸，再经过脱水、脱氢反应形成α-酮戊二酸，进入三羧酸循环分解。

木糖作为存储量巨大的可再生生物质资源，利用合成生物学与代谢工程技术对微生物进行改造，使其利用木糖为碳源生产高附加值和应用广泛的化学品，具有极其广阔的市场前景。

发明内容

本发明所要解决的技术问题是，如何进行木糖的高效代谢产生乙醇，并提供一种能够用于木糖代谢产生乙醇的重组菌。

为了解决以上技术问题，本发明提供了能够利用木糖产生乙醇的重组菌的构建方法。

本发明所提供的重组菌的构建方法，所述方法包括对受体菌进行下述A1-A7的改造，得到所述重组菌；

A1、敲除所述受体菌的核酮糖磷酸异构酶基因或抑制所述核酮糖磷酸异构酶基因的表达或抑制所述核酮糖磷酸异构酶基因编码的蛋白质的活性；

A2、敲除所述受体菌的丙酮酸氧化酶基因或抑制所述丙酮酸氧化酶基因的表达或抑制所述丙酮酸氧化酶基因编码的蛋白质的活性；

A3、敲除所述受体菌的乙酸激酶基因或抑制所述乙酸激酶基因的表达或抑制所述乙酸激酶基因编码的蛋白质的活性；

A4、增加所述受体菌中木酮糖裂解酶基因编码蛋白质的表达量或增强所述木酮糖裂解酶基因编码蛋白质的活性；

A5、增加所述受体菌中磷酸转乙酰酶编码蛋白质的表达量或增强所述磷酸转乙酰酶编码蛋白质的活性；

A6、增加所述受体菌中双功能乙醛乙醇脱氢酶基因编码蛋白质的表达量或增强所述双功能乙醛乙醇脱氢酶基因编码蛋白质的活性；

所述受体菌为含有所述核酮糖磷酸异构酶基因基因、所述丙酮酸氧化酶基因和所述乙酸激酶基因的细菌或真菌。

进一步，所述受体菌为大肠杆菌。

进一步，所述受体菌为大肠杆菌MG1655或大肠杆菌JM109。

上述方法中，所述核酮糖磷酸异构酶基因可编码b1和b2的蛋白质：

b1、由GenBank号：NC_000913.3，Gene ID：947896所编码的氨基酸序列组成的蛋白质；

b2、在GenBank号：NC_000913.3，Gene ID：947896所编码的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有核酮糖磷酸异构酶活性的由b1)衍生的蛋白质。

上述方法中，所述丙酮酸氧化酶基因可编码c1和c2的蛋白质：

c1、由GenBank号：NC_000913.3，Gene ID：946132所编码的氨基酸序列组成的蛋白质；

c2、在GenBank号：NC_000913.3，Gene ID：946132所编码的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有丙酮酸氧化酶活性的由c1)衍生的蛋白质。

上述方法中，所述乙酸激酶基因可编码d1和d2的蛋白质：

d1、由GenBank号：NC_000913.3，Gene ID：946775所编码的氨基酸序列组成的蛋白质；

d2、在GenBank号：NC_000913.3，Gene ID：946775所编码的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有乙酸激酶活性的由d1)衍生的蛋白质。

上述方法中，所述木酮糖裂解酶基因可编码e1和e2的蛋白质：

e1、由SEQ ID No.7所示的氨基酸序列组成的蛋白质；

e2、在SEQ ID No.7所示的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有木酮糖裂解酶活性的由e1)衍生的蛋白质。

上述方法中，所述双功能乙醛乙醇脱氢酶基因可编码f1和f2的蛋白质：

f1、由SEQ ID No.8所示的氨基酸序列组成的蛋白质；

f2、在SEQ ID No.8所示的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有双功能乙醛乙醇脱氢酶活性的由f1)衍生的蛋白质。

上述方法中，所述磷酸转乙酰酶基因可编码g1和g2的蛋白质：

g1、由SEQ ID No.9所示的氨基酸序列组成的蛋白质；

g2、在SEQ ID No.9所示的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有磷酸转乙酰酶活性的由g1)衍生的蛋白质。

上述方法中，所述核酮糖磷酸异构酶基因为rpe基因，其核苷酸序列如GenBank号：NC_000913.3，Gene ID：947896(update：10-Oct-2019)。

丙酮酸氧化酶基因为poxB基因，其核苷酸序列如GenBank号：NC_000913.3，GeneID：946132(update：10-Oct-2019)。

乙酸激酶基因为ackA基因，其核苷酸序列如GenBank号：NC_000913.3，Gene ID：946775(update：10-Oct-2019)。

所述木酮糖裂解酶基因为e11-e13中任一种DNA分子：

e11)其编码序列是SEQ ID NO.1的第70-2458位核苷酸的cDNA或基因组DNA；

e12)在严格条件下与e11)限定的DNA分子杂交且编码所述木酮糖裂解酶的cDNA或基因组DNA；

e13)与e11)或e12)限定的DNA分子具有90％同一性且编码所述木酮糖裂解酶的cDNA或基因组DNA；

所述磷酸转乙酰酶为f11-f13中任一种DNA分子：

f11)其编码序列是SEQ ID NO.2的第70-2215位核苷酸的cDNA或基因组DNA；

f12)在严格条件下与f11)限定的DNA分子杂交且编码所述磷酸转乙酰酶的cDNA或基因组DNA；

f13)与f11)或f12)限定的DNA分子具有90％同一性且编码所述磷酸转乙酰酶的cDNA或基因组DNA；

所述乙醛乙醇脱氢酶为g11-g13中任一种DNA分子：

g11)其编码序列是SEQ ID NO.3的第70-2746位核苷酸的cDNA或基因组DNA；

g12)在严格条件下与g11)限定的DNA分子杂交且编码所述乙醛乙醇脱氢酶的cDNA或基因组DNA；

g13)与g11)或g12)限定的DNA分子具有90％同一性且编码所述乙醛乙醇脱氢酶的cDNA或基因组DNA。

上述的重组菌构建方法构建的重组菌也应在本发明的保护范围之内。

所述的重组菌在生产乙醇中的应用也应在本发明的保护范围之内。

本发明还提供一种通过所述重组菌制备乙醇的方法，所述方法包括以木糖为碳源，利用所述重组菌进行生物转化，制备乙醇。

所述生物转化的培养基为MM液体培养基，所述所述生物转化的条件为：30-37℃瓶震荡培养24-96h，摇瓶的转速为100-200rpm。

所述MM液体培养基的组成如下：每升培养基含10g木糖，2g NH₄Cl、5g(NH₄)₂SO₄、6gKH₂PO₄、8g 3-吗啉丙磺酸、0.5g NaCl，1mL微量元素溶液，余量为水。其中木糖的浓度可以按照需要调整。

所述微量元素溶液的组成如下：每升微量元素溶液含3.6g FeCl₂·4H₂O、5gCaCl₂·2H₂O、1.3g MnCl₂·2H₂O、0.38g CuCl₂·2H₂O、0.5g CoCl₂·6H₂O、0.94g ZnCl₂、0.03g H₃BO₃、0.4g Na₂EDTA·2H₂O、1g thiamine-HCl，其余为0.5M HCl。

本发明的有益效果在于：本发明通过在大肠杆菌中表达3个代谢途径相关基因和敲除3个内源基因，获得了能够利用木糖合成乙醇的工程菌株，并且重组菌在摇瓶培养中的乙醇产量和转化率能达到较高的水平。本发明构建的重组菌具有较好的应用前景。

附图说明

图1为载体图谱；

图2为E.coli JM109和E.coli JM109-1的木糖消耗以及生长曲线；

图3为四种基因工程菌的细菌生长、木糖消耗和产物合成情况。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂、仪器等，如无特殊说明，均可从商业途径得到。以下实施例中的定量试验，均设置三次重复实验，结果取平均值。下述实施例中，如无特殊说明，序列表中各核苷酸序列的第1位均为相应DNA的5′末端核苷酸，末位均为相应DNA的3′末端核苷酸。

下述实施例中涉及分子生物学操作所用的酶，均为NEB(New England Biolabs，http://www.neb-china.com/)公司产品；质粒提取和DNA片段回收所用的试剂盒，均为北京博迈德基因技术有限公司(http://www.biomed168.com/)产品；实施例中涉及的DNA合成和测序工作，由北京博迈德基因技术有限公司完成。

E.coliJM109：来源于Promega公司(https://www.promega.com.cn)，货号P9751。

E.coliMG1655：来源于E.coliGenetic Resources at Yale CGSC，The ColiGenetic Stock Center(http://cgsc2.biology.yale.edu/)，编号CGSC#6300。

E.coli NEB 5-alpha：来源于NEB(New England Biolabs)，货号C2987I。

质粒pKD13：来源于E.coli Genetic Resources at Yale CGSC，The ColiGenetic Stock Center，编号CGSC#7633。

质粒pKD46：来源于E.coli Genetic Resources at Yale CGSC，The ColiGenetic Stock Center，编号CGSC#7739。

质粒pCP20：来源于E.coli Genetic Resources at Yale CGSC，The ColiGenetic Stock Center，编号CGSC#7637。

质粒pUC19：来源于NEB(New England Biolabs)公司，货号N3041S。

实施例1、构建重组菌E.coli JM109-1(pUC19-xpk)

一、重组表达载体pUC19-xpk的构建

1、人工合成序列表中序列1所示的DNA，含有xpk表达盒，上游为SacI位点，下游为XmaI位点，其中第9-69位核苷酸为启动子序列，第70-2538位核苷酸为xpk基因序列。

2、用SacI和XmaI双酶切序列1中合成的DNA序列，回收大小约为2532bp的DNA片段；用SacI和XmaI双酶切质粒pUC19，回收大小约为2680bp的DNA片段；将上述两个DNA片段连接，得到连接产物通过化学转化的方法导入到E.coli NEB 5-alpha中，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养16h，得到转化子。提取转化子的质粒，用SacI和XmaI进行酶切验证，酶切产物大小约为2532bp和2680bp的质粒为阳性质粒，将此重组质粒命名为重组质粒pUC19-xpk。将重组质粒pUC19-xpk进行测序,结果表明：pUC19-xpk为将质粒pUC19的SacI和XmaI识别序列间的DNA片段替换为序列表中序列1的第9-2538位所示的xpk表达盒得到的重组质粒。

二、大肠杆菌E.coli JM109-1的构建

3、敲除rpe基因

rpe基因是核酮糖磷酸异构酶基因，其核苷酸序列如由GenBank号：NC_000913.3，Gene ID：947896，update：10-Oct-2019。

1)合成rpe基因敲除所用的引物rpeF和rpeR，其中，引物的序列如下：

rpeF：

5’-ATGAAACAGTATTTGATTGCCCCCTCAATTCTGTCGGCTGATTTTGCCCGCCTGGGTGAAGTGTAGG

CTGGAGCTGCTTCG-3’；

rpeR：

5’-TTATTCATGACTTACCTTTGCCAGTTCACTGCGCATTTCATCAATGACTTTTTTGTAGTCATTCCGG

GGATCCGTCGACC-3’。

2)以质粒pKD13为模板，采用引物rpeF和rpeR，PCR扩增得到1500bp左右的DNA片段，命名为rpe同源重组片段，琼脂糖凝胶电泳对得到的DNA片段进行纯化。经过测序，rpe同源重组片段的核苷酸序列为序列4，其中，第1-81位为rpe基因上游同源臂，第82-1383位为FRT序列和Kan抗性基因，第1384-1465位为rpe基因下游同源臂。

3)利用电转化的方法将质粒pKD46转化至受体菌株E.coli JM109中，并涂布于含有氨苄青霉素的LB固体培养基，30℃培养24h，得到转化子，提质粒验证，获得含有质粒pKD46的重组菌，记为E.coli JM109(pKD46)。

4)将E.coli JM109(pKD46)接种到含有氨苄青霉素的LB液体培养基中，30℃培养1h，加入阿拉伯糖至终浓度5g/L，继续培养1.5h，接下来制备E.coliJM109(pKD46)的感受态细胞，将步骤2)中获得的DNA片段转入E.coliJM109(pKD46)的感受态细胞中，并涂布于含有卡那霉素的LB固体培养基，37℃培养24h，得到转化子。

5)利用菌落PCR的方法，以rpeF和rpeR为引物，将PCR产物纯化之后测序，筛选正确的rpe基因已经被替换为Kan抗性基因的克隆，得到E.coliJM109rpe-K(pKD46)。

6)将E.coliJM109rpe-K(pKD46)接种于LB液体培养基中，42℃培养传代三次，除去pKD46质粒，得到E.coli JM109rpe-K；E.coli JM109rpe-K是rpe基因被Kan基因替换了的E.coli JM109。

7)将E.coliJM109rpe-K接种到含有卡那霉素的LB液体培养基中，37℃培养24h，转接到含有卡那霉素的LB液体培养基中，37℃培养3h，制备E.coli JM109rpe-K感受态细胞。

8)利用电转化的方法将质粒pCP20转化到E.coli JM109rpe-K感受态细胞中，并涂布于含有氨苄青霉素和氯霉素的LB固体培养基，30℃培养48h，得到转化子。利用菌落PCR的方法验证转化子，以rpeF和rpeR为引物，得到202bp片段的为阳性克隆。将该阳性克隆送去测序，其为敲除E.coli JM109基因组上的rpe基因得到的菌，将该菌接种到LB液体培养基中，42℃传代三次，除去pCP20，将得到的菌株命名为突变体E.coli JM109-1。

三、重组菌E.coli JM109-1(pUC19-xpk)的构建

4、将上述步骤一得到的重组质粒pUC19-xpk通过电转化的方法转化到上述步骤二得到的大肠杆菌E.coli JM109-1，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养24h。

5、挑取单克隆于含有氨苄青霉素的LB液体培养基，37℃培养24h。

6、提取转化子的质粒，验证转化的正确性，得到含有质粒pUC19-xpk的重组菌E.coli JM109-1(pUC19-xpk)。所述E.coli JM109-1(pUC19-xpk)为敲除E.coli JM109染色体基因rpe，并且含有基因xpk的外源表达盒的重组菌。

实施例2、构建重组菌E.coli JM109-1(pUC19-xpk-pta)

一、重组表达载体pUC19-xpk-pta的构建

1、人工合成序列表中序列2所示的DNA，含有pta表达盒，上游为XmaI位点，下游为XbaI位点，其中第9-69位核苷酸为启动子序列，第70-2214位核苷酸为pta基因序列。

2、用XmaI和XbaI双酶切序列2中合成的DNA序列，回收大小约为2222bp的DNA片段；用XmaI和XbaI双酶切质粒pUC19-xpk，回收大小约为5201bp的DNA片段；将上述两个DNA片段连接，得到连接产物通过化学转化的方法导入到E.coliNEB 5-alpha中，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养16h，得到转化子。提取转化子的质粒，用EcoRI和XbaI进行酶切验证，酶切产物大小约为4754bp和2659bp的质粒为阳性质粒，将此重组质粒命名为重组质粒pUC19-xpk-pta。将重组质粒pUC19-xpk-pta进行测序,结果表明：pUC19-xpk-pta为将质粒pUC19-phaC的XmaI和XbaI识别序列间的DNA片段替换为序列表中序列2的第9-2214位所示的pta表达盒得到的重组质粒。

二、重组菌E.coli JM109-1(pUC19-xpk-pta)的构建

3、将上述步骤一得到的重组质粒pUC19-xpk-pta通过电转化的方法转化到实施例一中的步骤二得到的大肠杆菌E.coli JM109-1，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养24h。

4、挑取单克隆于含有氨苄青霉素的LB液体培养基，37℃培养24h。

5、提取转化子的质粒，验证转化的正确性，得到含有质粒pUC19-xpk-pta的重组菌E.coli JM109-1(pUC19-xpk-pta)。所述E.coli JM109-1(pUC19-xpk-pta)为敲除E.coliJM109染色体基因rpe，并且含有基因xpk和pta的外源表达盒的重组菌。

实施例3、构建重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)

一、重组表达载体pUC19-xpk-pta-adhE的构建

1、人工合成序列表中序列3所示的DNA，含有adhE表达盒，上游为XbaI位点，下游为SalI位点，其中第9-69位核苷酸为启动子序列，第70-2745位核苷酸为adhE基因序列。

2、用XbaI和SalI双酶切序列3中合成的DNA序列，回收大小约为2743bp的DNA片段；用XbaI和SphI双酶切质粒pUC19-xpk-pta，回收大小约为7407bp的DNA片段；将上述两个DNA片段连接，得到连接产物通过化学转化的方法导入到E.coli NEB5-alpha中，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养16h，得到转化子。提取转化子的质粒，用XbaI和SalI进行酶切验证，酶切产物大小约为2743bp和7407bp的质粒为阳性质粒，将此重组质粒命名为重组质粒pUC19-xpk-pta-adhE。将重组质粒pUC19-xpk-pta-adhE进行测序,结果表明：pUC19-xpk-pta-adhE为将质粒pUC19-xpk-pta的XbaI和SalI识别序列间的DNA片段替换为序列表中序列3的第9-2745位所示的adhE表达盒得到的重组质粒。也就是说，所述质粒pUC19-xpk-pta-adhE上同时含有xpk、pta和adhE的基因。

二、重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)的构建

3、将上述步骤一得到的重组质粒pUC19-xpk-pta-adhE通过电转化的方法转化到实施例一中的步骤二得到的大肠杆菌E.coli JM109-1，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养24h。

4、挑取单克隆于含有氨苄青霉素的LB液体培养基，37℃培养24h。

5、提取转化子的质粒，验证转化的正确性，得到含有质粒pUC19-xpk-pta-adhE的重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)。所述E.coli JM109-1(pUC19-xpk-pta-adhE)为敲除E.coliJM109染色体基因rpe，并且含有基因adhE、xpk和pta的外源表达盒的重组菌。

实施例4、构建重组菌E.coli JM109-3(pUC19-xpk-pta-adhE)

一、大肠杆菌E.coli JM109-3的构建

1、敲除poxB基因

poxB基因为丙酮酸氧化酶基因，其核苷酸序列如GenBank号：NC_000913.3，GeneID：946132(update：10-Oct-2019)。

与实施例一中敲除rpe基因构建E.coli JM109-1的方法基本相同，不同的是如下：

poxB基因敲除引物序列如下：

poxBF：5’-

atgaaacaaacggttgcagcttatatcgccaaaacactcgaatcggcaggggtgaaacgcGTGTAGGCTGG AGCTGCTTCG-3’；

poxBR：5’

-TTACCTTAGCCAGTTTGTTTTCGCCAGTTCGATCACTTCATCACCGCGTCCGCTGATGATATTCCGGGGATCCG TCGACC-3’；

利用poxB基因敲除引物得到poxB同源重组片段的核苷酸序列为序列5，其中，第1-81位为poxB基因上游同源臂，第82-1383位为FRT序列和Kan抗性基因，第1384-1465位为poxB基因下游同源臂。转化受体菌株为实施例一得到的突变体E.coli JM109-1。利用菌落PCR的方法验证转化子，以poxBF和poxBR为引物，得到202bp的片段阳性克隆。将该阳性克隆送去测序，其为敲除E.coli JM109-1基因组上的poxB基因得到的菌，将该菌接种到LB液体培养基中，42℃传代三次，除去pCP20，将得到的菌株命名为突变体E.coli JM109-2。

2、敲除ackA基因

ackA基因为乙酸激酶基因，其核苷酸序列如GenBank号：NC_000913.3，Gene ID：946775(update：10-Oct-2019)。

与实施例一中敲除rpe基因构建E.coli JM109-1的方法基本相同，不同的是如下：

ackA基因敲除引物序列如下：

ackAF：

5’-atgtcgagtaagttagtactggttctgaactgcggtagttcttcactgaaatttgccatcGTGTAG

GCTGGAGCTGCTTCG-3’；

ackAR：

5’-TCAGGCAGTCAGGCGGCTCGCGTCTTGCGCGATAACCAGTTCTTCGTTGGTTGGGATAACATTCCG

GGGATCCGTCGACC-3’；

利用ackA基因敲除引物得到ackA同源重组片段的核苷酸序列为序列6，其中，第1-81位为ackA基因上游同源臂，第82-1383位为FRT序列和Kan抗性基因，第1384-1465位为ackA基因下游同源臂。转化受体菌株为上述步骤1得到的突变体E.coliJM109-2。利用菌落PCR的方法验证转化子，以ackAF和ackAR为引物，得到202bp的片段阳性克隆。将该阳性克隆送去测序，其为敲除E.coliJM109-2基因组上的ackA基因得到的菌，将该菌接种到LB液体培养基中，42℃传代三次，除去pCP20，将得到的菌株命名为突变体E.coli JM109-3。

二、重组菌E.coli JM109-3(pUC19-xpk-pta-adhE)的构建

3、将实施例3步骤一得到的重组质粒pUC19-xpk-pta-adhE通过电转化的方法转化到本实施例中步骤一得到的大肠杆菌E.coli JM109-3，并涂布于含有氨苄青霉素的LB固体培养基，37℃培养24h。

4、挑取单克隆于含有氨苄青霉素的LB液体培养基，37℃培养24h。

5、提取转化子的质粒，验证转化的正确性，得到含有质粒pUC19-xpk-pta-adhE的重组菌E.coli JM109-3(pUC19-xpk-pta-adhE)。

E.coli JM109-3(pUC19-xpk-pta-adhE)为敲除E.coli JM109染色体基因rpe、poxB和ackA，并且含有基因adhE、xpk和pta的外源表达盒的重组菌。

实施例5、验证E.coli JM109-1无法利用木糖的摇瓶实验

1、分别将实施例1中步骤一制备的E.coliJM109-1在LB液体培养基中，于37℃、转速200rpm条件下培养16h，作为种子液，将E.coli JM109按照相同条件培养作为对照样。

2、按体积比4％的接种量，将种子液接种到MM液体培养基中，每升培养基含10g木糖，250ml摇瓶中装液量为50ml，于37℃、转速200rpm条件下培养72h，期间收集发酵液。

3、通过高效液相色谱对菌体生长和木糖消耗进行定量检测。具体条件如下：

仪器：岛津公司Essentia LC系列HPLC仪，配有DGU-20A脱气机，LC-16送液泵，SIL-16型自动进样器，RID-20A检测器。

色谱条件：Bio-RadHPX-87H(7.8×300mm)；流速0.60mL/min；柱温55℃；流动相为5mM硫酸水溶液。

检测方法：取木糖浓度分别为0、1、2、3、4、5g/L的木糖标准品水溶液(木糖，Sigma-Aldrich，产品编号X1500)，用0.22μm微孔滤膜过滤，进样10μL，进行HPLC检测，用不同浓度木糖标准溶液的色谱峰面积为纵坐标，不同物质的浓度为横坐标，绘制标准曲线。

取2mL的发酵液，于12000rpm离心10min，将其发酵上清液转移到新的离心管内，用0.22μm微孔滤膜过滤，进样10μL，进行HPLC检测。将待测样品发酵上清液的木糖色谱峰面积代入相应标准曲线中，计算得到待测样品发酵上清液残留的木糖含量。

经过检测，E.coli JM109和E.coli JM109-1在该实验条件下木糖含量变化如图2所示。与E.coli JM109相比，E.coli JM109-1的木糖的浓度浓度不变，OD₆₀₀不增长，这表明E.coli JM109-1突变体在培养基中不能够利用木糖进行生长，本发明已完全阻断大肠杆菌本身的木糖代谢路径，使其不能在以木糖为唯一碳源的基本培养基中生长。

实施例6、重组菌利用木糖的摇瓶实验

1、分别将实施例1中步骤三制备的E.coli JM109-1(pUC19-xpk)、实施例2中步骤二制备的E.coli JM109-1(pUC19-xpk-pta)、实施例3步骤二制备的E.coli JM109-1(pUC19-xpk-pta-adhE)和实施例4步骤二中制备的E.coli JM109-3(pUC19-xpk-pta-adhE)在LB液体培养基中，于37℃、转速200rpm条件下培养16h，作为种子液。

3、通过高效液相色谱对菌体生长、木糖消耗和产物合成情况进行定量检测。具体条件如实施例5所述，乙酸(Sigma-Aldrich，产品编号A6283)和乙醇(Sigma-Aldrich，产品编号459844)标准曲线制备方法与木糖相同，实验结果如图3所示。

当突变体E.coli JM109-1过表达xpk基因后，E.coli JM109-1(pUC19-xpk)可以利用木糖进行生长，但是生长较为缓慢，木糖利用不彻底。该菌株不能合成乙醇。

在此基础上，过表达pta基因。重组菌E.coli JM109-1(pUC19-xpk-pta)木糖利用效率明显增加，可以将木糖完全消耗，但是积累较多的乙酸，达到4.18g/L。由于乙酸的积累，使得E.coli JM109-1(pUC19-xpk-pta)的OD₆₀₀有明显下降，说明乙酸抑制了细菌生长。该菌株不能合成乙醇。

在基础上，过表达adhE基因，重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)能够利用木糖生产乙醇，但最终产量只有0.52g/L，大部分产物是乙酸，乙酸产量为3.82g/L。

为了减少乙酸的积累，敲除poxB和ackA基因。重组菌JM109-3(pUC19-xpk-pta-adhE)的乙酸合成途径被阻断，几乎不积累乙酸，最高只有0.07g/L。与此同时，重组菌JM109-3(pUC19-xpk-pta-adhE)的乙醇产量大幅提高，最终产量为4.52g/L。

序列表

<110> 北京化工大学

<120> 一种利用木糖生产乙醇的基因工程菌及其构建方法和应用

<160> 9

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2546

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aagagctctt gacagctagc tcagtcctag gtataatgct agctactaga gaaagaggag 60

aaatatacca tgaccgagta taacagcgaa gcgtatctga aaaagctgga taaatggtgg 120

cgcgcggcga cttatttagg cgcgggcatg atttttctga aagagaaccc gctgtttagc 180

gttaccggca ccccgattaa agcggaaaac ctgaaagcga acccgattgg ccattggggt 240

acggttagcg gtcagacctt tctgtatgcg catgcgaacc gcctgattaa caaatatgac 300

cagaagatgt tttatatggg cggaccgggt catggtggtc aagcgatggt tgttccgagc 360

tatctggatg gcagctatac cgaagcgtat ccggaaatta cccaggatct ggaaggtatg 420

agccgcctgt ttaaacgctt tagctttccg ggtggcattg gctcacacat gaccgcacaa 480

acccctggca gcttacatga aggtggcgaa ctgggctatg ttctgagcca tgcgaccggt 540

gcgattttag atcagccgga acagattgcg tttgcggtgg tgggtgatgg tgaagcggaa 600

accggccctt taatgaccag ctggcacagc attaaattca tcaacccgaa aaacgatggc 660

gcgattctgc cgattctgga tctgaacggc tttaaaatta gcaacccgac cctgtttgcg 720

cgtaccagcg atgtggatat tcgcaagttt tttgaaggcc tgggctatag cccgcgctat 780

attgaaaacg atgacatcca tgactatatg gcgtatcata aactggcggc ggaagtgttt 840

gataaagcga tcgaggatat tcaccagatt cagaaagatg cgcgcgaaga taaccgctat 900

cagaacggcg aaattccggc gtggccgatt gttattgcgc gcctgcctaa aggttggggc 960

ggtccgcgtt ataatgattg gagcggcccg aaatttgatg gcaaaggcat gccgattgaa 1020

catagctttc gcgcgcatca ggttccttta ccgctgagca gcaaaaacat gggcaccctg 1080

ccggaatttg tgaaatggat gaccagctat cagccggaaa ccctgtttaa cgcggatggc 1140

agcctgaaag aagaactgcg cgattttgcg ccgaaaggcg aaatgcgcat ggcgagcaac 1200

cctgttacca acggcggcgt tgatagcagc aatctggtgt taccggattg gcaggaattt 1260

gcgaacccga ttagcgaaaa caaccgcggc aaactgctgc cggataccaa cgataacatg 1320

gatatgaacg tgctgagcaa atactttgcg gagatcgtga aattaaaccc gacccgcttt 1380

cgcttatttg gcccggatga aaccatgagc aaccgctttt gggaaatgtt taaagtgacc 1440

aaccgccagt ggatgcaggt gattaaaaac ccgaacgacg aatttatttc gccggaaggc 1500

cgcattattg atagccagct gagcgaacat caagcggaag gctggttaga aggctatacc 1560

ttaaccggtc gcactggtgc gtttgcgagc tatgagagct ttctgcgcgt ggtggatagc 1620

atgctgaccc agcattttaa atggattcgc caggcggcgg atcaaaaatg gcgccatgat 1680

tatccgagcc tgaacgtgat tagcaccagc accgtgtttc agcaggatca taacggctat 1740

acccatcaag atccgggcat gttaacccat ctggcggaaa aaaaaagcga tttcatccgc 1800

cagtatctgc cggcggatgg taatactctg ctggcggttt ttgatcgcgc gtttcaggat 1860

cgcagcaaga ttaaccatat tgtggcgagc aaacagcctc gccaacagtg gtttaccaaa 1920

gaagaagcgg aaaaactggc gaccgatggc attgcgacca ttgattgggc gagcaccgcg 1980

aaagatggcg aagcggtgga tctggttttt gcgagcgcgg gtgcggaacc taccattgaa 2040

accctggcgg cgttacatct ggtgaacgaa gtgtttccgc aggcgaaatt tcgctatgtg 2100

aacgtggttg aattaggccg cctgcaaaaa aaaaaaggcg cgctgaacca ggaacgcgaa 2160

ctgagcgatg aagagtttga gaaatatttt ggcccgagcg gtacgcctgt gatttttggc 2220

tttcatggct acgaagatct gattgagagc attttttatc agcgcggcca tgatggttta 2280

attgtgcatg gctatcgcga agatggcgat attaccacca cctatgatat gcgcgtgtat 2340

agcgaactgg atcgctttca tcaggcgatt gatgcgatgc aggtgctgta tgtgaaccgc 2400

aaagtgaatc agggcctggc gaaagcgttt attgatcgca tgaaacgcac cctggtgaaa 2460

cattttgaag tgacccgcaa cgaaggcgtg gatattccgg attttaccga atgggtgtgg 2520

agcgatctga agaaatgacc cgggaa 2546

<210> 2

<211> 2222

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aacccgggtt gacagctagc tcagtcctag gtataatgct agctactaga gaaagaggag 60

aaatatacca tgtcccgtat tattatgctg atccctaccg gaaccagcgt cggtctgacc 120

agcgtcagcc ttggcgtgat ccgtgcaatg gaacgcaaag gcgttcgtct gagcgttttc 180

aaacctatcg ctcagccgcg taccggtggc gatgcgcccg atcagactac gactatcgtg 240

cgtgcgaact cttccaccac gacggccgct gaaccgctga aaatgagcta cgttgaaggt 300

ctgctttcca gcaatcagaa agatgtgctg atggaagaga tcgtcgcaaa ctaccacgct 360

aacaccaaag acgctgaagt cgttctggtt gaaggtctgg tcccgacacg taagcaccag 420

tttgcccagt ctctgaacta cgaaatcgct aaaacgctga atgcggaaat cgtcttcgtt 480

atgtctcagg gcactgacac cccggaacag ctgaaagagc gtatcgaact gacccgcaac 540

agcttcggcg gtgccaaaaa caccaacatc accggcgtta tcgttaacaa actgaacgca 600

ccggttgatg aacagggtcg tactcgcccg gatctgtccg agattttcga cgactcttcc 660

aaagctaaag taaacaatgt tgatccggcg aagctgcaag aatccagccc gctgccggtt 720

ctcggcgctg tgccgtggag ctttgacctg atcgcgactc gtgcgatcga tatggctcgc 780

cacctgaatg cgaccatcat caacgaaggc gacatcaata ctcgccgcgt taaatccgtc 840

actttctgcg cacgcagcat tccgcacatg ctggagcact tccgtgccgg ttctctgctg 900

gtgacttccg cagaccgtcc tgacgtgctg gtggccgctt gcctggcagc catgaacggc 960

gtagaaatcg gtgccctgct gctgactggc ggttacgaaa tggacgcgcg catttctaaa 1020

ctgtgcgaac gtgctttcgc taccggcctg ccggtattta tggtgaacac caacacctgg 1080

cagacctctc tgagcctgca gagcttcaac ctggaagttc cggttgacga tcacgaacgt 1140

atcgagaaag ttcaggaata cgttgctaac tacatcaacg ctgactggat cgaatctctg 1200

actgccactt ctgagcgcag ccgtcgtctg tctccgcctg cgttccgtta tcagctgact 1260

gaacttgcgc gcaaagcggg caaacgtatc gtactgccgg aaggtgacga accgcgtacc 1320

gttaaagcag ccgctatctg tgctgaacgt ggtatcgcaa cttgcgtact gctgggtaat 1380

ccggcagaga tcaaccgtgt tgcagcgtct cagggtgtag aactgggtgc agggattgaa 1440

atcgttgatc cagaagtggt tcgcgaaagc tatgttggtc gtctggtcga actgcgtaag 1500

aacaaaggca tgaccgaaac cgttgcccgc gaacagctgg aagacaacgt ggtgctcggt 1560

acgctgatgc tggaacagga tgaagttgat ggtctggttt ccggtgctgt tcacactacc 1620

gcaaacacca tccgtccgcc gctgcagctg atcaaaactg caccgggcag ctccctggta 1680

tcttccgtgt tcttcatgct gctgccggaa caggtttacg tttacggtga ctgtgcgatc 1740

aacccggatc cgaccgctga acagctggca gaaatcgcga ttcagtccgc tgattccgct 1800

gcggccttcg gtatcgaacc gcgcgttgct atgctctcct actccaccgg tacttctggt 1860

gcaggtagcg acgtagaaaa agttcgcgaa gcaactcgtc tggcgcagga aaaacgtcct 1920

gacctgatga tcgacggtcc gctgcagtac gacgctgcgg taatggctga cgttgcgaaa 1980

tccaaagcgc cgaactctcc ggttgcaggt cgcgctaccg tgttcatctt cccggatctg 2040

aacaccggta acaccaccta caaagcggta cagcgttctg ccgacctgat ctccatcggg 2100

ccgatgctgc agggtatgcg caagccggtt aacgacctgt cccgtggcgc actggttgac 2160

gatatcgtct acaccatcgc gctgactgcg attcagtctg cacagcagca gtaatctaga 2220

aa 2222

<210> 3

<211> 2753

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aatctagatt gacagctagc tcagtcctag gtataatgct agctactaga gaaagaggag 60

aaatatacca tggctgttac taatgtcgct gaacttaacg cactcgtaga gcgtgtaaaa 120

aaagcccagc gtgaatatgc cagtttcact caagagcaag tagacaaaat cttccgcgcc 180

gccgctctgg ctgctgcaga tgctcgaatc ccactcgcga aaatggccgt tgccgaatcc 240

ggcatgggta tcgtcgaaga taaagtgatc aaaaaccact ttgcttctga atatatctac 300

aacgcctata aagatgaaaa aacctgtggt gttctgtctg aagacgacac ttttggtacc 360

atcactatcg ctgaaccaat cggtattatt tgcggtatcg ttccgaccac taacccgact 420

tcaactgcta tcttcaaatc gctgatcagt ctgaagaccc gtaacgccat tatcttctcc 480

ccgcacccgc gtgcaaaaga tgccaccaac aaagcggctg atatcgttct gcaggctgct 540

atcgctgccg gtgctccgaa agatctgatc ggctggatcg atcaaccttc tgttgaactg 600

tctaacgcac tgatgcacca cccagacatc aacctgatcc tcgcgactgg tggtccgggc 660

atggttaaag ccgcatacag ctccggtaaa ccagctatcg gtgtaggcgc gggcaacact 720

ccagttgtta tcgatgaaac tgctgatatc aaacgtgcag ttgcatctgt actgatgtcc 780

aaaaccttcg acaacggcgt aatctgtgct tctgaacagt ctgttgttgt tgttgactct 840

gtttatgacg ctgtacgtga acgttttgca acccacggcg gctatctgtt gcagggtaaa 900

gagctgaaag ctgttcagga tgttatcctg aaaaacggtg cgctgaacgc ggctatcgtt 960

ggtcagccag cctataaaat tgctgaactg gcaggcttct ctgtaccaga aaacaccaag 1020

attctgatcg gtgaagtgac cgttgttgat gaaagcgaac cgttcgcaca tgaaaaactg 1080

tccccgactc tggcaatgta ccgcgctaaa gatttcgaag acgcggtaga aaaagcagag 1140

aaactggttg ctatgggcgg tatcggtcat acctcttgcc tgtacactga ccaggataac 1200

caaccggctc gcgtttctta cttcggtcag aaaatgaaaa cggcgcgtat cctgattaac 1260

accccagcgt ctcagggtgg tatcggtgac ctgtataact tcaaactcgc accttccctg 1320

actctgggtt gtggttcttg gggtggtaac tccatctctg aaaacgttgg tccgaaacac 1380

ctgatcaaca agaaaaccgt tgctaagcga gctgaaaaca tgttgtggca caaacttccg 1440

aaatctatct acttccgccg tggctccctg ccaatcgcgc tggatgaagt gattactgat 1500

ggccacaaac gtgcgctcat cgtgactgac cgcttcctgt tcaacaatgg ttatgctgat 1560

cagatcactt ccgtactgaa agcagcaggc gttgaaactg aagtcttctt cgaagtagaa 1620

gcggacccga ccctgagcat cgttcgtaaa ggtgcagaac tggcaaactc cttcaaacca 1680

gacgtgatta tcgcgctggg tggtggttcc ccgatggacg ccgcgaagat catgtgggtt 1740

atgtacgaac atccggaaac tcacttcgaa gagctggcgc tgcgctttat ggatatccgt 1800

aaacgtatct acaagttccc gaaaatgggc gtgaaagcga aaatgatcgc tgtcaccacc 1860

acttctggta caggttctga agtcactccg tttgcggttg taactgacga cgctactggt 1920

cagaaatatc cgctggcaga ctatgcgctg actccggata tggcgattgt ggacgccaac 1980

ctggttatgg acatgccgaa gtccctgtgt gctttcggtg gtctggacgc agtaactcac 2040

gccatggaag cttatgtttc tgtactggca tctgagttct ctgatggtca ggctctgcag 2100

gcactgaaac tgctgaaaga atatctgcca gcgtcctacc acgaagggtc taaaaatccg 2160

gtagcgcgtg aacgtgttca cagtgcagcg actatcgcgg gtatcgcgtt tgcgaacgcc 2220

ttcctgggtg tatgtcactc aatggcgcac aaactgggtt cccagttcca tattccgcac 2280

ggtctggcaa acgccctgct gatttgtaac gttattcgct acaatgcgaa cgacaacccg 2340

accaagcaga ctgcattcag ccagtatgac cgtccgcagg ctcgccgtcg ttatgctgaa 2400

attgccgacc acttgggtct gagcgcaccg ggcgaccgta ctgctgctaa gatcgagaaa 2460

ctgctggcat ggctggaaac gctgaaagct gaactgggta ttccgaaatc tatccgtgaa 2520

gctggcgttc aggaagcaga cttcctggcg aacgtggata aactgtctga agatgcattc 2580

gatgaccagt gcaccggcgc taacccgcgt tacccgctga tctccgagct gaaacagatt 2640

ctgctggata cctactacgg tcgtgattat gtagaaggtg aaactgcagc gaagaaagaa 2700

gctgctccgg ctaaagctga gaaaaaagcg aaaaaatccg cttaagtcga caa 2753

<210> 4

<211> 1424

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atgaaacagt atttgattgc cccctcaatt ctgtcggctg attttgcccg cctgggtgaa 60

gtgtaggctg gagctgcttc gaagttccta tactttctag agaataggaa cttcggaata 120

ggaacttcaa gatcccctta ttagaagaac tcgtcaagaa ggcgatagaa ggcgatgcgc 180

tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca ttcgccgcca 240

agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc cgccacaccc 300

agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat attcggcaag 360

caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgcgcgc cttgagcctg 420

gcgaacagtt cggctggcgc gagcccctga tgctcttcgt ccagatcatc ctgatcgaca 480

agaccggctt ccatccgagt acgtgctcgc tcgatgcgat gtttcgcttg gtggtcgaat 540

gggcaggtag ccggatcaag cgtatgcagc cgccgcattg catcagccat gatggatact 600

ttctcggcag gagcaaggtg agatgacagg agatcctgcc ccggcacttc gcccaatagc 660

agccagtccc ttcccgcttc agtgacaacg tcgagcacag ctgcgcaagg aacgcccgtc 720

gtggccagcc acgatagccg cgctgcctcg tcctgcagtt cattcagggc accggacagg 780

tcggtcttga caaaaagaac cgggcgcccc tgcgctgaca gccggaacac ggcggcatca 840

gagcagccga ttgtctgttg tgcccagtca tagccgaata gcctctccac ccaagcggcc 900

ggagaacctg cgtgcaatcc atcttgttca atcatgcgaa acgatcctca tcctgtctct 960

tgatcagatc ttgatcccct gcgccatcag atccttggcg gcaagaaagc catccagttt 1020

actttgcagg gcttcccaac cttaccagag ggcgccccag ctggcaattc cggttcgctt 1080

gctgtccata aaaccgccca gtctagctat cgccatgtaa gcccactgca agctacctgc 1140

tttctctttg cgcttgcgtt ttcccttgtc cagatagccc agtagctgac attcatccgg 1200

ggtcagcacc gtttctgcgg actggctttc tacgtgttcc gcttccttta gcagcccttg 1260

cgccctgagt gcttgcggca gcgtgagctt caaaagcgct ctgaagttcc tatactttct 1320

agagaatagg aacttcgaac tgcaggtcga cggatccccg gaatgactac aaaaaagtca 1380

ttgatgaaat gcgcagtgaa ctggcaaagg taagtcatga ataa 1424

<210> 5

<211> 1424

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atgaaacaaa cggttgcagc ttatatcgcc aaaacactcg aatcggcagg ggtgaaacgc 60