一种利用木糖生产乙醇的基因工程菌及其构建方法和应用

文档序号:744830 发布日期:2021-04-23 浏览:17次 >En<

阅读说明:本技术 一种利用木糖生产乙醇的基因工程菌及其构建方法和应用 (Genetically engineered bacterium for producing ethanol by using xylose and construction method and application thereof ) 是由 李正军 史理陇 李弘飞 普楠 陶观宝 于 2019-10-22 设计创作,主要内容包括:本发明涉及一种重组菌的构建方法,所述方法包括对受体菌进行下述A1-A6的改造,得到所述重组菌;A1、敲除所述受体菌的核酮糖磷酸异构酶基因;A2、敲除所述受体菌的丙酮酸氧化酶基因;A3、敲除所述受体菌的乙酸激酶基因;A4、增加所述受体菌中木酮糖裂解酶基因编码蛋白质的表达量;A5、增加所述受体菌中磷酸转乙酰酶编码蛋白质的表达量;A6、增加所述受体菌中双功能乙醛乙醇脱氢酶基因编码蛋白质的表达量;所述受体菌为含有所述核酮糖磷酸异构酶基因、所述丙酮酸氧化酶基因基因和所述乙酸激酶基因的细菌或真菌。本发明构建的重组菌能够提高利用木糖产生乙醇的效率。(The invention relates to a construction method of a recombinant bacterium, which comprises the following steps of carrying out A1-A6 transformation on a receptor bacterium to obtain the recombinant bacterium; a1, knocking out a ribulose phosphate isomerase gene of the recipient bacterium; a2, knocking out the pyruvate oxidase gene of the recipient bacterium; a3, knocking out the acetate kinase gene of the recipient bacterium; a4, increasing the expression level of the protein coded by the xylulose lyase gene in the recipient bacterium; a5, increasing the expression level of protein coded by phosphotransacetylase in the recipient bacterium; a6, increasing the expression level of bifunctional acetaldehyde ethanol dehydrogenase gene encoding protein in the recipient strain; the recipient bacterium is a bacterium or fungus containing the ribulose phosphate isomerase gene, the pyruvate oxidase gene and the acetate kinase gene. The recombinant strain constructed by the invention can improve the efficiency of producing ethanol by using xylose.)

一种利用木糖生产乙醇的基因工程菌及其构建方法和应用

技术领域

本发明属于生物技术、基因工程和发酵工程领域,涉及一种生产乙醇的基因工程菌及其构建方法和应用,更具体地,涉及一种利用木糖生产乙醇的基因工程菌及其构建方法和应用。

背景技术

木糖(D-xylose)是木聚糖的主要构成单位,在植物体内有大量储存,分子式是C5H10O5。木糖分布广泛,主要以聚合体的形式存在。木质纤维素原料中,大约30%的组分由木糖构成,储量非常丰富,是自然界中继葡萄糖之后的第二大糖类物质。木糖在玉米芯中含量较高,利用玉米芯为原料制备木糖工艺较为成熟。

自然界中大部分的微生物可以代谢葡萄糖,但是只有小部分微生物能够代谢木糖。因此与葡萄糖相比,木糖在发酵工业中的应用十分受限。开发高效利用木糖的代谢途径将会对其工业应用产生重要推动作用。自然界中已经发现的木糖代谢途径主要有三条:(1)在大肠杆菌等微生物中,木糖首先由木糖异构酶转化为木酮糖,再在木酮糖激酶的作用下生成木酮糖-5-磷酸,由此进入磷酸戊糖途径分解。(2)在酵母等微生物中,木糖首先被木糖还原酶还原为木糖醇,再经木糖醇脱氢酶氧化为木酮糖,接下来由木酮糖激酶催化生成木酮糖-5-磷酸,进入磷酸戊糖途径分解。(3)新月柄杆菌中,木糖在木糖脱氢酶、木糖酸内酯酶和木糖酸脱水酶的催化下生成2-酮-3-脱氧-木糖酸,再经过脱水、脱氢反应形成α-酮戊二酸,进入三羧酸循环分解。

木糖作为存储量巨大的可再生生物质资源,利用合成生物学与代谢工程技术对微生物进行改造,使其利用木糖为碳源生产高附加值和应用广泛的化学品,具有极其广阔的市场前景。

发明内容

本发明所要解决的技术问题是,如何进行木糖的高效代谢产生乙醇,并提供一种能够用于木糖代谢产生乙醇的重组菌。

为了解决以上技术问题,本发明提供了能够利用木糖产生乙醇的重组菌的构建方法。

本发明所提供的重组菌的构建方法,所述方法包括对受体菌进行下述A1-A7的改造,得到所述重组菌;

A1、敲除所述受体菌的核酮糖磷酸异构酶基因或抑制所述核酮糖磷酸异构酶基因的表达或抑制所述核酮糖磷酸异构酶基因编码的蛋白质的活性;

A2、敲除所述受体菌的丙酮酸氧化酶基因或抑制所述丙酮酸氧化酶基因的表达或抑制所述丙酮酸氧化酶基因编码的蛋白质的活性;

A3、敲除所述受体菌的乙酸激酶基因或抑制所述乙酸激酶基因的表达或抑制所述乙酸激酶基因编码的蛋白质的活性;

A4、增加所述受体菌中木酮糖裂解酶基因编码蛋白质的表达量或增强所述木酮糖裂解酶基因编码蛋白质的活性;

A5、增加所述受体菌中磷酸转乙酰酶编码蛋白质的表达量或增强所述磷酸转乙酰酶编码蛋白质的活性;

A6、增加所述受体菌中双功能乙醛乙醇脱氢酶基因编码蛋白质的表达量或增强所述双功能乙醛乙醇脱氢酶基因编码蛋白质的活性;

所述受体菌为含有所述核酮糖磷酸异构酶基因基因、所述丙酮酸氧化酶基因和所述乙酸激酶基因的细菌或真菌。

进一步,所述受体菌为大肠杆菌。

进一步,所述受体菌为大肠杆菌MG1655或大肠杆菌JM109。

上述方法中,所述核酮糖磷酸异构酶基因可编码b1和b2的蛋白质:

b1、由GenBank号:NC_000913.3,Gene ID:947896所编码的氨基酸序列组成的蛋白质;

b2、在GenBank号:NC_000913.3,Gene ID:947896所编码的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有核酮糖磷酸异构酶活性的由b1)衍生的蛋白质。

上述方法中,所述丙酮酸氧化酶基因可编码c1和c2的蛋白质:

c1、由GenBank号:NC_000913.3,Gene ID:946132所编码的氨基酸序列组成的蛋白质;

c2、在GenBank号:NC_000913.3,Gene ID:946132所编码的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有丙酮酸氧化酶活性的由c1)衍生的蛋白质。

上述方法中,所述乙酸激酶基因可编码d1和d2的蛋白质:

d1、由GenBank号:NC_000913.3,Gene ID:946775所编码的氨基酸序列组成的蛋白质;

d2、在GenBank号:NC_000913.3,Gene ID:946775所编码的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有乙酸激酶活性的由d1)衍生的蛋白质。

上述方法中,所述木酮糖裂解酶基因可编码e1和e2的蛋白质:

e1、由SEQ ID No.7所示的氨基酸序列组成的蛋白质;

e2、在SEQ ID No.7所示的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有木酮糖裂解酶活性的由e1)衍生的蛋白质。

上述方法中,所述双功能乙醛乙醇脱氢酶基因可编码f1和f2的蛋白质:

f1、由SEQ ID No.8所示的氨基酸序列组成的蛋白质;

f2、在SEQ ID No.8所示的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有双功能乙醛乙醇脱氢酶活性的由f1)衍生的蛋白质。

上述方法中,所述磷酸转乙酰酶基因可编码g1和g2的蛋白质:

g1、由SEQ ID No.9所示的氨基酸序列组成的蛋白质;

g2、在SEQ ID No.9所示的氨基酸序列中经过取代和/或缺失和/或添加一个或几个氨基酸残基得到的具有磷酸转乙酰酶活性的由g1)衍生的蛋白质。

上述方法中,所述核酮糖磷酸异构酶基因为rpe基因,其核苷酸序列如GenBank号:NC_000913.3,Gene ID:947896(update:10-Oct-2019)。

丙酮酸氧化酶基因为poxB基因,其核苷酸序列如GenBank号:NC_000913.3,GeneID:946132(update:10-Oct-2019)。

乙酸激酶基因为ackA基因,其核苷酸序列如GenBank号:NC_000913.3,Gene ID:946775(update:10-Oct-2019)。

所述木酮糖裂解酶基因为e11-e13中任一种DNA分子:

e11)其编码序列是SEQ ID NO.1的第70-2458位核苷酸的cDNA或基因组DNA;

e12)在严格条件下与e11)限定的DNA分子杂交且编码所述木酮糖裂解酶的cDNA或基因组DNA;

e13)与e11)或e12)限定的DNA分子具有90%同一性且编码所述木酮糖裂解酶的cDNA或基因组DNA;

所述磷酸转乙酰酶为f11-f13中任一种DNA分子:

f11)其编码序列是SEQ ID NO.2的第70-2215位核苷酸的cDNA或基因组DNA;

f12)在严格条件下与f11)限定的DNA分子杂交且编码所述磷酸转乙酰酶的cDNA或基因组DNA;

f13)与f11)或f12)限定的DNA分子具有90%同一性且编码所述磷酸转乙酰酶的cDNA或基因组DNA;

所述乙醛乙醇脱氢酶为g11-g13中任一种DNA分子:

g11)其编码序列是SEQ ID NO.3的第70-2746位核苷酸的cDNA或基因组DNA;

g12)在严格条件下与g11)限定的DNA分子杂交且编码所述乙醛乙醇脱氢酶的cDNA或基因组DNA;

g13)与g11)或g12)限定的DNA分子具有90%同一性且编码所述乙醛乙醇脱氢酶的cDNA或基因组DNA。

上述的重组菌构建方法构建的重组菌也应在本发明的保护范围之内。

所述的重组菌在生产乙醇中的应用也应在本发明的保护范围之内。

本发明还提供一种通过所述重组菌制备乙醇的方法,所述方法包括以木糖为碳源,利用所述重组菌进行生物转化,制备乙醇。

所述生物转化的培养基为MM液体培养基,所述所述生物转化的条件为:30-37℃瓶震荡培养24-96h,摇瓶的转速为100-200rpm。

所述MM液体培养基的组成如下:每升培养基含10g木糖,2g NH4Cl、5g(NH4)2SO4、6gKH2PO4、8g 3-吗啉丙磺酸、0.5g NaCl,1mL微量元素溶液,余量为水。其中木糖的浓度可以按照需要调整。

所述微量元素溶液的组成如下:每升微量元素溶液含3.6g FeCl2·4H2O、5gCaCl2·2H2O、1.3g MnCl2·2H2O、0.38g CuCl2·2H2O、0.5g CoCl2·6H2O、0.94g ZnCl2、0.03g H3BO3、0.4g Na2EDTA·2H2O、1g thiamine-HCl,其余为0.5M HCl。

本发明的有益效果在于:本发明通过在大肠杆菌中表达3个代谢途径相关基因和敲除3个内源基因,获得了能够利用木糖合成乙醇的工程菌株,并且重组菌在摇瓶培养中的乙醇产量和转化率能达到较高的水平。本发明构建的重组菌具有较好的应用前景。

附图说明

图1为载体图谱;

图2为E.coli JM109和E.coli JM109-1的木糖消耗以及生长曲线;

图3为四种基因工程菌的细菌生长、木糖消耗和产物合成情况。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA的5′末端核苷酸,末位均为相应DNA的3′末端核苷酸。

下述实施例中涉及分子生物学操作所用的酶,均为NEB(New England Biolabs,http://www.neb-china.com/)公司产品;质粒提取和DNA片段回收所用的试剂盒,均为北京博迈德基因技术有限公司(http://www.biomed168.com/)产品;实施例中涉及的DNA合成和测序工作,由北京博迈德基因技术有限公司完成。

E.coliJM109:来源于Promega公司(https://www.promega.com.cn),货号P9751。

E.coliMG1655:来源于E.coliGenetic Resources at Yale CGSC,The ColiGenetic Stock Center(http://cgsc2.biology.yale.edu/),编号CGSC#6300。

E.coli NEB 5-alpha:来源于NEB(New England Biolabs),货号C2987I。

质粒pKD13:来源于E.coli Genetic Resources at Yale CGSC,The ColiGenetic Stock Center,编号CGSC#7633。

质粒pKD46:来源于E.coli Genetic Resources at Yale CGSC,The ColiGenetic Stock Center,编号CGSC#7739。

质粒pCP20:来源于E.coli Genetic Resources at Yale CGSC,The ColiGenetic Stock Center,编号CGSC#7637。

质粒pUC19:来源于NEB(New England Biolabs)公司,货号N3041S。

所述MM液体培养基的组成如下:每升培养基含10g木糖,2g NH4Cl、5g(NH4)2SO4、6gKH2PO4、8g 3-吗啉丙磺酸、0.5g NaCl,1mL微量元素溶液,余量为水。其中木糖的浓度可以按照需要调整。

所述微量元素溶液的组成如下:每升微量元素溶液含3.6g FeCl2·4H2O、5gCaCl2·2H2O、1.3g MnCl2·2H2O、0.38g CuCl2·2H2O、0.5g CoCl2·6H2O、0.94g ZnCl2、0.03g H3BO3、0.4g Na2EDTA·2H2O、1g thiamine-HCl,其余为0.5M HCl。

实施例1、构建重组菌E.coli JM109-1(pUC19-xpk)

一、重组表达载体pUC19-xpk的构建

1、人工合成序列表中序列1所示的DNA,含有xpk表达盒,上游为SacI位点,下游为XmaI位点,其中第9-69位核苷酸为启动子序列,第70-2538位核苷酸为xpk基因序列。

2、用SacI和XmaI双酶切序列1中合成的DNA序列,回收大小约为2532bp的DNA片段;用SacI和XmaI双酶切质粒pUC19,回收大小约为2680bp的DNA片段;将上述两个DNA片段连接,得到连接产物通过化学转化的方法导入到E.coli NEB 5-alpha中,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用SacI和XmaI进行酶切验证,酶切产物大小约为2532bp和2680bp的质粒为阳性质粒,将此重组质粒命名为重组质粒pUC19-xpk。将重组质粒pUC19-xpk进行测序,结果表明:pUC19-xpk为将质粒pUC19的SacI和XmaI识别序列间的DNA片段替换为序列表中序列1的第9-2538位所示的xpk表达盒得到的重组质粒。

二、大肠杆菌E.coli JM109-1的构建

3、敲除rpe基因

rpe基因是核酮糖磷酸异构酶基因,其核苷酸序列如由GenBank号:NC_000913.3,Gene ID:947896,update:10-Oct-2019。

1)合成rpe基因敲除所用的引物rpeF和rpeR,其中,引物的序列如下:

rpeF:

5’-ATGAAACAGTATTTGATTGCCCCCTCAATTCTGTCGGCTGATTTTGCCCGCCTGGGTGAAGTGTAGG

CTGGAGCTGCTTCG-3’;

rpeR:

5’-TTATTCATGACTTACCTTTGCCAGTTCACTGCGCATTTCATCAATGACTTTTTTGTAGTCATTCCGG

GGATCCGTCGACC-3’。

2)以质粒pKD13为模板,采用引物rpeF和rpeR,PCR扩增得到1500bp左右的DNA片段,命名为rpe同源重组片段,琼脂糖凝胶电泳对得到的DNA片段进行纯化。经过测序,rpe同源重组片段的核苷酸序列为序列4,其中,第1-81位为rpe基因上游同源臂,第82-1383位为FRT序列和Kan抗性基因,第1384-1465位为rpe基因下游同源臂。

3)利用电转化的方法将质粒pKD46转化至受体菌株E.coli JM109中,并涂布于含有氨苄青霉素的LB固体培养基,30℃培养24h,得到转化子,提质粒验证,获得含有质粒pKD46的重组菌,记为E.coli JM109(pKD46)。

4)将E.coli JM109(pKD46)接种到含有氨苄青霉素的LB液体培养基中,30℃培养1h,加入阿拉伯糖至终浓度5g/L,继续培养1.5h,接下来制备E.coliJM109(pKD46)的感受态细胞,将步骤2)中获得的DNA片段转入E.coliJM109(pKD46)的感受态细胞中,并涂布于含有卡那霉素的LB固体培养基,37℃培养24h,得到转化子。

5)利用菌落PCR的方法,以rpeF和rpeR为引物,将PCR产物纯化之后测序,筛选正确的rpe基因已经被替换为Kan抗性基因的克隆,得到E.coliJM109rpe-K(pKD46)。

6)将E.coliJM109rpe-K(pKD46)接种于LB液体培养基中,42℃培养传代三次,除去pKD46质粒,得到E.coli JM109rpe-K;E.coli JM109rpe-K是rpe基因被Kan基因替换了的E.coli JM109。

7)将E.coliJM109rpe-K接种到含有卡那霉素的LB液体培养基中,37℃培养24h,转接到含有卡那霉素的LB液体培养基中,37℃培养3h,制备E.coli JM109rpe-K感受态细胞。

8)利用电转化的方法将质粒pCP20转化到E.coli JM109rpe-K感受态细胞中,并涂布于含有氨苄青霉素和氯霉素的LB固体培养基,30℃培养48h,得到转化子。利用菌落PCR的方法验证转化子,以rpeF和rpeR为引物,得到202bp片段的为阳性克隆。将该阳性克隆送去测序,其为敲除E.coli JM109基因组上的rpe基因得到的菌,将该菌接种到LB液体培养基中,42℃传代三次,除去pCP20,将得到的菌株命名为突变体E.coli JM109-1。

三、重组菌E.coli JM109-1(pUC19-xpk)的构建

4、将上述步骤一得到的重组质粒pUC19-xpk通过电转化的方法转化到上述步骤二得到的大肠杆菌E.coli JM109-1,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养24h。

5、挑取单克隆于含有氨苄青霉素的LB液体培养基,37℃培养24h。

6、提取转化子的质粒,验证转化的正确性,得到含有质粒pUC19-xpk的重组菌E.coli JM109-1(pUC19-xpk)。所述E.coli JM109-1(pUC19-xpk)为敲除E.coli JM109染色体基因rpe,并且含有基因xpk的外源表达盒的重组菌。

实施例2、构建重组菌E.coli JM109-1(pUC19-xpk-pta)

一、重组表达载体pUC19-xpk-pta的构建

1、人工合成序列表中序列2所示的DNA,含有pta表达盒,上游为XmaI位点,下游为XbaI位点,其中第9-69位核苷酸为启动子序列,第70-2214位核苷酸为pta基因序列。

2、用XmaI和XbaI双酶切序列2中合成的DNA序列,回收大小约为2222bp的DNA片段;用XmaI和XbaI双酶切质粒pUC19-xpk,回收大小约为5201bp的DNA片段;将上述两个DNA片段连接,得到连接产物通过化学转化的方法导入到E.coliNEB 5-alpha中,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用EcoRI和XbaI进行酶切验证,酶切产物大小约为4754bp和2659bp的质粒为阳性质粒,将此重组质粒命名为重组质粒pUC19-xpk-pta。将重组质粒pUC19-xpk-pta进行测序,结果表明:pUC19-xpk-pta为将质粒pUC19-phaC的XmaI和XbaI识别序列间的DNA片段替换为序列表中序列2的第9-2214位所示的pta表达盒得到的重组质粒。

二、重组菌E.coli JM109-1(pUC19-xpk-pta)的构建

3、将上述步骤一得到的重组质粒pUC19-xpk-pta通过电转化的方法转化到实施例一中的步骤二得到的大肠杆菌E.coli JM109-1,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养24h。

4、挑取单克隆于含有氨苄青霉素的LB液体培养基,37℃培养24h。

5、提取转化子的质粒,验证转化的正确性,得到含有质粒pUC19-xpk-pta的重组菌E.coli JM109-1(pUC19-xpk-pta)。所述E.coli JM109-1(pUC19-xpk-pta)为敲除E.coliJM109染色体基因rpe,并且含有基因xpk和pta的外源表达盒的重组菌。

实施例3、构建重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)

一、重组表达载体pUC19-xpk-pta-adhE的构建

1、人工合成序列表中序列3所示的DNA,含有adhE表达盒,上游为XbaI位点,下游为SalI位点,其中第9-69位核苷酸为启动子序列,第70-2745位核苷酸为adhE基因序列。

2、用XbaI和SalI双酶切序列3中合成的DNA序列,回收大小约为2743bp的DNA片段;用XbaI和SphI双酶切质粒pUC19-xpk-pta,回收大小约为7407bp的DNA片段;将上述两个DNA片段连接,得到连接产物通过化学转化的方法导入到E.coli NEB5-alpha中,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用XbaI和SalI进行酶切验证,酶切产物大小约为2743bp和7407bp的质粒为阳性质粒,将此重组质粒命名为重组质粒pUC19-xpk-pta-adhE。将重组质粒pUC19-xpk-pta-adhE进行测序,结果表明:pUC19-xpk-pta-adhE为将质粒pUC19-xpk-pta的XbaI和SalI识别序列间的DNA片段替换为序列表中序列3的第9-2745位所示的adhE表达盒得到的重组质粒。也就是说,所述质粒pUC19-xpk-pta-adhE上同时含有xpk、pta和adhE的基因。

二、重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)的构建

3、将上述步骤一得到的重组质粒pUC19-xpk-pta-adhE通过电转化的方法转化到实施例一中的步骤二得到的大肠杆菌E.coli JM109-1,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养24h。

4、挑取单克隆于含有氨苄青霉素的LB液体培养基,37℃培养24h。

5、提取转化子的质粒,验证转化的正确性,得到含有质粒pUC19-xpk-pta-adhE的重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)。所述E.coli JM109-1(pUC19-xpk-pta-adhE)为敲除E.coliJM109染色体基因rpe,并且含有基因adhE、xpk和pta的外源表达盒的重组菌。

实施例4、构建重组菌E.coli JM109-3(pUC19-xpk-pta-adhE)

一、大肠杆菌E.coli JM109-3的构建

1、敲除poxB基因

poxB基因为丙酮酸氧化酶基因,其核苷酸序列如GenBank号:NC_000913.3,GeneID:946132(update:10-Oct-2019)。

与实施例一中敲除rpe基因构建E.coli JM109-1的方法基本相同,不同的是如下:

poxB基因敲除引物序列如下:

poxBF:5’-

atgaaacaaacggttgcagcttatatcgccaaaacactcgaatcggcaggggtgaaacgcGTGTAGGCTGG AGCTGCTTCG-3’;

poxBR:5’

-TTACCTTAGCCAGTTTGTTTTCGCCAGTTCGATCACTTCATCACCGCGTCCGCTGATGATATTCCGGGGATCCG TCGACC-3’;

利用poxB基因敲除引物得到poxB同源重组片段的核苷酸序列为序列5,其中,第1-81位为poxB基因上游同源臂,第82-1383位为FRT序列和Kan抗性基因,第1384-1465位为poxB基因下游同源臂。转化受体菌株为实施例一得到的突变体E.coli JM109-1。利用菌落PCR的方法验证转化子,以poxBF和poxBR为引物,得到202bp的片段阳性克隆。将该阳性克隆送去测序,其为敲除E.coli JM109-1基因组上的poxB基因得到的菌,将该菌接种到LB液体培养基中,42℃传代三次,除去pCP20,将得到的菌株命名为突变体E.coli JM109-2。

2、敲除ackA基因

ackA基因为乙酸激酶基因,其核苷酸序列如GenBank号:NC_000913.3,Gene ID:946775(update:10-Oct-2019)。

与实施例一中敲除rpe基因构建E.coli JM109-1的方法基本相同,不同的是如下:

ackA基因敲除引物序列如下:

ackAF:

5’-atgtcgagtaagttagtactggttctgaactgcggtagttcttcactgaaatttgccatcGTGTAG

GCTGGAGCTGCTTCG-3’;

ackAR:

5’-TCAGGCAGTCAGGCGGCTCGCGTCTTGCGCGATAACCAGTTCTTCGTTGGTTGGGATAACATTCCG

GGGATCCGTCGACC-3’;

利用ackA基因敲除引物得到ackA同源重组片段的核苷酸序列为序列6,其中,第1-81位为ackA基因上游同源臂,第82-1383位为FRT序列和Kan抗性基因,第1384-1465位为ackA基因下游同源臂。转化受体菌株为上述步骤1得到的突变体E.coliJM109-2。利用菌落PCR的方法验证转化子,以ackAF和ackAR为引物,得到202bp的片段阳性克隆。将该阳性克隆送去测序,其为敲除E.coliJM109-2基因组上的ackA基因得到的菌,将该菌接种到LB液体培养基中,42℃传代三次,除去pCP20,将得到的菌株命名为突变体E.coli JM109-3。

二、重组菌E.coli JM109-3(pUC19-xpk-pta-adhE)的构建

3、将实施例3步骤一得到的重组质粒pUC19-xpk-pta-adhE通过电转化的方法转化到本实施例中步骤一得到的大肠杆菌E.coli JM109-3,并涂布于含有氨苄青霉素的LB固体培养基,37℃培养24h。

4、挑取单克隆于含有氨苄青霉素的LB液体培养基,37℃培养24h。

5、提取转化子的质粒,验证转化的正确性,得到含有质粒pUC19-xpk-pta-adhE的重组菌E.coli JM109-3(pUC19-xpk-pta-adhE)。

E.coli JM109-3(pUC19-xpk-pta-adhE)为敲除E.coli JM109染色体基因rpe、poxB和ackA,并且含有基因adhE、xpk和pta的外源表达盒的重组菌。

实施例5、验证E.coli JM109-1无法利用木糖的摇瓶实验

1、分别将实施例1中步骤一制备的E.coliJM109-1在LB液体培养基中,于37℃、转速200rpm条件下培养16h,作为种子液,将E.coli JM109按照相同条件培养作为对照样。

2、按体积比4%的接种量,将种子液接种到MM液体培养基中,每升培养基含10g木糖,250ml摇瓶中装液量为50ml,于37℃、转速200rpm条件下培养72h,期间收集发酵液。

3、通过高效液相色谱对菌体生长和木糖消耗进行定量检测。具体条件如下:

仪器:岛津公司Essentia LC系列HPLC仪,配有DGU-20A脱气机,LC-16送液泵,SIL-16型自动进样器,RID-20A检测器。

色谱条件:Bio-RadHPX-87H(7.8×300mm);流速0.60mL/min;柱温55℃;流动相为5mM硫酸水溶液。

检测方法:取木糖浓度分别为0、1、2、3、4、5g/L的木糖标准品水溶液(木糖,Sigma-Aldrich,产品编号X1500),用0.22μm微孔滤膜过滤,进样10μL,进行HPLC检测,用不同浓度木糖标准溶液的色谱峰面积为纵坐标,不同物质的浓度为横坐标,绘制标准曲线。

取2mL的发酵液,于12000rpm离心10min,将其发酵上清液转移到新的离心管内,用0.22μm微孔滤膜过滤,进样10μL,进行HPLC检测。将待测样品发酵上清液的木糖色谱峰面积代入相应标准曲线中,计算得到待测样品发酵上清液残留的木糖含量。

经过检测,E.coli JM109和E.coli JM109-1在该实验条件下木糖含量变化如图2所示。与E.coli JM109相比,E.coli JM109-1的木糖的浓度浓度不变,OD600不增长,这表明E.coli JM109-1突变体在培养基中不能够利用木糖进行生长,本发明已完全阻断大肠杆菌本身的木糖代谢路径,使其不能在以木糖为唯一碳源的基本培养基中生长。

实施例6、重组菌利用木糖的摇瓶实验

1、分别将实施例1中步骤三制备的E.coli JM109-1(pUC19-xpk)、实施例2中步骤二制备的E.coli JM109-1(pUC19-xpk-pta)、实施例3步骤二制备的E.coli JM109-1(pUC19-xpk-pta-adhE)和实施例4步骤二中制备的E.coli JM109-3(pUC19-xpk-pta-adhE)在LB液体培养基中,于37℃、转速200rpm条件下培养16h,作为种子液。

2、按体积比4%的接种量,将种子液接种到MM液体培养基中,每升培养基含10g木糖,250ml摇瓶中装液量为50ml,于37℃、转速200rpm条件下培养72h,期间收集发酵液。

3、通过高效液相色谱对菌体生长、木糖消耗和产物合成情况进行定量检测。具体条件如实施例5所述,乙酸(Sigma-Aldrich,产品编号A6283)和乙醇(Sigma-Aldrich,产品编号459844)标准曲线制备方法与木糖相同,实验结果如图3所示。

当突变体E.coli JM109-1过表达xpk基因后,E.coli JM109-1(pUC19-xpk)可以利用木糖进行生长,但是生长较为缓慢,木糖利用不彻底。该菌株不能合成乙醇。

在此基础上,过表达pta基因。重组菌E.coli JM109-1(pUC19-xpk-pta)木糖利用效率明显增加,可以将木糖完全消耗,但是积累较多的乙酸,达到4.18g/L。由于乙酸的积累,使得E.coli JM109-1(pUC19-xpk-pta)的OD600有明显下降,说明乙酸抑制了细菌生长。该菌株不能合成乙醇。

在基础上,过表达adhE基因,重组菌E.coli JM109-1(pUC19-xpk-pta-adhE)能够利用木糖生产乙醇,但最终产量只有0.52g/L,大部分产物是乙酸,乙酸产量为3.82g/L。

为了减少乙酸的积累,敲除poxB和ackA基因。重组菌JM109-3(pUC19-xpk-pta-adhE)的乙酸合成途径被阻断,几乎不积累乙酸,最高只有0.07g/L。与此同时,重组菌JM109-3(pUC19-xpk-pta-adhE)的乙醇产量大幅提高,最终产量为4.52g/L。

序列表

<110> 北京化工大学

<120> 一种利用木糖生产乙醇的基因工程菌及其构建方法和应用

<160> 9

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2546

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aagagctctt gacagctagc tcagtcctag gtataatgct agctactaga gaaagaggag 60

aaatatacca tgaccgagta taacagcgaa gcgtatctga aaaagctgga taaatggtgg 120

cgcgcggcga cttatttagg cgcgggcatg atttttctga aagagaaccc gctgtttagc 180

gttaccggca ccccgattaa agcggaaaac ctgaaagcga acccgattgg ccattggggt 240

acggttagcg gtcagacctt tctgtatgcg catgcgaacc gcctgattaa caaatatgac 300

cagaagatgt tttatatggg cggaccgggt catggtggtc aagcgatggt tgttccgagc 360

tatctggatg gcagctatac cgaagcgtat ccggaaatta cccaggatct ggaaggtatg 420

agccgcctgt ttaaacgctt tagctttccg ggtggcattg gctcacacat gaccgcacaa 480

acccctggca gcttacatga aggtggcgaa ctgggctatg ttctgagcca tgcgaccggt 540

gcgattttag atcagccgga acagattgcg tttgcggtgg tgggtgatgg tgaagcggaa 600

accggccctt taatgaccag ctggcacagc attaaattca tcaacccgaa aaacgatggc 660

gcgattctgc cgattctgga tctgaacggc tttaaaatta gcaacccgac cctgtttgcg 720

cgtaccagcg atgtggatat tcgcaagttt tttgaaggcc tgggctatag cccgcgctat 780

attgaaaacg atgacatcca tgactatatg gcgtatcata aactggcggc ggaagtgttt 840

gataaagcga tcgaggatat tcaccagatt cagaaagatg cgcgcgaaga taaccgctat 900

cagaacggcg aaattccggc gtggccgatt gttattgcgc gcctgcctaa aggttggggc 960

ggtccgcgtt ataatgattg gagcggcccg aaatttgatg gcaaaggcat gccgattgaa 1020

catagctttc gcgcgcatca ggttccttta ccgctgagca gcaaaaacat gggcaccctg 1080

ccggaatttg tgaaatggat gaccagctat cagccggaaa ccctgtttaa cgcggatggc 1140

agcctgaaag aagaactgcg cgattttgcg ccgaaaggcg aaatgcgcat ggcgagcaac 1200

cctgttacca acggcggcgt tgatagcagc aatctggtgt taccggattg gcaggaattt 1260

gcgaacccga ttagcgaaaa caaccgcggc aaactgctgc cggataccaa cgataacatg 1320

gatatgaacg tgctgagcaa atactttgcg gagatcgtga aattaaaccc gacccgcttt 1380

cgcttatttg gcccggatga aaccatgagc aaccgctttt gggaaatgtt taaagtgacc 1440

aaccgccagt ggatgcaggt gattaaaaac ccgaacgacg aatttatttc gccggaaggc 1500

cgcattattg atagccagct gagcgaacat caagcggaag gctggttaga aggctatacc 1560

ttaaccggtc gcactggtgc gtttgcgagc tatgagagct ttctgcgcgt ggtggatagc 1620

atgctgaccc agcattttaa atggattcgc caggcggcgg atcaaaaatg gcgccatgat 1680

tatccgagcc tgaacgtgat tagcaccagc accgtgtttc agcaggatca taacggctat 1740

acccatcaag atccgggcat gttaacccat ctggcggaaa aaaaaagcga tttcatccgc 1800

cagtatctgc cggcggatgg taatactctg ctggcggttt ttgatcgcgc gtttcaggat 1860

cgcagcaaga ttaaccatat tgtggcgagc aaacagcctc gccaacagtg gtttaccaaa 1920

gaagaagcgg aaaaactggc gaccgatggc attgcgacca ttgattgggc gagcaccgcg 1980

aaagatggcg aagcggtgga tctggttttt gcgagcgcgg gtgcggaacc taccattgaa 2040

accctggcgg cgttacatct ggtgaacgaa gtgtttccgc aggcgaaatt tcgctatgtg 2100

aacgtggttg aattaggccg cctgcaaaaa aaaaaaggcg cgctgaacca ggaacgcgaa 2160

ctgagcgatg aagagtttga gaaatatttt ggcccgagcg gtacgcctgt gatttttggc 2220

tttcatggct acgaagatct gattgagagc attttttatc agcgcggcca tgatggttta 2280

attgtgcatg gctatcgcga agatggcgat attaccacca cctatgatat gcgcgtgtat 2340

agcgaactgg atcgctttca tcaggcgatt gatgcgatgc aggtgctgta tgtgaaccgc 2400

aaagtgaatc agggcctggc gaaagcgttt attgatcgca tgaaacgcac cctggtgaaa 2460

cattttgaag tgacccgcaa cgaaggcgtg gatattccgg attttaccga atgggtgtgg 2520

agcgatctga agaaatgacc cgggaa 2546

<210> 2

<211> 2222

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aacccgggtt gacagctagc tcagtcctag gtataatgct agctactaga gaaagaggag 60

aaatatacca tgtcccgtat tattatgctg atccctaccg gaaccagcgt cggtctgacc 120

agcgtcagcc ttggcgtgat ccgtgcaatg gaacgcaaag gcgttcgtct gagcgttttc 180

aaacctatcg ctcagccgcg taccggtggc gatgcgcccg atcagactac gactatcgtg 240

cgtgcgaact cttccaccac gacggccgct gaaccgctga aaatgagcta cgttgaaggt 300

ctgctttcca gcaatcagaa agatgtgctg atggaagaga tcgtcgcaaa ctaccacgct 360

aacaccaaag acgctgaagt cgttctggtt gaaggtctgg tcccgacacg taagcaccag 420

tttgcccagt ctctgaacta cgaaatcgct aaaacgctga atgcggaaat cgtcttcgtt 480

atgtctcagg gcactgacac cccggaacag ctgaaagagc gtatcgaact gacccgcaac 540

agcttcggcg gtgccaaaaa caccaacatc accggcgtta tcgttaacaa actgaacgca 600

ccggttgatg aacagggtcg tactcgcccg gatctgtccg agattttcga cgactcttcc 660

aaagctaaag taaacaatgt tgatccggcg aagctgcaag aatccagccc gctgccggtt 720

ctcggcgctg tgccgtggag ctttgacctg atcgcgactc gtgcgatcga tatggctcgc 780

cacctgaatg cgaccatcat caacgaaggc gacatcaata ctcgccgcgt taaatccgtc 840

actttctgcg cacgcagcat tccgcacatg ctggagcact tccgtgccgg ttctctgctg 900

gtgacttccg cagaccgtcc tgacgtgctg gtggccgctt gcctggcagc catgaacggc 960

gtagaaatcg gtgccctgct gctgactggc ggttacgaaa tggacgcgcg catttctaaa 1020

ctgtgcgaac gtgctttcgc taccggcctg ccggtattta tggtgaacac caacacctgg 1080

cagacctctc tgagcctgca gagcttcaac ctggaagttc cggttgacga tcacgaacgt 1140

atcgagaaag ttcaggaata cgttgctaac tacatcaacg ctgactggat cgaatctctg 1200

actgccactt ctgagcgcag ccgtcgtctg tctccgcctg cgttccgtta tcagctgact 1260

gaacttgcgc gcaaagcggg caaacgtatc gtactgccgg aaggtgacga accgcgtacc 1320

gttaaagcag ccgctatctg tgctgaacgt ggtatcgcaa cttgcgtact gctgggtaat 1380

ccggcagaga tcaaccgtgt tgcagcgtct cagggtgtag aactgggtgc agggattgaa 1440

atcgttgatc cagaagtggt tcgcgaaagc tatgttggtc gtctggtcga actgcgtaag 1500

aacaaaggca tgaccgaaac cgttgcccgc gaacagctgg aagacaacgt ggtgctcggt 1560

acgctgatgc tggaacagga tgaagttgat ggtctggttt ccggtgctgt tcacactacc 1620

gcaaacacca tccgtccgcc gctgcagctg atcaaaactg caccgggcag ctccctggta 1680

tcttccgtgt tcttcatgct gctgccggaa caggtttacg tttacggtga ctgtgcgatc 1740

aacccggatc cgaccgctga acagctggca gaaatcgcga ttcagtccgc tgattccgct 1800

gcggccttcg gtatcgaacc gcgcgttgct atgctctcct actccaccgg tacttctggt 1860

gcaggtagcg acgtagaaaa agttcgcgaa gcaactcgtc tggcgcagga aaaacgtcct 1920

gacctgatga tcgacggtcc gctgcagtac gacgctgcgg taatggctga cgttgcgaaa 1980

tccaaagcgc cgaactctcc ggttgcaggt cgcgctaccg tgttcatctt cccggatctg 2040

aacaccggta acaccaccta caaagcggta cagcgttctg ccgacctgat ctccatcggg 2100

ccgatgctgc agggtatgcg caagccggtt aacgacctgt cccgtggcgc actggttgac 2160

gatatcgtct acaccatcgc gctgactgcg attcagtctg cacagcagca gtaatctaga 2220

aa 2222

<210> 3

<211> 2753

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aatctagatt gacagctagc tcagtcctag gtataatgct agctactaga gaaagaggag 60

aaatatacca tggctgttac taatgtcgct gaacttaacg cactcgtaga gcgtgtaaaa 120

aaagcccagc gtgaatatgc cagtttcact caagagcaag tagacaaaat cttccgcgcc 180

gccgctctgg ctgctgcaga tgctcgaatc ccactcgcga aaatggccgt tgccgaatcc 240

ggcatgggta tcgtcgaaga taaagtgatc aaaaaccact ttgcttctga atatatctac 300

aacgcctata aagatgaaaa aacctgtggt gttctgtctg aagacgacac ttttggtacc 360

atcactatcg ctgaaccaat cggtattatt tgcggtatcg ttccgaccac taacccgact 420

tcaactgcta tcttcaaatc gctgatcagt ctgaagaccc gtaacgccat tatcttctcc 480

ccgcacccgc gtgcaaaaga tgccaccaac aaagcggctg atatcgttct gcaggctgct 540

atcgctgccg gtgctccgaa agatctgatc ggctggatcg atcaaccttc tgttgaactg 600

tctaacgcac tgatgcacca cccagacatc aacctgatcc tcgcgactgg tggtccgggc 660

atggttaaag ccgcatacag ctccggtaaa ccagctatcg gtgtaggcgc gggcaacact 720

ccagttgtta tcgatgaaac tgctgatatc aaacgtgcag ttgcatctgt actgatgtcc 780

aaaaccttcg acaacggcgt aatctgtgct tctgaacagt ctgttgttgt tgttgactct 840

gtttatgacg ctgtacgtga acgttttgca acccacggcg gctatctgtt gcagggtaaa 900

gagctgaaag ctgttcagga tgttatcctg aaaaacggtg cgctgaacgc ggctatcgtt 960

ggtcagccag cctataaaat tgctgaactg gcaggcttct ctgtaccaga aaacaccaag 1020

attctgatcg gtgaagtgac cgttgttgat gaaagcgaac cgttcgcaca tgaaaaactg 1080

tccccgactc tggcaatgta ccgcgctaaa gatttcgaag acgcggtaga aaaagcagag 1140

aaactggttg ctatgggcgg tatcggtcat acctcttgcc tgtacactga ccaggataac 1200

caaccggctc gcgtttctta cttcggtcag aaaatgaaaa cggcgcgtat cctgattaac 1260

accccagcgt ctcagggtgg tatcggtgac ctgtataact tcaaactcgc accttccctg 1320

actctgggtt gtggttcttg gggtggtaac tccatctctg aaaacgttgg tccgaaacac 1380

ctgatcaaca agaaaaccgt tgctaagcga gctgaaaaca tgttgtggca caaacttccg 1440

aaatctatct acttccgccg tggctccctg ccaatcgcgc tggatgaagt gattactgat 1500

ggccacaaac gtgcgctcat cgtgactgac cgcttcctgt tcaacaatgg ttatgctgat 1560

cagatcactt ccgtactgaa agcagcaggc gttgaaactg aagtcttctt cgaagtagaa 1620

gcggacccga ccctgagcat cgttcgtaaa ggtgcagaac tggcaaactc cttcaaacca 1680

gacgtgatta tcgcgctggg tggtggttcc ccgatggacg ccgcgaagat catgtgggtt 1740

atgtacgaac atccggaaac tcacttcgaa gagctggcgc tgcgctttat ggatatccgt 1800

aaacgtatct acaagttccc gaaaatgggc gtgaaagcga aaatgatcgc tgtcaccacc 1860

acttctggta caggttctga agtcactccg tttgcggttg taactgacga cgctactggt 1920

cagaaatatc cgctggcaga ctatgcgctg actccggata tggcgattgt ggacgccaac 1980

ctggttatgg acatgccgaa gtccctgtgt gctttcggtg gtctggacgc agtaactcac 2040

gccatggaag cttatgtttc tgtactggca tctgagttct ctgatggtca ggctctgcag 2100

gcactgaaac tgctgaaaga atatctgcca gcgtcctacc acgaagggtc taaaaatccg 2160

gtagcgcgtg aacgtgttca cagtgcagcg actatcgcgg gtatcgcgtt tgcgaacgcc 2220

ttcctgggtg tatgtcactc aatggcgcac aaactgggtt cccagttcca tattccgcac 2280

ggtctggcaa acgccctgct gatttgtaac gttattcgct acaatgcgaa cgacaacccg 2340

accaagcaga ctgcattcag ccagtatgac cgtccgcagg ctcgccgtcg ttatgctgaa 2400

attgccgacc acttgggtct gagcgcaccg ggcgaccgta ctgctgctaa gatcgagaaa 2460

ctgctggcat ggctggaaac gctgaaagct gaactgggta ttccgaaatc tatccgtgaa 2520

gctggcgttc aggaagcaga cttcctggcg aacgtggata aactgtctga agatgcattc 2580

gatgaccagt gcaccggcgc taacccgcgt tacccgctga tctccgagct gaaacagatt 2640

ctgctggata cctactacgg tcgtgattat gtagaaggtg aaactgcagc gaagaaagaa 2700

gctgctccgg ctaaagctga gaaaaaagcg aaaaaatccg cttaagtcga caa 2753

<210> 4

<211> 1424

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atgaaacagt atttgattgc cccctcaatt ctgtcggctg attttgcccg cctgggtgaa 60

gtgtaggctg gagctgcttc gaagttccta tactttctag agaataggaa cttcggaata 120

ggaacttcaa gatcccctta ttagaagaac tcgtcaagaa ggcgatagaa ggcgatgcgc 180

tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca ttcgccgcca 240

agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc cgccacaccc 300

agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat attcggcaag 360

caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgcgcgc cttgagcctg 420

gcgaacagtt cggctggcgc gagcccctga tgctcttcgt ccagatcatc ctgatcgaca 480

agaccggctt ccatccgagt acgtgctcgc tcgatgcgat gtttcgcttg gtggtcgaat 540

gggcaggtag ccggatcaag cgtatgcagc cgccgcattg catcagccat gatggatact 600

ttctcggcag gagcaaggtg agatgacagg agatcctgcc ccggcacttc gcccaatagc 660

agccagtccc ttcccgcttc agtgacaacg tcgagcacag ctgcgcaagg aacgcccgtc 720

gtggccagcc acgatagccg cgctgcctcg tcctgcagtt cattcagggc accggacagg 780

tcggtcttga caaaaagaac cgggcgcccc tgcgctgaca gccggaacac ggcggcatca 840

gagcagccga ttgtctgttg tgcccagtca tagccgaata gcctctccac ccaagcggcc 900

ggagaacctg cgtgcaatcc atcttgttca atcatgcgaa acgatcctca tcctgtctct 960

tgatcagatc ttgatcccct gcgccatcag atccttggcg gcaagaaagc catccagttt 1020

actttgcagg gcttcccaac cttaccagag ggcgccccag ctggcaattc cggttcgctt 1080

gctgtccata aaaccgccca gtctagctat cgccatgtaa gcccactgca agctacctgc 1140

tttctctttg cgcttgcgtt ttcccttgtc cagatagccc agtagctgac attcatccgg 1200

ggtcagcacc gtttctgcgg actggctttc tacgtgttcc gcttccttta gcagcccttg 1260

cgccctgagt gcttgcggca gcgtgagctt caaaagcgct ctgaagttcc tatactttct 1320

agagaatagg aacttcgaac tgcaggtcga cggatccccg gaatgactac aaaaaagtca 1380

ttgatgaaat gcgcagtgaa ctggcaaagg taagtcatga ataa 1424

<210> 5

<211> 1424

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atgaaacaaa cggttgcagc ttatatcgcc aaaacactcg aatcggcagg ggtgaaacgc 60

gtgtaggctg gagctgcttc gaagttccta tactttctag agaataggaa cttcggaata 120

ggaacttcaa gatcccctta ttagaagaac tcgtcaagaa ggcgatagaa ggcgatgcgc 180

tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca ttcgccgcca 240

agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc cgccacaccc 300

agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat attcggcaag 360

caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgcgcgc cttgagcctg 420

gcgaacagtt cggctggcgc gagcccctga tgctcttcgt ccagatcatc ctgatcgaca 480

agaccggctt ccatccgagt acgtgctcgc tcgatgcgat gtttcgcttg gtggtcgaat 540

gggcaggtag ccggatcaag cgtatgcagc cgccgcattg catcagccat gatggatact 600

ttctcggcag gagcaaggtg agatgacagg agatcctgcc ccggcacttc gcccaatagc 660

agccagtccc ttcccgcttc agtgacaacg tcgagcacag ctgcgcaagg aacgcccgtc 720

gtggccagcc acgatagccg cgctgcctcg tcctgcagtt cattcagggc accggacagg 780

tcggtcttga caaaaagaac cgggcgcccc tgcgctgaca gccggaacac ggcggcatca 840

gagcagccga ttgtctgttg tgcccagtca tagccgaata gcctctccac ccaagcggcc 900

ggagaacctg cgtgcaatcc atcttgttca atcatgcgaa acgatcctca tcctgtctct 960

tgatcagatc ttgatcccct gcgccatcag atccttggcg gcaagaaagc catccagttt 1020

actttgcagg gcttcccaac cttaccagag ggcgccccag ctggcaattc cggttcgctt 1080

gctgtccata aaaccgccca gtctagctat cgccatgtaa gcccactgca agctacctgc 1140

tttctctttg cgcttgcgtt ttcccttgtc cagatagccc agtagctgac attcatccgg 1200

ggtcagcacc gtttctgcgg actggctttc tacgtgttcc gcttccttta gcagcccttg 1260

cgccctgagt gcttgcggca gcgtgagctt caaaagcgct ctgaagttcc tatactttct 1320

agagaatagg aacttcgaac tgcaggtcga cggatccccg gaatatcatc agcggacgcg 1380

gtgatgaagt gatcgaactg gcgaaaacaa actggctaag gtaa 1424

<210> 6

<211> 1424

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atgtcgagta agttagtact ggttctgaac tgcggtagtt cttcactgaa atttgccatc 60

gtgtaggctg gagctgcttc gaagttccta tactttctag agaataggaa cttcggaata 120

ggaacttcaa gatcccctta ttagaagaac tcgtcaagaa ggcgatagaa ggcgatgcgc 180

tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca ttcgccgcca 240

agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc cgccacaccc 300

agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat attcggcaag 360

caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgcgcgc cttgagcctg 420

gcgaacagtt cggctggcgc gagcccctga tgctcttcgt ccagatcatc ctgatcgaca 480

agaccggctt ccatccgagt acgtgctcgc tcgatgcgat gtttcgcttg gtggtcgaat 540

gggcaggtag ccggatcaag cgtatgcagc cgccgcattg catcagccat gatggatact 600

ttctcggcag gagcaaggtg agatgacagg agatcctgcc ccggcacttc gcccaatagc 660

agccagtccc ttcccgcttc agtgacaacg tcgagcacag ctgcgcaagg aacgcccgtc 720

gtggccagcc acgatagccg cgctgcctcg tcctgcagtt cattcagggc accggacagg 780

tcggtcttga caaaaagaac cgggcgcccc tgcgctgaca gccggaacac ggcggcatca 840

gagcagccga ttgtctgttg tgcccagtca tagccgaata gcctctccac ccaagcggcc 900

ggagaacctg cgtgcaatcc atcttgttca atcatgcgaa acgatcctca tcctgtctct 960

tgatcagatc ttgatcccct gcgccatcag atccttggcg gcaagaaagc catccagttt 1020

actttgcagg gcttcccaac cttaccagag ggcgccccag ctggcaattc cggttcgctt 1080

gctgtccata aaaccgccca gtctagctat cgccatgtaa gcccactgca agctacctgc 1140

tttctctttg cgcttgcgtt ttcccttgtc cagatagccc agtagctgac attcatccgg 1200

ggtcagcacc gtttctgcgg actggctttc tacgtgttcc gcttccttta gcagcccttg 1260

cgccctgagt gcttgcggca gcgtgagctt caaaagcgct ctgaagttcc tatactttct 1320

agagaatagg aacttcgaac tgcaggtcga cggatccccg gaatgttatc ccaaccaacg 1380

aagaactggt tatcgcgcaa gacgcgagcc gcctgactgc ctga 1424

<210> 7

<211> 822

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Met Thr Glu Tyr Asn Ser Glu Ala Tyr Leu Lys Lys Leu Asp Lys Trp

1 5 10 15

Trp Arg Ala Ala Thr Tyr Leu Gly Ala Gly Met Ile Phe Leu Lys Glu

20 25 30

Asn Pro Leu Phe Ser Val Thr Gly Thr Pro Ile Lys Ala Glu Asn Leu

35 40 45

Lys Ala Asn Pro Ile Gly His Trp Gly Thr Val Ser Gly Gln Thr Phe

50 55 60

Leu Tyr Ala His Ala Asn Arg Leu Ile Asn Lys Tyr Asp Gln Lys Met

65 70 75 80

Phe Tyr Met Gly Gly Pro Gly His Gly Gly Gln Ala Met Val Val Pro

85 90 95

Ser Tyr Leu Asp Gly Ser Tyr Thr Glu Ala Tyr Pro Glu Ile Thr Gln

100 105 110

Asp Leu Glu Gly Met Ser Arg Leu Phe Lys Arg Phe Ser Phe Pro Gly

115 120 125

Gly Ile Gly Ser His Met Thr Ala Gln Thr Pro Gly Ser Leu His Glu

130 135 140

Gly Gly Glu Leu Gly Tyr Val Leu Ser His Ala Thr Gly Ala Ile Leu

145 150 155 160

Asp Gln Pro Glu Gln Ile Ala Phe Ala Val Val Gly Asp Gly Glu Ala

165 170 175

Glu Thr Gly Pro Leu Met Thr Ser Trp His Ser Ile Lys Phe Ile Asn

180 185 190

Pro Lys Asn Asp Gly Ala Ile Leu Pro Ile Leu Asp Leu Asn Gly Phe

195 200 205

Lys Ile Ser Asn Pro Thr Leu Phe Ala Arg Thr Ser Asp Val Asp Ile

210 215 220

Arg Lys Phe Phe Glu Gly Leu Gly Tyr Ser Pro Arg Tyr Ile Glu Asn

225 230 235 240

Asp Asp Ile His Asp Tyr Met Ala Tyr His Lys Leu Ala Ala Glu Val

245 250 255

Phe Asp Lys Ala Ile Glu Asp Ile His Gln Ile Gln Lys Asp Ala Arg

260 265 270

Glu Asp Asn Arg Tyr Gln Asn Gly Glu Ile Pro Ala Trp Pro Ile Val

275 280 285

Ile Ala Arg Leu Pro Lys Gly Trp Gly Gly Pro Arg Tyr Asn Asp Trp

290 295 300

Ser Gly Pro Lys Phe Asp Gly Lys Gly Met Pro Ile Glu His Ser Phe

305 310 315 320

Arg Ala His Gln Val Pro Leu Pro Leu Ser Ser Lys Asn Met Gly Thr

325 330 335

Leu Pro Glu Phe Val Lys Trp Met Thr Ser Tyr Gln Pro Glu Thr Leu

340 345 350

Phe Asn Ala Asp Gly Ser Leu Lys Glu Glu Leu Arg Asp Phe Ala Pro

355 360 365

Lys Gly Glu Met Arg Met Ala Ser Asn Pro Val Thr Asn Gly Gly Val

370 375 380

Asp Ser Ser Asn Leu Val Leu Pro Asp Trp Gln Glu Phe Ala Asn Pro

385 390 395 400

Ile Ser Glu Asn Asn Arg Gly Lys Leu Leu Pro Asp Thr Asn Asp Asn

405 410 415

Met Asp Met Asn Val Leu Ser Lys Tyr Phe Ala Glu Ile Val Lys Leu

420 425 430

Asn Pro Thr Arg Phe Arg Leu Phe Gly Pro Asp Glu Thr Met Ser Asn

435 440 445

Arg Phe Trp Glu Met Phe Lys Val Thr Asn Arg Gln Trp Met Gln Val

450 455 460

Ile Lys Asn Pro Asn Asp Glu Phe Ile Ser Pro Glu Gly Arg Ile Ile

465 470 475 480

Asp Ser Gln Leu Ser Glu His Gln Ala Glu Gly Trp Leu Glu Gly Tyr

485 490 495

Thr Leu Thr Gly Arg Thr Gly Ala Phe Ala Ser Tyr Glu Ser Phe Leu

500 505 510

Arg Val Val Asp Ser Met Leu Thr Gln His Phe Lys Trp Ile Arg Gln

515 520 525

Ala Ala Asp Gln Lys Trp Arg His Asp Tyr Pro Ser Leu Asn Val Ile

530 535 540

Ser Thr Ser Thr Val Phe Gln Gln Asp His Asn Gly Tyr Thr His Gln

545 550 555 560

Asp Pro Gly Met Leu Thr His Leu Ala Glu Lys Lys Ser Asp Phe Ile

565 570 575

Arg Gln Tyr Leu Pro Ala Asp Gly Asn Thr Leu Leu Ala Val Phe Asp

580 585 590

Arg Ala Phe Gln Asp Arg Ser Lys Ile Asn His Ile Val Ala Ser Lys

595 600 605

Gln Pro Arg Gln Gln Trp Phe Thr Lys Glu Glu Ala Glu Lys Leu Ala

610 615 620

Thr Asp Gly Ile Ala Thr Ile Asp Trp Ala Ser Thr Ala Lys Asp Gly

625 630 635 640

Glu Ala Val Asp Leu Val Phe Ala Ser Ala Gly Ala Glu Pro Thr Ile

645 650 655

Glu Thr Leu Ala Ala Leu His Leu Val Asn Glu Val Phe Pro Gln Ala

660 665 670

Lys Phe Arg Tyr Val Asn Val Val Glu Leu Gly Arg Leu Gln Lys Lys

675 680 685

Lys Gly Ala Leu Asn Gln Glu Arg Glu Leu Ser Asp Glu Glu Phe Glu

690 695 700

Lys Tyr Phe Gly Pro Ser Gly Thr Pro Val Ile Phe Gly Phe His Gly

705 710 715 720

Tyr Glu Asp Leu Ile Glu Ser Ile Phe Tyr Gln Arg Gly His Asp Gly

725 730 735

Leu Ile Val His Gly Tyr Arg Glu Asp Gly Asp Ile Thr Thr Thr Tyr

740 745 750

Asp Met Arg Val Tyr Ser Glu Leu Asp Arg Phe His Gln Ala Ile Asp

755 760 765

Ala Met Gln Val Leu Tyr Val Asn Arg Lys Val Asn Gln Gly Leu Ala

770 775 780

Lys Ala Phe Ile Asp Arg Met Lys Arg Thr Leu Val Lys His Phe Glu

785 790 795 800

Val Thr Arg Asn Glu Gly Val Asp Ile Pro Asp Phe Thr Glu Trp Val

805 810 815

Trp Ser Asp Leu Lys Lys

820

<210> 8

<211> 714

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Met Ser Arg Ile Ile Met Leu Ile Pro Thr Gly Thr Ser Val Gly Leu

1 5 10 15

Thr Ser Val Ser Leu Gly Val Ile Arg Ala Met Glu Arg Lys Gly Val

20 25 30

Arg Leu Ser Val Phe Lys Pro Ile Ala Gln Pro Arg Thr Gly Gly Asp

35 40 45

Ala Pro Asp Gln Thr Thr Thr Ile Val Arg Ala Asn Ser Ser Thr Thr

50 55 60

Thr Ala Ala Glu Pro Leu Lys Met Ser Tyr Val Glu Gly Leu Leu Ser

65 70 75 80

Ser Asn Gln Lys Asp Val Leu Met Glu Glu Ile Val Ala Asn Tyr His

85 90 95

Ala Asn Thr Lys Asp Ala Glu Val Val Leu Val Glu Gly Leu Val Pro

100 105 110

Thr Arg Lys His Gln Phe Ala Gln Ser Leu Asn Tyr Glu Ile Ala Lys

115 120 125

Thr Leu Asn Ala Glu Ile Val Phe Val Met Ser Gln Gly Thr Asp Thr

130 135 140

Pro Glu Gln Leu Lys Glu Arg Ile Glu Leu Thr Arg Asn Ser Phe Gly

145 150 155 160

Gly Ala Lys Asn Thr Asn Ile Thr Gly Val Ile Val Asn Lys Leu Asn

165 170 175

Ala Pro Val Asp Glu Gln Gly Arg Thr Arg Pro Asp Leu Ser Glu Ile

180 185 190

Phe Asp Asp Ser Ser Lys Ala Lys Val Asn Asn Val Asp Pro Ala Lys

195 200 205

Leu Gln Glu Ser Ser Pro Leu Pro Val Leu Gly Ala Val Pro Trp Ser

210 215 220

Phe Asp Leu Ile Ala Thr Arg Ala Ile Asp Met Ala Arg His Leu Asn

225 230 235 240

Ala Thr Ile Ile Asn Glu Gly Asp Ile Asn Thr Arg Arg Val Lys Ser

245 250 255

Val Thr Phe Cys Ala Arg Ser Ile Pro His Met Leu Glu His Phe Arg

260 265 270

Ala Gly Ser Leu Leu Val Thr Ser Ala Asp Arg Pro Asp Val Leu Val

275 280 285

Ala Ala Cys Leu Ala Ala Met Asn Gly Val Glu Ile Gly Ala Leu Leu

290 295 300

Leu Thr Gly Gly Tyr Glu Met Asp Ala Arg Ile Ser Lys Leu Cys Glu

305 310 315 320

Arg Ala Phe Ala Thr Gly Leu Pro Val Phe Met Val Asn Thr Asn Thr

325 330 335

Trp Gln Thr Ser Leu Ser Leu Gln Ser Phe Asn Leu Glu Val Pro Val

340 345 350

Asp Asp His Glu Arg Ile Glu Lys Val Gln Glu Tyr Val Ala Asn Tyr

355 360 365

Ile Asn Ala Asp Trp Ile Glu Ser Leu Thr Ala Thr Ser Glu Arg Ser

370 375 380

Arg Arg Leu Ser Pro Pro Ala Phe Arg Tyr Gln Leu Thr Glu Leu Ala

385 390 395 400

Arg Lys Ala Gly Lys Arg Ile Val Leu Pro Glu Gly Asp Glu Pro Arg

405 410 415

Thr Val Lys Ala Ala Ala Ile Cys Ala Glu Arg Gly Ile Ala Thr Cys

420 425 430

Val Leu Leu Gly Asn Pro Ala Glu Ile Asn Arg Val Ala Ala Ser Gln

435 440 445

Gly Val Glu Leu Gly Ala Gly Ile Glu Ile Val Asp Pro Glu Val Val

450 455 460

Arg Glu Ser Tyr Val Gly Arg Leu Val Glu Leu Arg Lys Asn Lys Gly

465 470 475 480

Met Thr Glu Thr Val Ala Arg Glu Gln Leu Glu Asp Asn Val Val Leu

485 490 495

Gly Thr Leu Met Leu Glu Gln Asp Glu Val Asp Gly Leu Val Ser Gly

500 505 510

Ala Val His Thr Thr Ala Asn Thr Ile Arg Pro Pro Leu Gln Leu Ile

515 520 525

Lys Thr Ala Pro Gly Ser Ser Leu Val Ser Ser Val Phe Phe Met Leu

530 535 540

Leu Pro Glu Gln Val Tyr Val Tyr Gly Asp Cys Ala Ile Asn Pro Asp

545 550 555 560

Pro Thr Ala Glu Gln Leu Ala Glu Ile Ala Ile Gln Ser Ala Asp Ser

565 570 575

Ala Ala Ala Phe Gly Ile Glu Pro Arg Val Ala Met Leu Ser Tyr Ser

580 585 590

Thr Gly Thr Ser Gly Ala Gly Ser Asp Val Glu Lys Val Arg Glu Ala

595 600 605

Thr Arg Leu Ala Gln Glu Lys Arg Pro Asp Leu Met Ile Asp Gly Pro

610 615 620

Leu Gln Tyr Asp Ala Ala Val Met Ala Asp Val Ala Lys Ser Lys Ala

625 630 635 640

Pro Asn Ser Pro Val Ala Gly Arg Ala Thr Val Phe Ile Phe Pro Asp

645 650 655

Leu Asn Thr Gly Asn Thr Thr Tyr Lys Ala Val Gln Arg Ser Ala Asp

660 665 670

Leu Ile Ser Ile Gly Pro Met Leu Gln Gly Met Arg Lys Pro Val Asn

675 680 685

Asp Leu Ser Arg Gly Ala Leu Val Asp Asp Ile Val Tyr Thr Ile Ala

690 695 700

Leu Thr Ala Ile Gln Ser Ala Gln Gln Gln

705 710

<210> 9

<211> 891

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 9

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

29页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种重组人糖皮质激素受体GRα-His蛋白及其表达和纯化方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!