中国是世界上杜鹃花属植物资源最为丰富的国家,为世界杜鹃花育种做出了巨大贡献。但中国杜鹃花育种尤其常绿杜鹃育种水平较欧美、日本等国仍有较大差距,资源开发利用水平低,优良品种少。云锦杜鹃作为中国特有常绿杜鹃,观赏价值高、抗性好,野生资源也较为丰富,具有良好的开发潜力。但由于缺乏相关的遗传背景信息,云锦杜鹃的遗传多样性、杂交子代鉴定和优异基因型挖掘等遗传育种研究一直受到制约。近年来,随着高通量测序技术的发展,转录组测序已成为非模式生物遗传背景解析的重要手段,在标记开发、表达分析、功能基因挖掘等方面得到广泛应用[17-21]。本研究利用Illumina测序技术对云锦杜鹃组培苗的转录组进行测序和分析,以获得其转录组序列信息。云锦杜鹃转录组的测序数据分析结果表明:数据的Q30值为91.85%,拼接后共获得84 633条单基因簇,平均长度为691.4 bp,N50值为1 177 bp。一般认为Q30在80%以上就认为测序质量可靠;N50值越大就表示长片段越多,且不小于800 bp就说明组装得到序列完整性较好[22]。上述结果表明本研究测序数据的质量和组装长度达到了转录组分析的基本要求,为进一步分析利用奠定了基础。
基因功能注释是转录组分析的重要内容,是进行重要功能基因挖掘的前提。因此,本研究利用Nr和Swiss-prot等七大数据库对云锦杜鹃转录组序列进行功能注释,结果表明:共有35 526条单基因簇获得注释信息,仍有约5万条序列没有获得注释。这与薏苡Coix lachryma-jobi[20]和岩穴蕨Monachosorum maximowiczii[23]的情况类似,可能是由于云锦杜鹃是未测序物种,在相关数据库中缺乏对应的功能注释信息,也可能是部分云锦杜鹃单基因簇序列本身太短造成的。GO和KOG注释功能分类的结果显示,云锦杜鹃单基因簇的功能涉及了各类生命活动;KEGG通路注释到9 887条单基因簇,涉及到272条代谢通路。这些结果表明:对于云锦杜鹃等这一非模式植物,转录组测序可以有效地解析遗传背景,获得大量序列信息。基因功能注释也是挖掘与特定途径或功能相关基因的有效手段。如在紫色黄秋葵Abelmoschus esculentus中,通过转录组的KEGG注释,获得与花色素苷、黄酮、类黄酮、二萜类和萜类骨架等生物合成相关的单基因簇[24]。本研究通过功能注释,也鉴定获得24个编码MADS-box基因的单基因簇,属于10个不同的亚家族,它们可能与花分生组织发育、花期调控、花器官发育等重要成花过程相关。
简单序列重复(SSR)又称微卫星序列,具有共显性、密度大、信息量丰富等优势,广泛应用于遗传图谱构建、遗传多样性分析、基因定位、分子标记辅助育种等方面[25]。利用转录组序列开发SSR标记具有通量高,成本低的优势,已在多种植物中获得成功[19, 26-27]。在大王杜鹃R. rex转录组序列中鉴定获15 314个SSR位点,占比最高的为双碱基重复SSR,其次为单碱基重复SSR和三碱基重复SSR,且利用这些SSR位点开发了相应引物对20份大王杜鹃种质进行了遗传多样性评价[3]。本研究也在云锦杜鹃单基因簇序列中鉴定获得21 900个SSR位点,发现其中双核苷酸重复SSR最多,达到12 294个;其次为单核苷酸重复和三核苷酸重复SSR,这与大王杜鹃中发现的规律类似。这些结果将为云锦杜鹃SSR标记开发提供重要序列信息,也为云锦杜鹃种质资源遗传多样性分析、功能基因挖掘以及分子辅助育种等工作提供了重要基础。