|
生物化学与生物物理进展 2003
成人视网膜假定蛋白基因arhp的克隆及生物信息学分析Keywords: 成人视网膜假定蛋白基因,基因克隆,生物信息学分析 Abstract: 从unigene库中选取编号为bg222624来自人鼻咽组织的表达序列标签(est)序列,联网到ncbi调用blast服务器分析,发现该est序列是一个代表新基因的未知序列.利用blast检索genbank的nr数据库和est数据库,构建est重叠群,联网到ncbi的orffinder服务器,分析发现该est重叠群具有完整的阅读框架.分别在cdna序列阅读框架的起始密码子和终止密码子的两侧设计引物,以人胎脑cdna文库为模板,进行pcr扩增,测序确定该基因的cdna全长序列.该基因cdna序列全长为1672bp,阅读框架位于第304~1557位之间,编码由417个氨基酸组成,分子质量为46.58ku的蛋白质,其理论pi为4.21.将蛋白质序列通过ncbi的blast服务器进行序列相似性分析,发现该基因编码的蛋白质和成年小鼠视网膜未知蛋白(bab32214)同源.经与国际人类基因组命名委员会协商定名为成人视网膜假定蛋白(adultretinahypotheticalprotein,arhp),genbank登录号为ay174896.生物信息学分析表明,该蛋白质可能为一参与转录调控的核蛋白.arhp基因定位在染色体5q35,跨越35163bp,含4个外显子和3个内含子.在基因的5′非翻译区有2个cpg岛.
|