“未知数”对近 200 万种蛋白质进行了分类。很多都是神秘的

当谈到广阔的、尚未开发的前沿时,人们首先想到的是太空和地球上的海洋。但即使在人体中,仍有很多东西有待发现。来认识一下“unknome”,这是一个新的数据库,它强调我们对人类基因和蛋白质仍然知之甚少。

公开数据库根据对蛋白质的了解程度对蛋白质组进行排名。研究人员在 8 月 8 日发表的报告中称,这些信息可以帮助科学家识别用于未来研究的蛋白质,包括用于疾病治疗和药物发现。公共科学图书馆生物学.

细胞生物学家肖恩·蒙罗 (Sean Munro) 及其同事编制了未知名称——单词的合成词 未知 基因组 — 识别未被充分研究但可能重要的蛋白质及其相应的蛋白质编码基因:将蛋白质配方复制到 RNA 中的 DNA(序列号:2/9/22)。

蛋白质通常分为具有共同进化祖先的家族。unknome 数据库包含所有蛋白质家族,其中至少有一种由人类遗传说明书、基因组或其他 11 种常用研究生物体的基因组编码的蛋白质。其中包括超过 13,000 个组和近 200 万种蛋白质。

未知节点根据对相应基因的了解程度,为每组蛋白质分配“已知度”分数。其中约 3,000 个群体(包括 805 个至少含有一种人类蛋白质的群体)的已知度分数为零,这表明人类基因组中仍有很多东西需要学习(序列号:22 年 3 月 31 日)。

Munro 和同事使用该数据库研究了果蝇和人类共有的 260 个基因,这些基因的已知度分数较低。在降低果蝇体内每个蛋白质编码基因的活性后,研究人员发现大约 60 个蛋白质编码基因对于生命至关重要。其他的对于繁殖、生长、运动和抗压能力很重要。

英国剑桥医学研究委员会分子生物学实验室的芒罗说:“即使在像苍蝇这样经过充分研究的 [生物体] 中,也有新的发现。”

这些基因中的部分或全部是否对人类具有类似的作用尚不清楚。但圣地亚哥药物发现公司 Expert Systems Inc. 的数据科学家 Tudor Oprea 表示,该数据库可以帮助研究人员通过快速筛选果蝇等更容易研究的生物体中的相似蛋白质来梳理出重要的人类蛋白质。学习。

蒙罗说,他的团队的下一步是与“待研究蛋白质计划”等类似的机构合作,对这些神秘蛋白质进行大规模研究。

正文完
更多资讯,敬请关注「走访建筑」微信公众号😘
post-qrcode