开发者

DNA搜索引擎发展现状如何??

开发者 https://www.devze.com 2023-03-08 13:23 出处:网络 作者:如何转开发
纪惠荣 开发者_开发知识库2021-04-11 13:42 vcf竟然被描述得这么神秘。。。生物信息狗也是醉了赵新建
纪惠荣 开发者_开发知识库 2021-04-11 13:42


vcf竟然被描述得这么神秘。。。生物信息狗也是醉了


赵新建 2021-04-11 14:08


发展现状还是挺乐观的,在过去的几年里,研发DNA搜索引擎的公司如雨后春笋般涌现,争相成为研发DNA搜索引擎的第一人。他们都有不同的战术——有些以至具有本人私有的遗传信息数据库,但是大多数正努力于链接足够多的遗传数据库,以便用户能够快速辨认大量的各种各样的突变。大多数公司也研讨应用生物学文献补充遗传学信息的搜索算法。但在早期网络的日子里,在谷歌称雄之前,没有哪个公司成为明显的赢家。
发明一个有效的搜索引擎是典型的大数据问题, ViaGenetics公司的副总裁迈克尔•冈萨雷斯说,估计本月将重启他们的搜索平台。在医生或研讨人员能够运用数据之前,基因组数据必需依照可读取和可搜索的形式来组织。迈向目的的第一步是,依照一种称之为“变体辨认格式”或“VCF”的规范格式存储,一个人的完好基因组测序数据约100千兆字节,直接采用原始的数据格式入库,即便每天只要10个病人的基因组数据,数据库也会很快失控。但VCF文件更紧凑,每个基因只要几百兆字节,有助于研讨人员在更短的时间内搜索到他们想要找的特定变异。与全基因组测序不同,VCF文件只给出一个人的基因数据在哪里偏离了2001年的人类基因组方案最初编制的基因组规范。
有了VCF,从基因组数据中挑选出精准的突变基因不是搜索引擎公司面临的应战。大多数这类公司都集中资源努力于无缝编译从其他网络数据库中补充特定的突变信息,如生物医学研讨档案PubMed或各种搜集来的电子医疗记载。许多这些工具都用精密的算法来优化结果的可信度和相关性。“你希望可以将某个位点的突变信息聚集到一同,并疾速作出评价,” 总部位于犹他州的另一家研发基因--搜索引擎的公司Tute Genomics的首席科学官David Mittelman说。
为了拓展信息关联到一个尚无定论的基因组,位于佛罗里达州迈阿密海滩的ViaGenetics公司,正在更新他们提供应想停止跨机构协作的开发者_如何学编程研讨人员运用的信息平台。“有了ViaGenetics的工具,研讨人员能够将他们的数据提供应其他用户,其他用户能够看到这些项目,恳求访问,并构成协作,”冈萨雷斯说,“它协助人们在不同的研讨人员和机构间树立衔接点。这关于没有很普遍的基因组数据库的小型实验室或努力于解码相同的突变的不同大学的研讨人员都特别有用。


0

精彩评论

暂无评论...
验证码 换一张
取 消

关注公众号