生命科学
基因分析 | 冷冻电镜 | 药物分析 | 分子结构 |
随着生物基因分析、冷冻电镜、药物分析、分子结构技术的飞速发展,生命科学专家可获得的数据量也激增,取得可拯救生命的突破性发
现的机会也随之增加。为推动生命科学领域的创新发展,充分展示和宣传我国生命科学领域的重大科技成果,高性能计算 (HPC)解决方案
可以帮助专业人士准确地分析数据并提升科学数据的运算及推理数据结果导出。
蓝海大脑高性能计算推出多样化的架构满足不同计算需求,利用革新型的存储和内存技术和领先的软件工具,建立广泛的生态系统,快速
处理增长的大型复杂数据集,升级系统可用性以获得更高吞吐率,确保高性能计算(HPC)应用性能最优化。
生命科学的性能挑战
基因分析
基因分析常用应用软件 - Burrows-Wheeler Aligner (BWA) - GATK 4.0 - Genomics Kernel Library |
DNA基因分析应用特性:
- 计算密集 GATK
- 数据集适合DRAM (最大384GB内存)
- BWA:内存带宽密集
基因分析研究是个体遗传学、解读健康问题。分为基因测序、基因数据分析和基因数据归档三个特点。
- 最重要的是基因测序的整个过程是不允许被中断的,这就要求支撑测序应用的存储系统具备极致的稳定性和可靠性;
- 基因测序25微秒采集一幅高清晰图像,对性能要求极高;
- 基因数据分析工作中,对存储系统的性能、小文件处理能力提出很高要求;
- 数据归档阶段,需要将海量基因数据长期、完整、安全地保存起来,存储系统的采购成本、能耗是一个很大的挑战。
基因分析解决方案
蓝海大脑凭借多年在生命科学生物基因分析领域积累的经验,通过横向扩展(scale-out)存储系统、IB低延迟网络、私有客户端技术
小文件聚合及使用自研PCI-E极速存储等异构介质构建冷热数据分层等,满足生物基因应用中对海量数据存储场景高可靠性、高性能
低延迟和低能耗的存储需求。
基因分析方案特点
- 架构的优化设计,在文件场景下单一目录可支持1000万文件,文件系统支持千亿级文件,单一命名空间支持20PB;支持5120节点扩展
单集群可提供EB级容量空间。
- 节点并行处理数据 IO、保障系统整体负载均衡,数据分散存储,避免单节点故障带来的风险,节点在线横向扩展,满足持续增长的容量
和性能需求。
- 支持丰富的主机连接接口,支持 10/25/40Gb iSCSI、56/100 InfiniBand主机连接,无缝接入用户现有环境,满足客户对高带宽及高性能
计算的差异化需求,支持后端10GE 组网下的RDMA模式传输,支持TOE 卸载, 提高系统性能。
- 节点级和硬盘级均衡,磁盘间容量误差率不超5%,节点间误差不超1%,可用容量利用率高达95%。同时高密度存储节点满足客户存储空
间和能耗要求。
基因分析客户收益
- 生物基因分析的数据具有极高的价值,蓝海大脑分布式存储通过业界领先的冗余设计,为用户提供强大的数据保护能力和系统可用性
数据可用性高达99.9999%。
- DNA基因分析分布式存储通过小文件聚合、对象聚合、全局缓存、多通道、硬件加速等技术,为客户提供创新的性能加速方案,全面
提升存储系统性能。
- 生物基因分析研究产生的数据以每年10倍的速度快速增长,蓝海分布式存储通过卓越的系统架构,在为用户提供海量的存储空间。通过
大比例纠删功能,大幅提升容量利用率,为客户提供更低的TCO。
冷冻电镜
冷冻电镜是确定分子结构用于生物研究及药物开发。冷冻电镜应用具有计算密集、高可扩展性特点。
冷冻电镜常用应用软件:
- RELION 3.0
- CryoSpARC
- EMAN
- Spider
冷冻电镜解决方案,咨询:marketing@lanhy.cn
力学建模
力学建模是研究原子、分子及大分子之间的相互作用。力学建模应用具有计算密集、高可扩展的特性。
力学建模常用软件:
- VASP
- NWChem
力学建模解决方案,咨询:marketing@lanhy.cn
分子动力学
分子动力学是研究模拟和分析原子和分子的运动。分子动力学应用具有计算密集、高可扩展的特性。
分子动力学常用软件:
- Discovery StudioTM
- NAMD
- GROMACS
- LAMMPS
- Amber
分子动力学解决方案,咨询:marketing@lanhy.cn
蓝海大脑 京ICP备18017748号-1