DingoFS简介
产品简介
DingoFS 是DataCanvas公司设计开发的云原生分布式高速文件存储系统,具备弹性、多云、多协议融合、高性能等特征,DingoFS 通过多层次、多类型、高性能的分布式多级缓存体系进行AI业务流程的数据I/O加速,能够有效解决 AI 场景中瞬时 Burst I/O 的需求,同时也提供Local Cache存储能力,满足大模型的全生命周期存储需求。
核心功能
1.POSIX兼容性
提供与本地文件系统一致的操作体验,实现无缝系统集成。
2.AI原生架构
深度优化大语言模型工作流,高效管理海量训练数据集与检查点工作负载。
3.S3协议兼容
支持标准S3接口协议,实现对文件系统命名空间的便捷访问。
4.全分布式架构
元数据服务(MDS)、数据存储层、缓存系统及客户端组件均支持线性扩展。
5.卓越性能表现
提供兼具本地SSD的低延迟访问性能,同时具备对象存储级的高吞吐能力,满足高性能计算与大容量存储需求。
6.智能缓存加速体系
构建内存、本地SSD和分布式集群三级缓存拓扑,动态优化数据访问路径,为AI等高负载场景提供高吞吐、低延迟的I/O加速。
应用场景
赋能AI模型训练
在AI/训练场景中,分布式文件系统需要高效管理海量训练数据(如图像、文本、音频等),并提供高吞吐、低延迟的访问能力。DingoFS通过优化的元数据管理和数据分布策略,加速小文件读取,减少数据处理等待时间。同时,其兼容POSIX接口的特性,显著降低了数据预处理和加载的复杂度。
高性能计算
分布式文件系统对计算结果返回要求极高场景中提供高聚合带宽和低延迟访问。DingoFS通过数据分片和并行I/O优化,提升大文件的读写性能,其弹性扩展能力可随计算集群规模动态调整存储资源,满足当今市场的高负载需求。
数据高频分析
在量化交易、风险建模等场景中,DingoFS通过内存缓存优化实现微秒级数据访问,支持实时处理海量行情数据,确保高频交易系统零延迟响应。