人工智能开放计算平台-DeepLink,作为芯片与深度学习框架适配的“桥梁”,根本性实现软硬件解耦,建设开放的软硬件适配生态。基于 DeepLink,可支持国产多芯片异构、跨域的训推一体化工具链(输入输出标准化);上下游厂商通过一次适配即可深度接入算法生态,从根本上打破生态壁垒,实现软硬件解耦和算力要素多样化。
数字智能
- DITorch:设备无关 torch。
- DLCompiler:扩展 Triton 的深度学习编译器。
- DLBlas:一个基于 Triton 的运算符库。
- DLSlime:提供了一套点对点(Peer-to-Peer)通信接口。
- DLinfer:一套将国产硬件接入大模型推理框架的解决方案。
物理智能
- 3DGSTensorCore:3DGS渲染的加速模块,可以即插即用至常用的3DGS加速框架上。
- LightRFT:一个先进的多模态强化学习微调框架,专为大语言模型(LLM)和视觉语言模型(VLM)设计。
- Pulsing: 是一个轻量级分布式 Actor 框架,专为 LLM 推理服务设计。
- Persisting:参数、键值缓存和轨迹的持久存储。
混训混推
- 支持异构/跨域混训、异构推理等的相关方案,尽请期待.
训推性能建模与通信建模
- 服务下一代模型与下一代算力建设的方案&工具,尽请期待。
量子计算
- OpenTenNet:在新兴算力硬件上构建的量子计算模拟器。
超节点
- 面向极致算力增长需求构建的国产超节点技术系统,尽请期待。
- AIChipBenchmark:面向国产深度学习加速卡进行的多维度评测工作.

