中昊芯英推出新一代 TPU 芯片「须臾」,其单芯片混合精度浮点算力高达 896 TFLOPS,性能表现是上一代「刹那」芯片的三倍。该芯片的 8-bit 推理算力可达 1792 TOPS,能够应对大规模词元的高并发推理需求。与上一代相比,「须臾」在显存容量和芯片内部互联速率方面均有显著提升,并支持超长上下文处理。其单卡额定功耗为 600W,相较于传统算力芯片,功耗降低了 50%,为低碳数据中心的建设提供支持。
「须臾」芯片的 IP 核、专属指令集、底层算子加速库以及整机系统软件均由中昊芯英完全自主研发,不依赖任何海外核心技术,能够满足政务、金融、电网等行业的安全合规要求。
与此同时,中昊芯英还发布了「泰则 2.0」高性能智算平台。「泰则 2.0」作为标准的最小计算单元,集成了两路高性能 CPU 处理器和八片高性能 TPU 处理单元。在物理形态上,它表现为一台通用的 CPU 服务器连接一台高性能 TPU 算力加速设备。该平台混合精度算力可达 7.168 PFLOPS,在执行同等任务时,整机能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练场景下,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。该平台已深度适配 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使得开发者能够快速完成模型迁移工作。

知名体育记者
2026年5月15日 回复我们的核心价值在于通过高效便捷的平台服务与稳定流畅的赛事播放体验,为用户带来更加轻松的观赛环境。无论是精彩的进球瞬间还是关键的比赛节点,快直播都能确保您不错过。