中昊芯英最新一代 TPU 芯片「须臾」已正式发布,其单芯片混合精度浮点算力峰值可达 896 TFLOPS,较前代芯片「刹那」的算力提升了三倍。该芯片的 8-bit 推理算力更是达到了 1792 TOPS,能够有效应对大规模词元并发推理的需求。
「须臾」芯片在显存容量和内部互联速度方面均实现了显著增强,并支持超长上下文处理能力。尽管性能大幅提升,其额定功耗为 600W,相较于传统算力芯片,功耗降低了 50%,为构建低碳数据中心提供了支持。
值得注意的是,「须臾」芯片的 IP 核、专用指令集、底层算子加速库以及整机系统软件全部为自主研发,摆脱了对海外核心技术的依赖,能够满足政务、金融、电网等行业在安全合规方面的严格要求。
一同发布的还有高性能智算平台「泰则 2.0」,该平台作为最小计算单元,集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元。从物理构成上看,它相当于一台通用的 CPU 服务器连接一台高性能 TPU 算力加速设备,总算力(混合精度)达到 7.168P。在处理相同任务时,「泰则 2.0」的整体能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。对于训练任务,它适配了 DeepSpeed、Megatron-LM 等分布式套件。该平台已成功完成了对 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言及多模态模型的深度适配,使开发者能够高效地迁移模型。

李明
深入剖析小组赛阶段的潜在冷门,结合赔率数据,识别可能爆冷的队伍,为您的竞猜策略提供参考。
王芳
我们实时更新世界杯的各项赔率,包括赛前赔率、滚球赔率以及赛后冠军赔率,确保您获取最前沿的市场信息。