BPU 类脑计算
事件驱动、脉冲神经网络、存算一体——在匹配任务上能效远超 GPU 的类脑计算芯片与系统。

LYRA-β Max 类脑芯片 BIM204
采用第二代天琴芯处理内核(BPU-II),基于 chiplet 互联技术将脉冲神经元计算规模扩展至 460 万,仿真速度相对上一代提升约 2.7 倍,并支持片上类脑模型训练。
不是另一种
GPU 是大脑
BPU(Brain Processing Unit)指脉冲 / 事件驱动的类脑计算芯片与系统。它的核心目标是以硬件原生支持 SNN 的神经元更新、突触事件传播与事件路由调度,通过异步 AER(Address-Event Representation)通信机制,把大量简单的神经元-突触-路由单元构造成可扩展的类脑计算系统。
TrueNorth、Loihi 以及更近期的晶圆级类脑系统都属于这类代表。在与其范式匹配的任务上——事件流、稀疏时序信号、在线学习——BPU 的能效远超传统 GPU。
只对实际发生的脉冲做计算
跳过无效的密集 MAC 扫描
避免搬数据比算数据更耗能
BPU vs GPU:
不是替代,是互补
如果把「计算效率」理解为单位能耗可完成的有效任务量,BPU 在与其范式匹配的任务上通常明显优于 GPU。
效率高低取决于任务是否能表达为稀疏事件驱动的 SNN,并能被 BPU 的神经元 / 突触模型高效映射。
三种形态,
同一个大脑
从 PCIe 加速卡到晶圆级服务器——根据你的任务规模选择合适的 BPU 产品形态。
BPU PCI 计算卡
单卡或少量 BPU 芯片封装成板卡 / 开发平台,通过 PCIe 挂到主机上。易于融入现有服务器工作流,调试和量产门槛低。
- PCIe 接口,易于集成
- 开发调试门槛低
- 适合原型开发
BPU 晶圆计算模组
BPU 芯粒模组化封装,可灵活集成到各类计算平台中,提供更高密度的类脑计算能力。
- 模组化设计
- 灵活集成
- 高密度计算
- 支持 4 亿+ 神经元模拟
天琴芯海 · 晶圆计算服务器
晶圆级类脑计算系统,在晶圆内短距高密度互连,大规模事件通信、全局同步与能效优势明显。适合脑规模 SNN 推理与仿真。
- 亿级神经元规模
- 数万亿级突触连接
- 相比 A100 提升 10 倍以上
- 接近生物脑能效
PCIe 版本
原型开发、小规模应用。易于融入现有工作流。
模组版本
中等规模应用。灵活集成,按需组合。
晶圆计算
超大规模脑仿真和研究。亿级神经元,接近生物能效。
天琴
芯海
突破性的晶圆级类脑计算系统——在整片晶圆上互连成统一的事件驱动计算网络。
什么是晶圆级计算?
BPU 晶圆级计算指把大量类脑芯片(或芯粒)在整片晶圆上互连成一个统一的事件驱动系统。晶圆内运行的计算本质上仍是 SNN 的神经元状态更新与突触事件传播,只是规模被提升到「晶圆级神经元-突触总量」。事件在晶圆内以 AER 等异步方式高速传递,同时用分层时间步或 GALS 同步机制保证跨芯粒 / 跨区域的时序一致性。
性能突破
高密度互连
晶圆内短距高密度互连替代 PCB 级长距互连,显著降低带宽、延迟和能耗的数量级惩罚。
超高能效比
使得大规模 SNN 和脑仿真在能耗-时延上更接近生物系统的效率区间。
事件驱动架构
事件在晶圆内以 AER 等异步方式高速传递,配合 GALS 同步机制保证时序一致性。
脑规模仿真
支持更接近脑规模的并行脉冲计算与仿真,亿级神经元并行处理。
事件驱动
的世界
BPU 最适合那些输入本身是事件流或可自然稀疏化、并且决策强依赖时间结构的场景。
脑仿真研究
大规模神经科学脑回路仿真,支持亿级神经元并行处理。
DVS 事件相机
基于事件的视觉感知处理,超低延迟实时响应。
低功耗边缘智能
超低延迟实时控制与在线学习,适合 IoT 和嵌入式场景。
脉冲传感融合
雷达 / 声呐 / 触觉传感器集成,多模态事件流统一处理。
共同点:对低延迟、低功耗、稀疏时序处理或在线可塑性有强需求。
从卡片,
到服务器
Neogenint LYRA-β Max 类脑芯片 BIM204
LYRA-β Max(BIM204)是借鉴脑启发原理的类脑芯片,采用第二代天琴芯处理内核(BPU-II),基于chiplet互联技术进一步拓展脉冲神经元计算规模达460万,其仿真速度相对上一代提升约2.7倍,且支持片上类脑模型训练。
- 采用第二代天琴芯处理内核(BPU-II)
- 基于chiplet互联技术
- 脉冲神经元计算规模达460万
- 仿真速度相对上一代提升约2.7倍
- 支持片上类脑模型训练
- 适用于稀疏非结构化数据处理
- 可应用于超大规模脑模型仿真、图网络分析计算、工业仿真求解
460万神经元 · BPU-II · chiplet · 2.7倍仿真速度

Neogenint LYRA-β / LBM212 类脑计算卡
LYRA-β / LBM212 类脑计算卡支持 BI-Link 类脑计算卡互连扩展,支持最大2600万神经元模拟计算,支持可变计算精度(FP32/FP16/INT8),采用 LYRArc-II 存算融合处理架构。
- LYRArc-II存算融合处理架构
- 支持BI-Link类脑计算卡互连扩展
- 支持最大2600万神经元模拟计算
- 支持可变计算精度(FP32/FP16/INT8)
- 支持全范围神经元连接
- 支持事件驱动计算与稀疏计算
- 支持面向类脑计算的微代码级指令重构
- 支持类脑神经网络训练和推理
- 适用于超大规模脑模型仿真、图网络分析计算、工业仿真求解
支持最大 2600 万神经元模拟计算

Neogenint类脑晶圆计算子系统(模组)LBW2216
天琴类脑晶圆计算子系统 LBW2216,基于自研 LYRArc-II 线性可扩展处理架构,采用全新自研计算、供电、散热、互连等一体化组装集成技术,兼容通用服务器准系统,可支持脉冲神经元计算规模达4亿以上,持续刷新类脑算力记录。
- 自研LYRArc-II线性可扩展处理架构
- 全新自研计算、供电、散热、互连等一体化组装集成技术
- 兼容通用服务器准系统
- 支持脉冲神经元计算规模达4亿以上
- 持续刷新类脑算力记录
- 支持片上类脑模型训练
- 支持子系统间直连扩展
- 适用于稀疏非结构化数据处理
- 可应用于超大规模脑模型仿真、图网络分析计算、工业仿真求解
支持 4 亿以上神经元模拟计算

Neogenint高密度类脑算力服务器 BPSC-II
BPSC-II 是高密度类脑算力服务器,融合自研超高算力密度整机集成、类脑血管相变液冷、无风扇高功率氮化镓电源等技术。4U机箱内集成16张类脑计算卡LBM212,单机实现48颗LYRA-β Max类脑芯片的互联集成和分布式计算。
- 4U机箱内集成16张类脑计算卡LBM212
- 单机实现48颗LYRA-β Max类脑芯片互联集成和分布式计算
- 整系统支持脉冲神经元计算规模可达4亿以上
- 已用于构建100亿神经元规模类脑超级计算系统
- 自研超高算力密度整机集成技术
- 自研类脑血管相变液冷技术
- 无风扇高功率氮化镓电源
- 支持BI-Link类脑计算卡互连
- 支持可变计算精度(FP32/FP16/INT8)
- 支持事件驱动计算与稀疏计算
- 支持全范围神经元连接
- 支持面向类脑计算的微代码级指令重构
- 支持类脑神经网络训练和推理
4U · 16张 LBM212 · 48颗 LYRA-β Max · 4亿以上脉冲神经元

获取
报价
BPU 类脑处理器提供多种硬件形态。告诉我们您的需求,我们将在 24 小时内提供定制方案。
我们需要了解
- 目标应用场景(边缘推理 / 数据中心 / 科学计算)
- 期望的硬件形态(LBM212 / LBW2216 / BPSC-II)
- 采购数量与交付时间预期
- 是否需要软件栈(Flint SDK)支持
