跳至主要内容Neogenint Intelligence
关于我们/智算体BPU™

BPU 类脑计算

事件驱动、脉冲神经网络、存算一体——在匹配任务上能效远超 GPU 的类脑计算芯片与系统。

LYRA-β Max BIM204 Brain-Inspired Chip
LYRA™

LYRA-β Max 类脑芯片 BIM204

采用第二代天琴芯处理内核(BPU-II),基于 chiplet 互联技术将脉冲神经元计算规模扩展至 460 万,仿真速度相对上一代提升约 2.7 倍,并支持片上类脑模型训练。

460万
神经元
2.7×
仿真速度
BPU-II
处理内核
chiplet
互联架构
10×
vs A100
10⁹
神经元规模
~100×
能效提升
§ 000向下滚动
§ 001定义

不是另一种
GPU 是大脑

BPU(Brain Processing Unit)指脉冲 / 事件驱动的类脑计算芯片与系统。它的核心目标是以硬件原生支持 SNN 的神经元更新、突触事件传播与事件路由调度,通过异步 AER(Address-Event Representation)通信机制,把大量简单的神经元-突触-路由单元构造成可扩展的类脑计算系统。

TrueNorth、Loihi 以及更近期的晶圆级类脑系统都属于这类代表。在与其范式匹配的任务上——事件流、稀疏时序信号、在线学习——BPU 的能效远超传统 GPU。

事件驱动

只对实际发生的脉冲做计算

稀疏激活

跳过无效的密集 MAC 扫描

存算一体

避免搬数据比算数据更耗能

§ 002对比

BPU vs GPU:
不是替代,是互补

如果把「计算效率」理解为单位能耗可完成的有效任务量,BPU 在与其范式匹配的任务上通常明显优于 GPU。

维度
BPU
GPU
计算范式
事件驱动,稀疏激活
密集并行,张量运算
能效比
稀疏场景下优势明显
密集计算效率高
适用任务
事件流、稀疏时序信号
密集张量、矩阵运算
通信机制
异步 AER,按需传递
全局同步,批量传输
延迟特性
超低延迟,实时响应
批处理模式,有排队延迟

效率高低取决于任务是否能表达为稀疏事件驱动的 SNN,并能被 BPU 的神经元 / 突触模型高效映射。

§ 003产品系列

三种形态,
同一个大脑

从 PCIe 加速卡到晶圆级服务器——根据你的任务规模选择合适的 BPU 产品形态。

01
入门

BPU PCI 计算卡

单卡或少量 BPU 芯片封装成板卡 / 开发平台,通过 PCIe 挂到主机上。易于融入现有服务器工作流,调试和量产门槛低。

  • PCIe 接口,易于集成
  • 开发调试门槛低
  • 适合原型开发
02
中端

BPU 晶圆计算模组

BPU 芯粒模组化封装,可灵活集成到各类计算平台中,提供更高密度的类脑计算能力。

  • 模组化设计
  • 灵活集成
  • 高密度计算
  • 支持 4 亿+ 神经元模拟
03
旗舰旗舰

天琴芯海 · 晶圆计算服务器

晶圆级类脑计算系统,在晶圆内短距高密度互连,大规模事件通信、全局同步与能效优势明显。适合脑规模 SNN 推理与仿真。

  • 亿级神经元规模
  • 数万亿级突触连接
  • 相比 A100 提升 10 倍以上
  • 接近生物脑能效
如何选择

PCIe 版本

原型开发、小规模应用。易于融入现有工作流。

模组版本

中等规模应用。灵活集成,按需组合。

晶圆计算

超大规模脑仿真和研究。亿级神经元,接近生物能效。

旗舰产品
§ 004深度解析

天琴
芯海

突破性的晶圆级类脑计算系统——在整片晶圆上互连成统一的事件驱动计算网络。

什么是晶圆级计算?

BPU 晶圆级计算指把大量类脑芯片(或芯粒)在整片晶圆上互连成一个统一的事件驱动系统。晶圆内运行的计算本质上仍是 SNN 的神经元状态更新与突触事件传播,只是规模被提升到「晶圆级神经元-突触总量」。事件在晶圆内以 AER 等异步方式高速传递,同时用分层时间步或 GALS 同步机制保证跨芯粒 / 跨区域的时序一致性。

性能突破

亿级
神经元
计算规模
10×+
vs A100
~100×
能效提升
< 1ms
事件延迟
01

高密度互连

晶圆内短距高密度互连替代 PCB 级长距互连,显著降低带宽、延迟和能耗的数量级惩罚。

02

超高能效比

使得大规模 SNN 和脑仿真在能耗-时延上更接近生物系统的效率区间。

03

事件驱动架构

事件在晶圆内以 AER 等异步方式高速传递,配合 GALS 同步机制保证时序一致性。

04

脑规模仿真

支持更接近脑规模的并行脉冲计算与仿真,亿级神经元并行处理。

§ 005应用场景

事件驱动
世界

BPU 最适合那些输入本身是事件流或可自然稀疏化、并且决策强依赖时间结构的场景。

01

脑仿真研究

大规模神经科学脑回路仿真,支持亿级神经元并行处理。

02

DVS 事件相机

基于事件的视觉感知处理,超低延迟实时响应。

03

低功耗边缘智能

超低延迟实时控制与在线学习,适合 IoT 和嵌入式场景。

04

脉冲传感融合

雷达 / 声呐 / 触觉传感器集成,多模态事件流统一处理。

共同点:对低延迟、低功耗、稀疏时序处理或在线可塑性有强需求。

§ 006硬件产品
LYRA™

卡片
服务器

第二代 BPU-II 类脑芯片

Neogenint LYRA-β Max 类脑芯片 BIM204

LYRA-β Max(BIM204)是借鉴脑启发原理的类脑芯片,采用第二代天琴芯处理内核(BPU-II),基于chiplet互联技术进一步拓展脉冲神经元计算规模达460万,其仿真速度相对上一代提升约2.7倍,且支持片上类脑模型训练。

  • 采用第二代天琴芯处理内核(BPU-II)
  • 基于chiplet互联技术
  • 脉冲神经元计算规模达460万
  • 仿真速度相对上一代提升约2.7倍
  • 支持片上类脑模型训练
  • 适用于稀疏非结构化数据处理
  • 可应用于超大规模脑模型仿真、图网络分析计算、工业仿真求解

460万神经元 · BPU-II · chiplet · 2.7倍仿真速度

咨询此产品
LYRA-β Max BIM204 Brain-Inspired Chip
LYRA-β / LBM212 Brain-Inspired Computing Card

Neogenint LYRA-β / LBM212 类脑计算卡

LYRA-β / LBM212 类脑计算卡支持 BI-Link 类脑计算卡互连扩展,支持最大2600万神经元模拟计算,支持可变计算精度(FP32/FP16/INT8),采用 LYRArc-II 存算融合处理架构。

  • LYRArc-II存算融合处理架构
  • 支持BI-Link类脑计算卡互连扩展
  • 支持最大2600万神经元模拟计算
  • 支持可变计算精度(FP32/FP16/INT8)
  • 支持全范围神经元连接
  • 支持事件驱动计算与稀疏计算
  • 支持面向类脑计算的微代码级指令重构
  • 支持类脑神经网络训练和推理
  • 适用于超大规模脑模型仿真、图网络分析计算、工业仿真求解

支持最大 2600 万神经元模拟计算

咨询此产品
LBM212 Brain-Inspired Computing Acceleration Card
Brain-Inspired Wafer Computing Subsystem Module LBW2216

Neogenint类脑晶圆计算子系统(模组)LBW2216

天琴类脑晶圆计算子系统 LBW2216,基于自研 LYRArc-II 线性可扩展处理架构,采用全新自研计算、供电、散热、互连等一体化组装集成技术,兼容通用服务器准系统,可支持脉冲神经元计算规模达4亿以上,持续刷新类脑算力记录。

  • 自研LYRArc-II线性可扩展处理架构
  • 全新自研计算、供电、散热、互连等一体化组装集成技术
  • 兼容通用服务器准系统
  • 支持脉冲神经元计算规模达4亿以上
  • 持续刷新类脑算力记录
  • 支持片上类脑模型训练
  • 支持子系统间直连扩展
  • 适用于稀疏非结构化数据处理
  • 可应用于超大规模脑模型仿真、图网络分析计算、工业仿真求解

支持 4 亿以上神经元模拟计算

咨询此产品
LBW2216 Wafer Computing Subsystem Module
High-Density Brain-Inspired Computing Server BPSC-II

Neogenint高密度类脑算力服务器 BPSC-II

BPSC-II 是高密度类脑算力服务器,融合自研超高算力密度整机集成、类脑血管相变液冷、无风扇高功率氮化镓电源等技术。4U机箱内集成16张类脑计算卡LBM212,单机实现48颗LYRA-β Max类脑芯片的互联集成和分布式计算。

  • 4U机箱内集成16张类脑计算卡LBM212
  • 单机实现48颗LYRA-β Max类脑芯片互联集成和分布式计算
  • 整系统支持脉冲神经元计算规模可达4亿以上
  • 已用于构建100亿神经元规模类脑超级计算系统
  • 自研超高算力密度整机集成技术
  • 自研类脑血管相变液冷技术
  • 无风扇高功率氮化镓电源
  • 支持BI-Link类脑计算卡互连
  • 支持可变计算精度(FP32/FP16/INT8)
  • 支持事件驱动计算与稀疏计算
  • 支持全范围神经元连接
  • 支持面向类脑计算的微代码级指令重构
  • 支持类脑神经网络训练和推理

4U · 16张 LBM212 · 48颗 LYRA-β Max · 4亿以上脉冲神经元

咨询此产品
BPSC-II High-Density Brain-Inspired Computing Server
§ 007咨询

获取
报价

BPU 类脑处理器提供多种硬件形态。告诉我们您的需求,我们将在 24 小时内提供定制方案。

我们需要了解

  • 目标应用场景(边缘推理 / 数据中心 / 科学计算)
  • 期望的硬件形态(LBM212 / LBW2216 / BPSC-II)
  • 采购数量与交付时间预期
  • 是否需要软件栈(Flint SDK)支持
§ 007下一步

想用类脑计算
解决真实问题?

中国 · 上海NEOGENINT · BPU · 2026