入選國際頂會ASPLOS’26 | CEMU:打破硬件桎梏,讓計算存儲研究“起飛”
近日,由大普微呂濤博士擔任共同通訊作者、聯合華中科技大學與之江實驗室完成的重磅論文——《CEMU: Enabling Full-System Emulation of Computational Storage beyond Hardware Limits》被國際計算機體系結構頂會ASPLOS’26 正式錄用。
CEMU仿真平臺聚焦計算存儲(Computational Storage Drive, CSD)基礎設施建設,旨在打破硬件桎梏,解決行業痛點,推動存算一體技術的仿真驗證與生態發展。

01.為什么我們需要 CSD仿真平臺?
CSD研究不缺天才的想法,缺的是驗證想法的“跑道”。計算存儲的邏輯很清晰:把計算任務推到 SSD 內部去處理,減少數據搬運,實現性能與能效的雙重提升。但現實很骨感,研究門檻高得嚇人:
·太貴: 一塊 SmartSSD 動輒 2400 美元,想組建多盤系統?預算直接爆炸。
·太假: 現有的模擬器往往只模擬單一環節,丟失了全系統的真實交互行為。
·太慢: 無法模擬未來更先進、更高性能的硬件。
CEMU 的使命很清晰:讓CSD研究能跨越昂貴的硬件門檻,打造一個零硬件依賴、全系統、可擴展的研究平臺。
02.CEMU 是什么?
CEMU是一個純軟件實現的全系統 CSD 仿真平臺,它包含“CSD 設備仿真器”與“CSD 系統軟件棧”兩部分;它既符合 SNIA/NVMe 行業標準,又能與現有的 I/O 棧無縫共存。
實現方面,CEMU 包含兩大關鍵技術創新:
創新1:VM-Freezing (虛擬機凍結) —— 突破物理時間的限制
痛點: 用普通的 CPU 去模擬高性能的 FPGA/ASIC 加速器,速度跟不上怎么辦?
CEMU 解決方案:
既然跑得不夠快,那就讓時間“停”下來。該平臺引入了一種VM-Freezing機制:
1. 當仿真任務開始時,凍結虛擬機(VM)內的時間。
2. 宿主機 CPU 全力處理計算任務。
3. 任務完成后,根據預設的數學模型,估計任務在目標硬件上執行所需的時間,以此設置VM感知的應用執行時間,然后恢復虛擬機時鐘。
技術價值: 該機制使得普通的 CPU 也能模擬遠超自身性能的硬件加速器。
創新2:FDMFS 文件系統 —— 讓 CSD “好用”且“標準”
痛點: 各家廠商接口不統一,平臺碎片化嚴重。
CEMU 解決方案:
擁抱標準,構建生態。CEMU實現了FDMFS (File-Descriptor-Managed File System),包含如下特性:
1. 文件抽象: 以文件抽象來管理設備內存。
2. 標準兼容性: 遵循 SNIA 與 NVMe 標準,支持 POSIX 接口,能與現有的 I/O 棧共存。
3. P2P 傳輸支持: 支持多盤之間直接傳輸數據,大幅提升多 CSD 系統效率。
技術價值:該系統解決了CSD軟件棧和傳統I/O棧的兼容性問題。

圖:CEMU 仿真平臺總體架構
03.效果驗證:不僅“能跑”,而且“保真”
模擬器最怕“自嗨”。為了驗證平臺的可靠性,研究團隊將 CEMU 與真實的 CSD 硬件進行了端到端的性能對齊。
結論:平均精度高達 94% 以上。
此外,在 LLM(大語言模型)訓練 和LevelDB 兩個全系統案例中,CEMU 展現了它獨特的價值:該平臺揭示了過去難以觀測的“系統級真相”(如 Offload 帶來的緩存失效、多盤 P2P 的隱藏開銷等),也證明了單點的算力提升并不等于系統整體收益,全鏈路的優化才是關鍵。
為AI時代定義先進存儲
━━━━━━━━━━━━━━━━━━━━━━━━━━━
計算存儲要真正走向產業化,需要的不僅僅是硬件,更是標準、軟件棧和可復現的研究范式。 CEMU 是大普微貢獻給社區的一塊基石,并計劃在論文正式發表后開源代碼。大普微希望用開源和標準,降低學術界與產業界的溝通成本,讓更多新奇的 Idea 能在 CEMU 上“先跑起來”。
ASPLOS介紹
━━━━━━━━━━━━━━━━━━━━━━━━━━━
ASPLOS,全稱 ACM International Conference on Architectural Support for Programming Languages and Operating Systems,是面向多學科計算機系統研究的頂級學術會議,覆蓋硬件、軟件及二者交互。會議重點關注 計算機體系結構、編程語言、操作系統,以及 網絡、存儲 等相關領域。
作者信息
Qiuyang Zhang, Jiapin Wang, You Zhou, Peng Xu, Kai Lu, Jiguang Wan, Fei Wu, and Tao Lu. 2026. CEMU: Enabling Full-System Emulation of Computational Storage beyond Hardware Limits. In Proceedings of (ASPLOS’26). ACM, New York, NY, USA
