Contents Menu Expand Light mode Dark mode Auto light/dark, in light mode Auto light/dark, in dark mode Skip to content
아카이브 페이지 · 최신 (v002) 문서로 이동 →
pccx 문서
pccx 문서
EN · 한국어
RTL Lab Docs Blog

소개

  • pccx: 병렬 컴퓨트 코어 익스큐터
  • 퀵스타트
  • Evidence
  • 로드맵

v002 아키텍처

  • pccx v002 아키텍처
    • 개요
    • 하드웨어 아키텍처
      • v001 → v002 설계 근거
      • 탑레벨 아키텍처
      • 물리 플로어플랜
      • Memory Hierarchy
      • KV 캐시 최적화 전략
      • GEMM 코어 (시스톨릭 어레이)
      • GEMV 코어
      • SFU 코어 (Complex Vector Operations)
      • PREPROCESS 스테이지
      • DSP48E2 W4A8 비트 패킹과 부호 복원
    • 명령어 세트 아키텍처 (ISA)
      • 명령어 인코딩
      • 명령어 상세 인코딩
      • Per-Instruction Dataflow
    • 형식 모델 — Sail
    • 소프트웨어 스택
      • C API 개요
      • HAL — AXI-Lite MMIO 계층
    • 타깃 모델
      • Gemma 3N E4B — 개요
      • Gemma 3N E4B — 연산자 수준 파이프라인
      • Gemma 3N — Attention 및 RoPE 제약
      • Gemma 3N — LAuReL 과 PLE Calibration 모듈
      • Gemma 3N — FFN Gaussian Top-K Sparsity
      • Gemma 3N E4B 를 pccx v002 에서 실행 — Execution / Scheduling
    • RTL 소스 레퍼런스 (v002)
      • ISA 타입 패키지
      • NPU 최상위 모듈
      • 컴퓨트 코어 모듈
      • NPU 컨트롤러 모듈
      • NPU 프론트엔드 모듈
      • L2 캐시 (URAM)
      • 메모리 디스패치
      • PREPROCESS RTL 레퍼런스
      • 컴파일 우선순위 패키지
      • 공유 라이브러리
    • 검증
    • Vivado 빌드

타겟 하드웨어

  • 지원 디바이스
    • 타겟 하드웨어: Xilinx Kria KV260

pccx-lab 핸드북

  • pccx-lab 핸드북
    • 아키텍처 개요
    • CLI 레퍼런스
    • 분석기 API
    • Copilot API
    • pccx-lab 연구 계보
    • UI 패널 카탈로그
    • Tauri IPC 계약
    • 검증 워크플로
    • .pccx 바이너리 포맷
    • UVM 브리지
    • 사이클 루프
    • pccx-lab 퀵스타트
    • pccx-core 모듈 레퍼런스

아카이브

  • 아카이브
    • 아카이브: v001 실험적 아키텍처
      • pccx: Parallel Compute Core eXecutor
      • pccx ISA 사양
      • pccx ISA 스프레드시트 뷰
      • pccx v001 호스트 API 개발자 레퍼런스
      • RTL 소스 레퍼런스 (v001)
        • 최상위
        • 패키지와 상수
        • NPU 컨트롤러
        • 행렬 코어 (GEMM)
        • 벡터 코어 (GEMV)
        • CVO 코어 (SFU)
        • 메모리 제어
        • 전처리
        • 라이브러리
        • 호스트 API (C 드라이버)

툴체인 데모

  • 툴체인 데모
    • Mermaid — NPU 블록 다이어그램
    • WaveDrom — AXI4 read 트랜잭션
    • SVG — 테마 대응 4×4 PE 어레이
    • scienceplots — batch size 대비 대역폭
    • Plot gallery
      • Batch size vs achieved HP-AXI bandwidth

도구

  • pccx-lab — 시뮬레이터 & AI 프로파일러
Back to top
View this page
Edit this page

아카이브¶

  • 아카이브: v001 실험적 아키텍처
    • 프로젝트 개요
    • 빠른 메뉴
    • 양자화 전략: W4A16 + BF16 활성화
    • 컴퓨트 엔진
Next
아카이브: v001 실험적 아키텍처
Previous
pccx-core 모듈 레퍼런스
Copyright © 2026, hwkim
Made with Furo
Last updated on 2026-05-01
RTL Lab Docs Blog