퀵스타트¶
git clone 에서 “pccx 트레이스를 보고 있다” 까지의 최단 경로.
이 페이지는 재현기 이다: docker compose up 한 번으로 샘플
캡처가 로딩된 프로파일러가 실행 상태로 떠야 한다.
0. 얻게 되는 산출물¶
flowchart LR
A[RTL Repository<br>Vivado Synth] -->|생성| B(16-토큰 .pccx 트레이스)
A -->|산출| C(Sail ISA 모델)
B -.->|로딩| D{pccx-lab 프로파일러}
C -.->|타입체크| E[OCaml / opam]
D --> F[CLI Analytics<br>roofline / report]
D --> G[Tauri Desktop 앱<br>Visual IDE]
style D fill:#ff7a00,stroke:#fff,color:#fff
산출물 |
생성 주체 |
여는 도구 |
|---|---|---|
|
|
|
Sail ISA 모델 (타입체크 완료) |
|
|
Vivado synth + timing 리포트 |
|
|
트레이스 분석 |
|
|
1. 사전 조건¶
단일 64-bit Linux 머신 (Ubuntu 24.04 검증):
git≥ 2.40opam+ocaml≥ 4.14 — Sail 용docker≥ 24 — 재현기 컨테이너 용rustup(stable toolchain) —pccx-core+ Tauri 용(선택) Xilinx Vivado 2024.1 — RTL 합성 경로
(선택) Xilinx Kria KV260 보드 — 실측 토큰 생성
앞의 4 개만으로 소프트웨어 절반 재현 가능. 보드 접근은 선택.
2. 세 레포 클론¶
pccx 는 3-레포 연합 이다 (pccx: 병렬 컴퓨트 코어 익스큐터 의 에코시스템 섹션 참고). 형제 디렉토리에 클론:
mkdir -p ~/pccx-ws && cd ~/pccx-ws
git clone https://github.com/pccxai/pccx.git # docs (이 사이트)
git clone https://github.com/pccxai/pccx-FPGA-NPU-LLM-kv260.git # RTL + Sail 모델
git clone https://github.com/pccxai/pccx-lab.git # 프로파일러 + UVM Copilot
3. 원-커맨드 재현기 (Docker)¶
계획 단계 — 아직 미반영
Docker 재현기 (scripts/docker/quickstart.yml) 는 pccx-lab 로드맵에
올라가 있으나 아직 main 에 랜딩되지 않았다. 랜딩 전까지는 아래
네이티브 경로 를 따르라 — 컨테이너가
내부적으로 실행할 내용과 동일하다.
4. 네이티브 경로 (Docker 없음)¶
# ── Sail 모델 ───────────────────────────────────────────────────
eval $(opam env)
cd ~/pccx-ws/pccx-FPGA-NPU-LLM-kv260/formal/sail
make check # 타입체크; < 5 초
# ── pccx-core + CLI ────────────────────────────────────────────
cd ~/pccx-ws/pccx-lab
cargo build -p pccx-reports --bin pccx_cli --release
./target/release/pccx_cli \
samples/gemma3n_16tok_smoke.pccx \
--roofline --report-md # 헤더 + roofline + bottleneck
# ── pccx-lab (Tauri 데스크톱 앱) ────────────────────────────────
cd ui
npm ci && npm run tauri dev
samples/ 디렉토리는 두 개의 사전 캡처 트레이스를 제공한다 —
samples/README.md 참고:
gemma3n_16tok_smoke.pccx(101 KB, 2,568 events) — CI smoke.gemma3n_128tok_decode.pccx(797 KB, 20,488 events) — steady-state decode.
5. 보드 경로 (선택)¶
# 비트스트림 플래시 후 KV260 에서 16-토큰 디코드.
cd ~/pccx-ws/pccx-FPGA-NPU-LLM-kv260/scripts/board
./bringup.sh kv260.local
# .pccx 를 호스트로 자동 pull; pccx-lab 에서 열기.
6. 다음 단계¶
프로파일러 API surface 는 pccx-lab 핸드북.
Sail 스캐폴드는 형식 모델 페이지.
실측 tok/s + 지연 수치는 Evidence 페이지 (보드 실행 진행 중).
이 페이지 인용¶
@misc{pccx_quickstart_2026,
title = {pccx Quickstart: one-command reproducer for the open NPU},
author = {Kim, Hyunwoo},
year = {2026},
howpublished = {\url{https://pccxai.github.io/pccx/ko/docs/quickstart.html}},
note = {Part of pccx: \url{https://pccxai.github.io/pccx/}}
}