타깃 모델

이 섹션은 실제 Transformer 모델이 pccx v002 위에서 어떻게 매핑되는지 를 문서화합니다. 구체적으로 하드웨어 관점에서 중요한 구조적 선택, 반드시 존중해야 하는 비표준 수치 트릭, 그리고 연산자 그래프가 다섯 개의 pccx 명령어 (GEMV, GEMM, MEMCPY, MEMSET, CVO) 로 어떻게 분해되는지를 다룹니다.

주 참조 모델은 Google Gemma 3N E4B 입니다. 이 모델이 GEMV 코어 수, KV 캐시 예산, SFU 함수 목록의 크기 기준을 정하는 데 사용되었습니다.

참고

이 파이프라인을 구동하는 호스트 측 애플리케이션은 FPGA 레포의 서브모듈 sw/gemma3NE4B/hkimw/llm-lite 에 위치한다. 검증용 골든 CPU 레퍼런스이자 xsim 테스트벤치 스위트의 stimulus 생성기 역할을 함께 한다.