PyoSignal Logo
PyoSignal
Back to Community
GeekNews / Hada

CUDA 커널을 실행하면 내부에서 벌어지는 일

2026년 6월 29일 오후 11:58 18 upvotes 0 comments
Read Original
nvcc CUDA Parallel Computing GPU Kernel Execution

📰 Article Summary

단순한 벡터 덧셈 연산이 수행되는 과정에는 컴파일 파이프라인부터 GPU 명령 큐, 워프 스케줄링, 메모리 계층 구조를 거치는 복잡한 단계가 포함됩니다. nvcc 컴파일러는 호스트 코드와 디바이스 코드를 분리하며, cicc 과정을 통해 PTX(Parallel Thread Execution) 코드를 생성합니다. 최종적으로 커널 실행은 드라이버 호출과 완료 세마포어 제어를 통해 하드웨어 수준에서 정밀하게 관리됩니다.

🔑 Key Points

  • nvcc 컴파일러는 호스트와 디바이스 코드를 분리하고 cicc를 통해 PTX 코드를 생성합니다.
  • 커널 실행은 드라이버 호출, 명령 큐, 워프 스케줄링 및 메모리 계층을 거쳐 수행됩니다.
  • 연산 완료를 제어하기 위해 세마포어와 같은 동기화 메커니즘이 활용됩니다.

Discussion Sources