Paper (9) 썸네일형 리스트형 Fractional GPUs : Software-based Compute and Memory Bandwidth Reservation for GPUs Abstract GPU는 큰 성능 이익때문에 자율주행같은 real-time system(이하 RT, RTS)에 점차 사용되고있다. 하지만 RTS는 예측가능한 성능을 요구한다. Nvidia는 최근 Multi-Process Service(MPS)라 불리는 closed-source kernel module 형태의 feature를 제공했다. 하지만 MPS는 GPU의 compute자원을 분할하는 능력만을 제공할뿐 shared memory hierarchy내 어플리케이션간 충돌을 피하는 메커니즘은 제공하지 않았다. 실험상 최악의 경우에, 동식 동작하는 GPU task로부터의 간섭 때문에 read/write transaction이 10x 이상 느려짐을 확인할수 있었다. 이 논문에서, performance isolat.. 이전 1 2 다음