작업

AI 모델 서빙 병목 현상 해결 및 처리량 증대

Name: AI 모델 서빙 병목 현상 해결 및 처리량 증대
Start: 2026-02-23
End: 2026-02-23

시작일 2026-02-23

종료일 2026-02-23

설명

https://today.godd.app/project/91098daa-f5fe-4bb5-970a-39f8b6454bc1 ![clipboard-image-1771837268779.png](https://fileupload.godd.app/api/files/d54804ad-7082-4f5c-83f8-34d352cd4586/download) ![clipboard-image-1771821361676.png](https://fileupload.godd.app/api/files/544b8be1-e593-4ce1-a56c-3b7af936838b/download) ![clipboard-image-1771823164652.png](https://fileupload.godd.app/api/files/749e10b9-dc07-4be4-998d-bd48af5491e1/download) # 포트 죽이기 `kill $(lsof -t -i:8080) 2>/dev/null; pkill -f "light_tts.server.api_server" 2>/dev/null` # runpod에서 실행 python -m light_tts.server.api_server \ --model_dir ./pretrained_models/Fun-CosyVoice3-0.5B-2512 \ --host 0.0.0.0 \ --port 8080 \ --max_total_token_num 131072 \ --graph_max_batch_size 32 \ --load_trt True \ --load_jit True \ --running_max_req_size 60 \ --data_type float16 \ 2>&1 & echo "Server PID: $!" ![clipboard-image-1771828818893.png](https://fileupload.godd.app/api/files/39ada60a-0769-43d7-9656-c65a3709d3a5/download) # 최적화 nvidia-cuda-mps-control -d # 파일업로드 `curl -A "curl" -F 'file=@archive.tar.gz' https://0x0.st`