build_hipblas.sh 1.2 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344
  1. hipcc \
  2. -parallel-jobs=12 \
  3. -O3 \
  4. --offload-arch=gfx900 \
  5. --offload-arch=gfx940 \
  6. --offload-arch=gfx941 \
  7. --offload-arch=gfx942 \
  8. --offload-arch=gfx1010 \
  9. --offload-arch=gfx1012 \
  10. --offload-arch=gfx1030 \
  11. --offload-arch=gfx1100 \
  12. --offload-arch=gfx1101 \
  13. --offload-arch=gfx1102 \
  14. -DGGML_USE_CUDA \
  15. -DGGML_BUILD=1 \
  16. -DGGML_SHARED=1 \
  17. -DGGML_CUDA_DMMV_X=32 \
  18. -DGGML_CUDA_MMV_Y=1 \
  19. -DGGML_SCHED_MAX_COPIES=4 \
  20. -DGGML_USE_HIPBLAS \
  21. -DGGML_USE_LLAMAFILE \
  22. -DHIP_FAST_MATH \
  23. -DNDEBUG \
  24. -DK_QUANTS_PER_ITERATION=2 \
  25. -D_CRT_SECURE_NO_WARNINGS \
  26. -Xclang --dependent-lib=msvcrt -Wl,/subsystem:console \
  27. -Wno-expansion-to-defined \
  28. -Wno-invalid-noreturn \
  29. -Wno-ignored-attributes \
  30. -Wno-pass-failed \
  31. -Wno-deprecated-declarations \
  32. -I. \
  33. -lhipblas -lamdhip64 -lrocblas \
  34. -shared \
  35. -o ggml-hipblas.dll \
  36. ggml-cuda.cu ggml-cuda/*.cu ggml.c ggml-backend.c ggml-alloc.c ggml-quants.c sgemm.cpp
  37. # --offload-arch='gfx906:xnack-' \
  38. # --offload-arch='gfx908:xnack-' \
  39. # --offload-arch='gfx90a:xnack+' \
  40. # --offload-arch='gfx90a:xnack-' \
  41. # -D_DLL \
  42. # -D_MT \
  43. # -D_XOPEN_SOURCE=600 \