Browse Source

update llama.cpp

Michael Yang 1 year ago
parent
commit
c5bcf32823

+ 1 - 1
llama/ggml-alloc.c

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-alloc.h

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

File diff suppressed because it is too large
+ 433 - 207
llama/ggml-cuda.cu


+ 1 - 1
llama/ggml-cuda.h

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-metal.h

@@ -1,7 +1,7 @@
 //go:build darwin
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-metal.m

@@ -1,7 +1,7 @@
 //go:build darwin
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-metal.metal

@@ -1,7 +1,7 @@
 //go:build darwin
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-mpi.c

@@ -1,7 +1,7 @@
 //go:build mpi
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-mpi.h

@@ -1,7 +1,7 @@
 //go:build mpi
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-opencl.cpp

@@ -1,7 +1,7 @@
 //go:build opencl
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml-opencl.h

@@ -1,7 +1,7 @@
 //go:build opencl
 
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml.c

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/ggml.h

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/k_quants.c

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/k_quants.h

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/llama-util.h

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 1 - 1
llama/llama.cpp

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

+ 0 - 5
llama/llama.go

@@ -128,11 +128,6 @@ func New(model string, opts api.Options) (*LLM, error) {
 
 	C.llama_backend_init(C.bool(llm.UseNUMA))
 
-	// TODO: GQA == 8 suggests 70B model which doesn't support metal
-	if llm.NumGQA == 8 {
-		llm.NumGPU = 0
-	}
-
 	params := C.llama_context_default_params()
 	params.seed = C.uint(llm.Seed)
 	params.n_ctx = C.int(llm.NumCtx)

+ 1 - 1
llama/llama.h

@@ -1,5 +1,5 @@
 /**
- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
  *
  * MIT License
  *

Some files were not shown because too many files changed in this diff