1 year ago · c5bcf32823
--- a/llama/ggml-alloc.c
+++ b/llama/ggml-alloc.c
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-alloc.h
+++ b/llama/ggml-alloc.h
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-cuda.cu
+++ b/llama/ggml-cuda.cu
--- a/llama/ggml-cuda.h
+++ b/llama/ggml-cuda.h
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-metal.h
+++ b/llama/ggml-metal.h
@@ -1,7 +1,7 @@
 
				 //go:build darwin
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-metal.m
+++ b/llama/ggml-metal.m
@@ -1,7 +1,7 @@
 
				 //go:build darwin
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-metal.metal
+++ b/llama/ggml-metal.metal
@@ -1,7 +1,7 @@
 
				 //go:build darwin
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-mpi.c
+++ b/llama/ggml-mpi.c
@@ -1,7 +1,7 @@
 
				 //go:build mpi
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-mpi.h
+++ b/llama/ggml-mpi.h
@@ -1,7 +1,7 @@
 
				 //go:build mpi
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-opencl.cpp
+++ b/llama/ggml-opencl.cpp
@@ -1,7 +1,7 @@
 
				 //go:build opencl
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml-opencl.h
+++ b/llama/ggml-opencl.h
@@ -1,7 +1,7 @@
 
				 //go:build opencl
			
 
				 
			
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml.c
+++ b/llama/ggml.c
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/ggml.h
+++ b/llama/ggml.h
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/k_quants.c
+++ b/llama/k_quants.c
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/k_quants.h
+++ b/llama/k_quants.h
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/llama-util.h
+++ b/llama/llama-util.h
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/llama.cpp
+++ b/llama/llama.cpp
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *
			
--- a/llama/llama.go
+++ b/llama/llama.go
@@ -128,11 +128,6 @@ func New(model string, opts api.Options) (*LLM, error) {
 
				 
			
 
				 	C.llama_backend_init(C.bool(llm.UseNUMA))
			
 
				 
			
 
				-	// TODO: GQA == 8 suggests 70B model which doesn't support metal
			
 
				-	if llm.NumGQA == 8 {
			
 
				-		llm.NumGPU = 0
			
 
				-	}
			
 
				-
			
 
				 	params := C.llama_context_default_params()
			
 
				 	params.seed = C.uint(llm.Seed)
			
 
				 	params.n_ctx = C.int(llm.NumCtx)
			
--- a/llama/llama.h
+++ b/llama/llama.h
@@ -1,5 +1,5 @@
 
				 /**
			
 
				- * llama.cpp - git c574bddb368424b5996cbee2ec45ec050967d404
			
 
				+ * llama.cpp - git 8183159cf3def112f6d1fe94815fce70e1bffa12
			
 
				  *
			
 
				  * MIT License
			
 
				  *