浏览代码

fix q5_0, q5_1

Michael Yang 11 月之前
父节点
当前提交
8f440d579a
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      llm/ggml.go

+ 1 - 1
llm/ggml.go

@@ -127,7 +127,7 @@ func (t Tensor) blockSize() uint64 {
 	switch t.Kind {
 	case 0, 1, 24, 25, 26, 27, 28, 31: // F32, F16, I8, I16, I32, I64, F64, BF16
 		return 1
-	case 2, 3, 8, 9, 20: // Q4_0, Q4_1, Q8_0, Q8_1, IQ4_NL
+	case 2, 3, 4, 5, 6, 7, 8, 9, 20: // Q4_0, Q4_1, Q5_0, Q5_1, Q8_0, Q8_1, IQ4_NL
 		return 32
 	default: // All others
 		return 256