瀏覽代碼

add command-r graph estimate

Michael Yang 1 年之前
父節點
當前提交
01f77ae25d
共有 1 個文件被更改,包括 1 次插入1 次删除
  1. 1 1
      llm/ggml.go

+ 1 - 1
llm/ggml.go

@@ -327,7 +327,7 @@ func (llm GGML) GraphSize(context, batch int) (int64, bool) {
 	}
 
 	switch llm.KV().Architecture() {
-	case "gemma":
+	case "gemma", "command-r":
 		return 4 * int64(batch) * int64(embeddingLength+uint64(vocabLength)), true
 	case "phi2":
 		return max(