Procházet zdrojové kódy

model: benchmark bpe split

Michael Yang před 2 měsíci
rodič
revize
78144e4686
1 změnil soubory, kde provedl 8 přidání a 1 odebrání
  1. 8 1
      model/process_text_test.go

+ 8 - 1
model/process_text_test.go

@@ -209,7 +209,7 @@ func TestLlama(t *testing.T) {
 	})
 	})
 }
 }
 
 
-func Benchmark(b *testing.B) {
+func BenchmarkBytePairEncoding(b *testing.B) {
 	tokenizer := llama(b)
 	tokenizer := llama(b)
 	bts, err := os.ReadFile(filepath.Join("testdata", "war-and-peace.txt"))
 	bts, err := os.ReadFile(filepath.Join("testdata", "war-and-peace.txt"))
 	if err != nil {
 	if err != nil {
@@ -243,5 +243,12 @@ func Benchmark(b *testing.B) {
 				}
 				}
 			}
 			}
 		})
 		})
+
+		b.Run("split"+strconv.Itoa(n), func(b *testing.B) {
+			b.ResetTimer()
+			for range b.N {
+				slices.Collect(tokenizer.split(string(bts)))
+			}
+		})
 	}
 	}
 }
 }