sampling_ext.cpp 1.6 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546
  1. // TODO: this is a temporary wrapper to allow calling C++ code from CGo
  2. #include "sampling.h"
  3. #include "sampling_ext.h"
  4. struct llama_sampling_context* llama_sampling_cinit(struct llama_sampling_cparams *params) {
  5. llama_sampling_params sparams;
  6. sparams.top_k = params->top_k;
  7. sparams.top_p = params->top_p;
  8. sparams.tfs_z = params->tfs_z;
  9. sparams.typical_p = params->typical_p;
  10. sparams.temp = params->temp;
  11. sparams.penalty_repeat = params->penalty_repeat;
  12. sparams.penalty_freq = params->penalty_freq;
  13. sparams.penalty_present = params->penalty_present;
  14. sparams.mirostat = params->mirostat;
  15. sparams.mirostat_tau = params->mirostat_tau;
  16. sparams.mirostat_eta = params->mirostat_eta;
  17. sparams.penalize_nl = params->penalize_nl;
  18. sparams.seed = params->seed;
  19. sparams.grammar = std::string(params->grammar);
  20. return llama_sampling_init(sparams);
  21. }
  22. void llama_sampling_cfree(struct llama_sampling_context * ctx){
  23. llama_sampling_free(ctx);
  24. }
  25. void llama_sampling_creset(struct llama_sampling_context * ctx){
  26. llama_sampling_reset(ctx);
  27. }
  28. llama_token llama_sampling_csample(
  29. struct llama_sampling_context * ctx_sampling,
  30. struct llama_context * ctx_main,
  31. struct llama_context * ctx_cfg,
  32. int idx) {
  33. return llama_sampling_sample(ctx_sampling, ctx_main, ctx_cfg, idx);
  34. }
  35. void llama_sampling_caccept(
  36. struct llama_sampling_context * ctx_sampling,
  37. struct llama_context * ctx_main,
  38. llama_token id,
  39. bool apply_grammar) {
  40. llama_sampling_accept(ctx_sampling, ctx_main, id, apply_grammar);
  41. }