Tarragon
搜尋
文章
標籤
Now
RSS
"Inference"
2026-05-12
Acceptance Rate
speculative decoding 中 drafter 提出的 token 被 target model 接受的比例、決定實際加速倍率
2026-05-12
Forward Pass
input 經過所有 layer 的計算、得到 output 的單向流程;推論跟訓練都會跑、訓練多一個反向階段
2026-05-12
Test-Time Compute
推論時動態增加計算量換取答案品質的 paradigm、reasoning model 跟 best-of-N 的共同基底