Tarragon
搜尋
文章
標籤
Now
RSS
"Model-Family"
2026-05-12
Reasoning Model
訓練成自然輸出長 reasoning trace 的 LLM 變體、o1 / DeepSeek-R1 / Claude thinking 為代表