"Ollama"
- Hands-on:用 blog content 當 corpus 跑 RAG
200 行 Python:embedding + cosine retrieval + Ollama chat、validating 4.0 RAG 原理
- Hands-on:Ollama 改檔案 / 寫程式碼的權限邊界在哪
四組對照實驗:Ollama 自己沒 FS / shell 權限、wrapper 才有;--dry-run / --confirm / --auto 三檔審查粒度的取捨
- Hands-on:跨資料夾風格 follow 任務的模型對比
1B / 4B / 8B / 跨代 4B 在「讀風格參考、follow 既有格式、寫新章節」任務上的 structural metrics 對比、揭示 model size 不是唯一因素
- Hands-on:LLM 運行中 + 結束的資源管理
RAM / 磁碟 / port 三個 dimension 的觀察跟釋放、Ollama keep_alive 跟 ComfyUI 兩種 lifecycle 對比、實測釋放數字
- Hands-on:用本地 LLM 跑 judge harness(最小可行版)
在 Ollama / LM Studio 上跑 local reasoning model 當 judge、對自己工作流案例做 eval、JSONL in / JSONL out 最小 harness
- 1.0 Ollama:主流推論伺服器
一行 brew 裝完、ollama run 一鍵跑 Gemma 4 MTP、OpenAI 相容 API on localhost:11434
- Hands-on:安裝 Ollama + 拉第一個 Gemma 模型
brew install ollama、launchd service、ollama pull、curl 驗證 OpenAI 相容 API