Serverless on Tarragon

Serverless function 版本、事件來源與回復流程

Thu, 21 May 2026 00:00:00 +0000

Serverless 發布流程的核心責任是把函式 artifact、Function Alias、權限與 Event Source 一起推進。Serverless 部署看起來比長駐服務短，但每次 invocation 都依賴 runtime、IAM、event source、retry policy 與 observability；CI/CD 需要把這些條件視為發布契約。

流程定位

Serverless 的風險集中在觸發條件。函式部署成功只代表新版本存在，實際風險會在 HTTP request、queue message、topic event、scheduled job 或 edge request 觸發時出現。發布流程要能區分「版本建立成功」「alias 切流量成功」「事件來源行為正確」三件事。

階段	責任	判讀訊號
Package	產生 function bundle / layer	dependency、runtime target 是否固定
Version	發布 immutable function version	version 是否可追到 commit
Alias / traffic	控制新舊版本流量	alias 權重、錯誤率、冷啟動
Permission	限制 IAM、secret、resource policy	最小權限與環境隔離
Event Source	管理 trigger、retry、dead-letter	重試與毒訊息處理是否明確
Recovery	alias rollback、disable trigger、replay	是否能止血與修補資料

Package 階段負責產生可執行 bundle。Serverless 常見失敗是本機 dependency 可用，但打包後缺檔、runtime target 不符、native extension 不相容或 layer 版本漂移；CI 應在接近目標 runtime 的環境做 smoke test。

Version 階段負責建立不可變版本。直接覆蓋 $LATEST 會讓事故追溯困難；正式流量應指向 version 或 Function Alias，讓 rollback 能把 alias 切回前一個已知版本。

Function Alias / traffic 階段負責控制流量切換。HTTP function 可以用少量權重 canary；queue trigger 則要觀察 batch failure、retry、dead-letter 與 downstream side effect，因為同一個錯誤 event 可能被重試多次。

Permission 階段負責限制 blast radius。Serverless 函式容易因部署方便而累積過大 IAM 權限；每個 function 應只拿到必要 resource、secret 與 network access，並把 production secret 與 preview / staging 隔離。

Event Source 階段負責定義失敗重送語意。Queue、topic、object storage、HTTP 與 scheduler 的錯誤行為不同；CI/CD 文件要記錄 retry 次數、dead-letter destination、batch size、concurrency limit 與 replay 條件。

Recovery 階段負責止血。Serverless 常見止血方式是 alias rollback、停用 trigger、降低 concurrency、清理毒訊息、重放事件或 forward fix；只回退 code 版本不一定能處理已經排入 queue 的事件。

事件來源判讀

事件來源判讀的責任是找出失敗是否可重試。Serverless 常被誤判為「函式自己失敗」，但實際根因可能是 event schema、權限、上游重試或下游限流。

Event source	常見失敗	下一步
HTTP / API	status code、timeout、冷啟動	看 latency、concurrency、alias
Queue	batch failure、毒訊息、重試風暴	看 DLQ、batch size、visibility timeout
Topic	event schema 漂移	驗證 publisher / subscriber 契約
Object store	權限或路徑 pattern 錯誤	檢查 resource policy 與 filter
Scheduler	timezone、重入、上次執行未完成	檢查 idempotency 與 lock

這張表讓 release failure 能被導向正確 owner。若 event schema 變了，修 function 可能只是表面補丁；真正的 gate 要加在 publisher contract 或 sample event validation。

最小發布 gate

Serverless workflow 的最小 gate 應覆蓋 package、permission、event 與 alias。缺其中一段，部署成功就可能只是建立了一個尚未被驗證的函式版本。

Package bundle，固定 runtime target 與 dependency。
對 bundle 執行 unit / contract / sample event test。
用 least privilege policy 做 deploy dry run 或 policy diff。
發布 immutable function version。
用 alias 將少量流量導向新版本。
觀察 error、latency、retry、DLQ 與 downstream 指標。
指標穩定後提高 alias 權重或完成切換。
指標觸發 tripwire 時切回 alias、停用 trigger 或啟動 repair。

這個流程把 Serverless 發布從「上傳函式」提升成可回復流程。對事件驅動函式而言，trigger 與 retry policy 是發布契約的一部分。

下一步路由

Serverless 部署總覽：回 Serverless 部署 CI/CD。
Rollout 概念：讀 Rollout Strategy。
失敗處理：讀 CI 失敗到修復發布流程。

部署光譜：從 BaaS 到自架的四條路徑

Wed, 24 Jun 2026 00:00:00 +0000

監控方案的選擇不是「完全自架 Go collector」和「買 Sentry 訂閱」的二元決策。中間存在兩條路徑 — 用 BaaS（Supabase / Firebase）搭出託管版 collector，或用 PaaS（Railway / Fly.io）跑自架 collector 原始碼但不管 server。四條路徑的本質差異在「哪些層自己管、哪些交給平台」。

自架 vs 商業的判斷決策表用四個維度（使用者數 / 網路範圍 / 功能需求 / 合規）做二元分流。本章把光譜展開成四條路徑，讓中間的 BaaS 和 PaaS 選項浮現。Backend 選型模組已建立了完整的交付形態光譜（交付形態選型）和逐能力判斷外包深度的框架（能力級買 vs 建）。本章把那個框架特化到監控場景。

四條路徑

路徑	代表方案	Collector 是什麼	Storage 是什麼	自己管什麼	平台管什麼
A. 商業監控 SaaS	Sentry / Datadog / Firebase Analytics	vendor 提供	vendor 提供	SDK 埋點	全部
B. BaaS + Serverless	Supabase + Vercel / Cloudflare Workers	serverless function（自己寫）	managed PostgreSQL（Supabase）	collector 邏輯、schema	server 維運、DB 維運、TLS、HA
C. PaaS	Railway / Fly.io / Render	Go binary（自架 collector 原始碼）	SQLite（同 binary）或 managed DB	collector 邏輯、storage	server 維運、TLS、deploy
D. 完全自架	VPS + Go binary	Go binary	SQLite 或自管 PostgreSQL	全部	無

路徑 A 和 D 分別是光譜的兩端 — Sentry 深入、Firebase 套件和模組四 Collector 設計已完整討論。以下展開路徑 B 和 C。

路徑 B：BaaS + Serverless

APP 上線初期用 Supabase + Vercel（或 Cloudflare Workers）搭監控後端：serverless function 接收 SDK 送來的事件、驗證 schema 後寫入 Supabase 的 PostgreSQL。整條鏈路在免費方案額度內可以零成本運作。

架構差異

Serverless function 沒有常駐 process。模組四假設的 Go single binary 架構 — channel 背壓、single-writer goroutine pattern、in-memory buffer — 在 serverless 環境都不適用。每個 HTTP request 是獨立的 function invocation，沒有跨 request 的記憶體狀態。

背壓機制需要重新設計：Go collector 用 channel 容量做背壓（channel 滿回 429），serverless 版改用 DB-level 的 rate limit（PostgreSQL 的 advisory lock 或外部 rate limiter 如 Upstash Redis）或 platform-level 的 quota（Vercel 的 concurrency limit）。SDK 端的 429 處理邏輯不需要改 — 不管背壓訊號來自 channel 還是 DB quota，SDK 都是收到 429 後降採樣。

Downsample 和 purge 在 Go collector 是 background goroutine 定期執行。Serverless 沒有 background job — 需要外部 cron trigger（Vercel Cron / Supabase pg_cron / GitHub Actions scheduled workflow）。

免費方案限額

以下為 2026-06 查詢的各平台免費方案限額。平台定價會變動，決策前以官方定價頁為準。

平台	免費方案限額	對監控場景的意義
Supabase Free	500MB DB、50K MAU、500K Edge Function invocations/月	500MB 約 50-100 萬筆事件（每筆 ~500 bytes）、自用場景可用數月
Vercel Hobby	100GB bandwidth、10s function timeout、無明確 invocation 上限	瓶頸在 bandwidth 和 execution duration、非 invocation 數；timeout 對 ingestion 足夠
Cloudflare Workers	100K requests/天（免費）、D1 5GB	100K requests/天 x 100 筆/batch = 10M events/天、D1 的 SQLite 可替代 Supabase

Audit date: 2026-06。平台免費方案限額可能調整，決策前以官方定價頁為準。

適合情境

路徑 B 適合以下組合：APP 上線初期（使用者數 < 100）、團隊熟悉前端和 SQL 但不想管 server、想保留自訂 schema 和查詢彈性（商業 SaaS 的 schema 是 vendor 定義的）、零成本起步但未來可能遷到自架。

撞牆訊號

以下訊號出現時，代表路徑 B 的天花板已到、該評估遷到路徑 C 或 D：

連線數瓶頸：Supabase Free 的 PostgreSQL 約 20 個 concurrent connection。Serverless function 每次 invocation 開新連線，高併發時可能耗盡連線池。Supabase 內建 PgBouncer 做 connection pooling 可緩解，但免費方案的 pooler 有自己的連線上限。

Cold start 延遲：Vercel serverless function 的 cold start 約 200ms、Supabase Edge Function 約 100ms。對監控 ingestion（不是使用者面向 API）通常可接受，但如果 SDK 的 flush timeout 設得很短（< 1s），cold start 可能造成偶發超時。

Background job 限制：Downsample 和 purge 需要外部 cron。Vercel Hobby 支援最多 2 個 cron job、每個最頻繁每天觸發 1 次 — 如果需要每小時 downsample，要用 Supabase pg_cron（Free 方案支援）或外部 scheduler。

免費額度耗盡：Supabase 的 500K Edge Function invocations/月 ≈ 每天 16K requests。如果每個 request 攢批 100 筆事件，可處理每天 160 萬筆事件。超過後進入按量付費。Vercel Hobby 無明確 invocation 上限、瓶頸在 bandwidth（100GB/月）和 execution duration。

合規限制：Supabase Free 的 PostgreSQL 部署在特定 region。有 GDPR data residency 需求的 app（歐盟使用者的資料必須留在 EU）需確認 vendor 的 region 支援 — 免費方案的 region 選擇可能有限。

路徑 C：PaaS

PaaS 跑的是和完全自架相同的 Go collector 原始碼，差異只在部署方式。git push 觸發自動 build 和 deploy，平台管 server provisioning、TLS 憑證、process supervision。Collector 的 channel 背壓、single-writer pattern、SQLite storage 全部適用 — 和本機開發環境的行為一致。

Railway 和 Fly.io 都支援 persistent volume — Railway Hobby 含 1GB、Fly.io Free 含 1GB（限單 region）。SQLite 的 WAL 檔案需要持久化，persistent volume 是必要條件。Render 的免費方案沒有 persistent disk — SQLite 在每次 deploy 後重置，不適合需要保留歷史事件的場景。PaaS 平台以 container 形式運行 collector，SQLite 在 container 中的 I/O 和持久化考量見 Container 部署設計。

路徑 C 適合：想用自架 collector 但不想管 server / TLS / systemd 的團隊。程式碼完全相同，遷到自架（路徑 D）的成本接近零 — 把 binary 複製到 VPS、設定 systemd service 就完成。

路徑 C 的天花板在平台定價 — Railway Hobby 有 $5/月的資源上限、Fly.io Free 有 3 個 shared VM。流量成長到免費額度不夠時，PaaS 的按量付費和 VPS 月租費的交叉點是遷到自架的判讀訊號。

路徑間的遷移

遷移成本取決於起點和終點之間有多少層需要重寫。

遷移方向	成本	主要工作
B → C	中	Serverless function → Go binary（重寫 collector 邏輯）；DB 可保留或遷移
B → D	中	同上 + 自己管 server
C → D	低	同程式碼不同部署（複製 binary + systemd）
D → C	低	同程式碼推到 PaaS
D → A	低	SDK 改 endpoint 指向商業方案、不改 SDK 程式碼
A → D	高	從零建 collector + storage + dashboard
A → B	高	從零寫 serverless collector + 設定 managed DB
A → C	高	從零寫 Go collector + 推到 PaaS

路徑 B → C 或 B → D 的遷移代價主要在 collector 邏輯的重寫 — serverless function 的 request-level 處理和 Go binary 的 channel-based pipeline 是不同的架構，不能直接搬。資料層的遷移代價較低 — Supabase 的 PostgreSQL 資料可以用 pg_dump 匯出、匯入自管 PostgreSQL。

交付形態遷出的通用框架（資產線盤點、並行期設計、回切窗口）見託管形態遷出。

外包深度對照

用外包深度的三層框架（managed 基礎設施 / feature SaaS / BaaS bundle）看四條路徑：

路徑	外包深度	控制權	遷出代價
A. 商業監控 SaaS	feature SaaS（最深）	SDK 埋點 API、vendor 定義 schema 和查詢	高
B. BaaS + Serverless	managed 基礎設施 + 自寫 function（中間）	自訂 schema、自訂查詢、自訂 collector 邏輯	中
C. PaaS	managed 基礎設施（淺）	和自架相同、只有部署平台交出去	低
D. 完全自架	不外包	完全控制	無

路徑 B 在外包深度上介於 managed 基礎設施和 BaaS bundle 之間 — DB 和 runtime 交給平台，但 collector 邏輯和 schema 仍由開發者控制。這和 BaaS 的「前端 SDK 直連平台資料庫」模式不同 — 監控場景的路徑 B 仍然有一個自己寫的中間層（serverless function），只是這個中間層跑在平台上而非自己的 server。

選擇建議

情境	建議路徑	理由
自用工具、同機或同網段	D	成本最低、複雜度最低
APP 上線初期、使用者 < 100、零成本起步	B 或 A	B 保留自訂彈性、A 開箱即用
小型團隊、想用自架 collector 但不想管 server	C	程式碼相同、部署簡單、遷出成本低
使用者 > 1000、需要 dashboard + 告警 + replay	A	商業方案的功能完成度遠高於自建
合規要求資料不離開自有設施	D	完全控制資料位置

APP 上線初期選 B 或 A 取決於自訂需求 — 需要自訂 schema 和查詢邏輯（例如自定義 error fingerprint、行為事件命名規範）選 B，只需要開箱即用的 error tracking 或行為分析選 A。B 保留遷到自架的彈性（資料在自己的 PostgreSQL），A 的功能完成度更高（dashboard、告警、session replay 開箱即用）。

下一步路由

自架 vs 商業的詳細決策 → 自架 vs 商業的判斷決策表
自架 collector 的完整設計 → 模組四 Collector 設計
Backend 交付形態光譜 → 交付形態選型
能力級買 vs 建判斷 → 能力級買 vs 建
外包深度概念 → 外包深度
BaaS 概念 → BaaS
遷出劇本 → 託管形態遷出
Vendor lock-in 概念 → Vendor Lock-In

Serverless 部署 CI/CD

Wed, 06 May 2026 00:00:00 +0000

Serverless 部署 CI/CD 的核心責任是把函式型服務安全推進到受管執行環境。它和長駐服務不同，風險集中在 artifact 打包、runtime 相容、權限設定、版本別名與冷啟動行為。

場域定位

Serverless 發布通常以函式版本為單位，並透過 Function Alias 或流量權重切換。部署步驟看起來短，但對權限、Event Source、重試政策與 observability 欄位要求很高。

面向	Serverless 部署常見責任	判讀訊號
Build	function bundle、dependency、runtime target	package 是否可重現
Deploy	function version、alias、traffic shift	新舊版本是否可並存
Permission	IAM、resource policy、secret scope	執行是否具最小權限
Event Source	queue/topic/http trigger 設定	重試與死信策略是否明確
Recovery	alias rollback、disable trigger	故障時是否可快速止血

常見注意事項

部署前要先驗證 runtime 與依賴版本，避免 deploy 成功但 invocation 失敗。
事件觸發型函式要明確設定 retry、dead-letter 或回放策略。
權限設定要收斂到最小範圍，避免函式擴權風險。
冷啟動與併發上限要納入發布後觀測指標。

學習路線

章節	主題	核心責任
Serverless function 版本、事件來源與回復流程	Function version and event	管理版本別名、事件來源、權限與回復

下一步路由

Serverless 發布主流程：讀 Serverless function 版本、事件來源與回復流程。
Gate 原理：讀 CI gate 與 workflow 邊界。
失敗處理：讀 CI 失敗到修復發布流程。
Backend 相關概念：讀 Serverless / worker 相關知識卡。

4.16 靜態 / serverless RAG deployment：架構選擇與資安取捨

Tue, 12 May 2026 00:00:00 +0000

4.1 RAG 跟 4.12 embedding model 寫的是「RAG 在做什麼、embedding 怎麼選」、預設「有 backend server」可跑 embedding 跟 LLM。但實際大量場景是沒 backend — 個人 blog（Hugo / Jekyll / Astro）想加智能搜尋、docs site 想做 LLM 對話、demo 想離線跑。本章把這條「靜態 / serverless RAG」路線拆成四個方案、配合靜態場景特有的資安議題（這些議題模組六沒覆蓋、屬本章新增）。

本章目標

讀完本章後、你應該能：

區分四種 RAG deployment 方案（純前端 / edge serverless / RAG SaaS / 純文字 search）。
對自己場景判斷該選哪個方案、看資料量 / 隱私 / 預算。
認識靜態場景特有的資安議題：API key 暴露、CORS、abuse、第三方 SaaS 供應鏈、client-side 模型完整性。
知道哪些資安議題在模組六已覆蓋、哪些是本章獨有。

為什麼這個議題重要

傳統 RAG 教材預設架構：

1User → backend server → embedding API → vector DB → LLM API → response

需要 backend 可執行 server-side code、藏 API key、控制 rate limit。但個人開發者場景常見的 deployment：

場景	Backend？	部署方式
個人 Hugo blog	無	GitHub Pages / Cloudflare Pages
開源專案 docs site	無	GitHub Pages / Netlify / Vercel
商品 landing page	無	CDN + S3
Static-export Next.js / Astro	無	同上

這些場景跟「個人 dev 跑本地 LLM」並列、是教材的合理覆蓋面。

四種 deployment 方案總覽

1                          embedding   vector       LLM call
2                          搜尋          DB
3方案 1 純前端            browser       browser     browser（WebLLM）或 user-key 直 call
4方案 2 edge serverless   edge fn       edge DB     edge fn → LLM API
5方案 3 RAG SaaS          SaaS          SaaS        SaaS（或自 call）
6方案 4 純文字 search     N/A           static idx  N/A（不是 RAG）

四方案快速對比：

維度	1 純前端	2 edge serverless	3 SaaS	4 純文字 search
是否「真 RAG」	是	是	是	否（無 LLM）
隱私	最強（不離 browser）	中（信 edge provider）	弱（信 SaaS）	最強
Cost	完全 zero（build 一次）	每 query 付 edge + LLM	免費 tier / 按量計費	Zero
規模上限	< 10K chunks	1M+	視服務	視工具
開發複雜度	中（要 build pipeline）	中高（要寫 edge fn）	低（API 直接用）	低
主要資安議題	模型完整性、user-key 暴露	edge provider 信任	SaaS 信任 + 供應鏈	較少（無 LLM）

方案 1：純前端 RAG（browser-side everything）

整個 RAG pipeline 都跑在使用者瀏覽器：

 1Build time（Hugo build / CI pipeline）：
 2  content/*.md
 3    ↓ 抽段、chunk
 4    ↓ embedding model（Node.js 版 sentence-transformers）
 5  embeddings.json（每個 chunk 一個 vector）
 6    ↓ 跟 HTML 一起 deploy
 7
 8Runtime（user browser）：
 9  User query
10    ↓ load @xenova/transformers + embeddings.json（首訪載 ~50MB）
11    ↓ embed query in browser
12    ↓ cosine similarity vs embeddings.json
13  top-K chunks
14    ↓ LLM call（兩條子路線、見下）
15  Response in browser

LLM 的兩條子路線：

子路線	機制	取捨
Client-side LLM	WebLLM / wllama 跑 < 4B model	完全離線、首訪載 1-3GB 模型、隱私最強
User 自帶 API key	前端讀 localStorage 的 key、直 call API	高品質（雲端旗艦）、key 暴露、需要使用者授信

實作概要：

1# Build time（Node.js script）
2npx @xenova/transformers-cli embed content/*.md > static/embeddings.json
3
4# Frontend（簡化版）
5import { pipeline } from '@xenova/transformers';
6const embedder = await pipeline('feature-extraction', 'nomic-embed-text-v1.5');
7const queryVec = await embedder(userQuery, { pooling: 'mean' });
8const ranked = embeddings.map(c => ({ ...c, score: cosineSim(c.vec, queryVec.data) }))
9                          .sort((a,b) => b.score - a.score).slice(0, 5);

規模上限：

< 1000 chunks：embeddings.json ~ 4MB（1024-dim float32）、輕鬆
1K-10K：~40MB、首訪載入慢但可接受
10K+：純前端開始勉強、考慮方案 2

適合場景：個人 blog、docs site、demo、隱私敏感、規模 < 10K chunks。

方案 2：靜態 + edge serverless

「靜態主站 + edge function 處理動態請求」：

 1靜態前端（HTML / JS、Hugo / Astro）
 2   ↓ fetch /api/rag
 3Edge function（Cloudflare Workers / Vercel Edge / Netlify Functions）
 4   ↓
 5Embedding API（OpenAI / Voyage）
 6   ↓
 7Vector DB（Cloudflare Vectorize / Pinecone / Turso vector / Upstash Vector）
 8   ↓
 9LLM API（OpenAI / Anthropic / Cloudflare AI Gateway）
10   ↓ response
11靜態前端

對使用者體感跟「有 backend」一樣、但你不用維護 server / 不用 sysadmin。

主流元件搭配：

元件	Cloudflare 全家桶	Vercel / 其他
Edge runtime	Workers	Vercel Edge / Netlify Functions
Vector DB	Cloudflare Vectorize	Pinecone / Turso / Upstash
Embedding	Workers AI 內建模型 / OpenAI	OpenAI / Voyage
LLM	Workers AI / AI Gateway 轉發	OpenAI / Anthropic

關鍵特性：

API key 不暴露在 browser：edge function 內讀環境變數、安全
可加 rate limit：edge function 內判斷 client IP / user agent、避免 abuse
Build-time index 仍重要：embedding ingestion 通常在 build 階段、不在 runtime
Edge cold start：第一次 query latency 略高（~100ms 額外）、後續 hot 路徑快

適合場景：規模 1K-100K chunks、想保留近 backend 體驗、可接受少量 cost。這條路線一旦升級到有 backend 的 vector DB、storage 選型（index 結構、維度、成本）就回到 4.22 RAG storage 工程的判讀。

方案 3：靜態 + RAG SaaS

把整個 RAG stack 外包：

服務	角色	免費 tier 上限
Algolia	搜尋 + 向量檢索一條龍、build time 同步	10K records、10K search / month
Pinecone Cloud	純 vector DB、自己 call embedding + LLM	100K vectors（starter）
Weaviate Cloud	同上、hybrid search 內建	14 天 trial
MeiliSearch Cloud	BM25 + vector hybrid	試用

API key 設計：

search-only key：只能查詢、無寫入權限、可安全暴露在 browser（這是設計支援的）
admin key：build time CI 用、有寫入權限、必須藏 server-side

前端範例（Algolia）：

1const client = algoliasearch('APP_ID', 'SEARCH_ONLY_KEY');  // 可公開
2const index = client.initIndex('my-blog');
3const { hits } = await index.search(userQuery, { hitsPerPage: 5 });

適合場景：想最快上線、不在乎 vendor lock-in、規模中小、retrieval-only（不需要 LLM 對話）。

方案 4：靜態 + 純文字 search（不是真 RAG）

Pagefind、Stork、lunr.js、FlexSearch — build time 產靜態 search index、純前端查詢。

工具	機制
Pagefind	static-first、自動 chunking、CJK 友善
Stork	Rust 寫的 keyword search、輕量
lunr.js	純 JS、tf-idf BM25 風格
FlexSearch	同上、體積更小

這不是 RAG：

無 embedding similarity：keyword / fuzzy match、不是語意相似
無 LLM augmentation：只列文章連結、不生成回答
算 retrieval 的「字面」變體：見 4.1 RAG 的「語意 vs 字面」段

適合場景：blog 內搜尋只需要找文章、不需要對話、極致 zero-cost。

規模門檻：什麼時候該升級方案

1< 1K chunks                    → 方案 1 純前端、最簡單
21K - 10K chunks                → 方案 1 或 方案 4
310K - 100K chunks              → 方案 2 edge serverless
4100K+ chunks                   → 完整 backend RAG（不再是「靜態」場景）
5非 RAG、只要找文章             → 方案 4（Pagefind 等）

靜態場景特有的資安議題

本章節最重要的部分。靜態 / serverless RAG 有些議題模組六沒覆蓋、要在本章補。

1. API key 暴露 — 靜態場景的根本問題

核心衝突：靜態網站沒 server-side runtime、藏不了 secret。任何寫在前端 JS / 編進 HTML 的東西、使用者按 F12 都看得到。

對應到 RAG：

元件	能否前端持有 key	緩解
Embedding API（生成方）	否（admin key 不該暴露）	build time 用、不放前端
LLM API（生成方）	否	改方案 2 用 edge、或讓使用者自帶 key
Vector DB（read）	可（search-only key 設計支援）	API 設計時就分權、search-only 可公開
完整 LLM 跑在前端	N/A（無 server-side key）	方案 1 的 Client-side LLM 子路線

如果要 LLM 對話功能、三條合法路線：

使用者自帶 API key（如 Anthropic / OpenAI）、存 localStorage、前端直接 call API — 適合 power user、需要使用者授信
WebLLM / wllama 跑前端 LLM — 模型在 browser、不需 server-side key
方案 2 edge serverless — key 藏在 edge function、就不是純靜態了

寫死 API key 在前端 JS 等於把 key 公開、會被 scraper 撿走燒爆 quota — 這是 anti-pattern、跟 6.4 跨雲端 / 本地資料邊界提到「API key 寫死 config」的延伸版（前端更嚴重、所有訪客都看得到）。

2. User query 隱私

靜態場景的 query 走向：

方案	Query 走向	誰能看到
1 純前端 + WebLLM	從不離 browser	只有使用者本人
1 + user API key	Browser → 雲端 vendor	該 vendor（依政策）
2 edge serverless	Browser → edge → 雲端 API	Edge provider + LLM vendor
3 SaaS	Browser → SaaS	SaaS provider

對應 framing 跟 0.7 隱私資料流同源 — 但靜態場景的特殊性是「前端直接出去」、不像 backend 場景可以加一層中介控制。

特別注意：

方案 3 SaaS 的 query 隱私：Algolia / Pinecone 都會 log query、依政策可能用於改進服務；對隱私敏感場景不適合
Edge provider 的 region：Cloudflare Workers 的 edge node 可能在跟使用者不同 region 處理、跨境資料法規（GDPR 等）要考慮
Browser extension 偷 query：使用者裝的 plugin 可能 access 整個頁面、包含 RAG 介面內的 query

3. CORS / 同源策略 — Browser 特有的安全模型

靜態前端 call 任意 API 會撞 CORS（Cross-Origin Resource Sharing）：

1靜態網站：https://my-blog.com
2要 call：https://api.openai.com/v1/...
3   ↓
4Browser 檢查 OpenAI 是否在 Access-Control-Allow-Origin 含 my-blog.com
5   ↓
6OpenAI 預設允許所有 origin（為了讓前端 SDK 能用）→ 通過
7某些 API（Anthropic 早期版本）不允許 browser 直 call → 失敗、必須走 edge

判讀：

能在 browser 直 call 的 API：OpenAI、Voyage、Algolia（search-only）等明確設計 browser-friendly 的服務
不能 browser 直 call、要 edge proxy：許多企業 LLM API、私有 vector DB、需要 server-only credentials 的服務

CORS 不是「資安漏洞」、是 browser 對「JS 從一個網站 call 另一個網站」的設計約束、用來保護使用者。要繞 CORS 要嗎服務商配合（設 ACAO）、要嗎用 edge function proxy。

4. 第三方 SaaS 信任 — 跟 6.0 同源、對象換

6.0 模型供應鏈與信任邊界處理的是「模型權重的信任」。靜態 RAG SaaS（Algolia / Pinecone / Weaviate Cloud）引入另一條供應鏈：

 1模型供應鏈（6.0 覆蓋）：
 2  原作者 → quantizer → registry → 你機器
 3
 4RAG SaaS 供應鏈（本章新增）：
 5  你的 content → SaaS embedding service → SaaS vector DB → SaaS retrieval
 6    └──────── 全程在 SaaS 內、你信任 SaaS 沒做以下事 ────────┘
 7              - 把你 index 用於訓練他們自己的模型
 8              - 把你 query log 賣給第三方
 9              - 沒做適當 isolation（你跟其他客戶的資料）
10              - 沒處理好 supply chain（他們用的 base embedding model）

判讀類似 0.7 物理 vs 合約保證：本地方案是物理保證（資料不離 browser）、SaaS 方案是合約保證（信 SaaS 的 ToS）。

5. Rate limit / abuse — 前端被 scrape 後濫用

靜態 RAG 的特殊 abuse 路徑：

1攻擊者掃到你的 demo blog
2   ↓ 找到前端載入的 embedding endpoint / LLM endpoint
3   ↓ 直接從攻擊者 server 重複 call（不經 browser）
4   ↓ 你的 LLM API quota 燒爆 / SaaS 配額耗光

緩解：

方案 2 edge + 加 rate limit by IP / token bucket：edge function 內 reject 過量請求
方案 1 純前端 + WebLLM：根本沒 server-side endpoint 可被 abuse、最安全
方案 3 SaaS + 用 search-only key 並設 query 上限：SaaS 通常內建 quota
CAPTCHA / Turnstile：邊緣防護

絕對不該做：把 OpenAI / Anthropic API key 寫在前端 JS、想用 rate limit 阻擋 — 攻擊者拿到 key 後不會經過你的 rate limit。

6. Client-side LLM 的模型完整性

Client-side LLM 把幾 GB 模型權重下載到 browser、引入新的供應鏈面：

1你的網站
2   ↓