系統設定

設定 AI 模型、RAG 參數與系統選項。大多數設定儲存後立即生效,無需重啟

即時生效(無需重啟):供應商切換、模型名稱、溫度、API 金鑰、Embedding 模型|需重啟:Qdrant 連線、DeepDoc / OCR 服務網址、HTTP-Referer / X-Title

聊天模型供應商

OpenRouter 設定

雲端 API
API 金鑰openrouter.ai/keys 取得
API 網址base-url
聊天模型openrouter.ai/models
免費模型加 :free 後綴;付費模型移除 :free
溫度 (Temperature)0.0 = 確定性,2.0 = 創意
0.7
最大回覆 Tokenmax-completion-tokens
HTTP-Referer識別來源(選填)
X-Title應用程式名稱(選填)
Embedding 模型openrouter.ai/models(選填)
填入後將使用 OpenRouter 提供的 Embedding;留空則沿用 Ollama Embedding
Embedding 向量維度embedding.vector-dimensions
留空或 0 = 自動偵測;768 = nomic-embed-text;1536 = text-embedding-3-small;3072 = text-embedding-3-large
僅限知識庫回答來源限制

Ollama 設定

本地端
Ollama 服務網址base-url
聊天模型已 ollama pull 的模型
溫度 (Temperature)0.0 = 確定性,2.0 = 創意
0.7
Context Windownum-ctx(token 數)
Embedding 模型spring.ai.ollama.embedding.model
需先執行 ollama pull nomic-embed-text
僅限知識庫回答來源限制

Generation

基本設定
Bedrock Model Region模型服務區域
支援 Bedrock 的區域,例如 us-east-1、ap-northeast-1、eu-west-1
Access Key IDAWS 存取金鑰 ID
Secret Access KeyAWS 秘密存取金鑰
Session Token臨時憑證 Token(選填)
使用 IAM Role 假冒(AssumeRole)時填入;一般 IAM User 留空
模型 IDBedrock Model ID
支援 Converse API 的模型,例如 anthropic.claude-*、meta.llama*、amazon.titan-*
取樣參數模式Claude 系列不可同時使用
⚠️ Claude 系列(Anthropic)不允許同時傳送 Temperature 與 Top P,請選「使用 Temperature」或「使用 Top P」。Titan、Llama、Mistral 等其他模型可選「同時使用」;選錯時驗證設定會偵測並提示。
溫度 (Temperature)0.0 = 確定性,1.0 = 創意
0.7
Top PNucleus Sampling
0.9
建議 0.8–0.95。Claude 系列模型不允許與 Temperature 同時使用,請透過上方「取樣參數模式」擇一;Titan、Llama、Mistral 等其他模型則無此限制。
最大回覆 TokenmaxTokens
Generation Prompt自訂系統提示詞(選填)
填入後此提示詞將覆蓋預設 System Prompt,專屬套用於 Bedrock 模型。留空時系統會依下方「僅限知識庫」設定自動選擇提示詞。
僅限知識庫回答來源限制

Knowledge Base

知識庫設定
Knowledge Base IDBedrock KB 識別碼
在 AWS Console → Bedrock → Knowledge bases 找到;用於 RAG 查詢。留空時不使用 Bedrock KB(聊天直接呼叫模型)。
Data Source IDKB 資料來源識別碼
在 AWS Console → Bedrock → Knowledge bases → 選擇 KB → Data sources 找到。上傳文件至 S3 後,系統將自動呼叫此資料來源的同步作業(StartIngestionJob)。留空則不自動同步,需至 AWS Console 手動啟動同步。
Knowledge Base RegionKB 所在地區
Knowledge Base 所在 AWS Region(可與 Bedrock 模型的 Region 不同)。留空時沿用上方「Bedrock Model Region」設定。
S3 Bucket 名稱文件上傳目標 Bucket
上傳文件時存放的 S3 Bucket,需與 Bedrock KB 資料來源一致。需確認 IAM 憑證有 s3:PutObject 權限。
S3 RegionS3 Bucket 所在地區
S3 Bucket 所在 AWS Region(可與 Bedrock 模型的 Region 不同)。留空時沿用上方「Bedrock Model Region」設定。
S3 Key 前綴物件路徑前綴(選填)
上傳至 S3 的物件路徑前綴,結尾需包含 /。例如:rag/docs/。留空則直接放置於 Bucket 根目錄。
Knowledge Base 同步手動觸發並確認同步狀態
點擊後將觸發 StartIngestionJob,並持續輪詢狀態直到完成。可用於確認同步是否正常,以及刪除的文件是否已從 Knowledge Base 索引中移除(注意:numberOfDocumentsDeleted 欄位即代表此次 job 移除的舊文件數量)。

Orchestration

推論設定
跨區域推論設定檔 ARNCross-region Inference Profile(選填)
啟用後,模型 ID 欄位可改填推論設定檔 ARN,系統自動跨區域路由
Orchestration Prompt代理編排提示詞(選填)
用於搭配 Bedrock Agent 或多步驟任務編排時的額外指引提示詞。一般對話場景可留空。

Guardrails

內容安全防護
Guardrail ID防護規則識別碼(選填)
在 AWS 主控台 → Bedrock → Guardrails 取得;留空則不啟用
Guardrail 版本版本號或 DRAFT
填入 DRAFT 使用草稿版,或填入數字版本號(如 1、2)

Reranking

重新排序
啟用 RerankingRAG 結果重新排序
Reranking 模型 ID重排序模型
目前支援 amazon.rerank-v1:0;需確認所在 Region 是否提供此模型
Top N重排序後保留的最大結果數
建議 3–10;不得大於 RAG 向量搜尋的 TopK 值

Query Modification

查詢改寫
啟用查詢改寫Query Reformulation

RAG 向量搜尋參數

TopK每次問答撈取的段落數
建議值 10;chunk 越小的解析器可設較大值
相似度門檻similarityThreshold
0.3
越低越寬鬆;建議 0.2–0.4
Chunk 大小正規化後的目標 token 數
建議 800–1500;越大每塊包含更多上下文

Qdrant 向量資料庫

主機host
gRPC Port預設 6334
Collection 名稱collection-name

DeepDoc 解析器設定

版面感知 OCR
DeepDoc 服務網址deepdoc-service-url
檔案上傳路徑upload-path

Tika 解析器設定

快速解析
OCR 服務網址ocr-service-url
容器化 Tesseract OCR 微服務;留空或服務未啟動時自動跳過 OCR 層
檔案上傳路徑tika-upload-path
Tika 解析器的檔案儲存目錄;留空則沿用 DeepDoc 的路徑