Silly Tavern 怎么接 API:OpenRouter、本地推理怎么选
「Silly Tavern 怎么用」第 3 篇。只讲常见路线与决策,不替代某一版 ST 的每一个菜单截图;以你界面上的文字为准。
搜 OpenRouter、Koboldcpp、Oobabooga 的人,多半在问同一件事:把 Silly Tavern 接到哪台「大脑」上?
先选路:云端还是本机
| 你更在意 | 倾向 |
|---|---|
| 省事、机器轻、愿意按量付费 | 云端 API(如 OpenRouter 等聚合商,或直接某家云 API) |
| 隐私、离线、可控成本(硬件 upfront) | 本机推理(Koboldcpp、text-generation-webui 等) |
云端=叫外卖;本机=自家厨房。没有绝对更好,只有更适合你。
名词一笔带过
- OpenRouter:常见 API 聚合/路由 服务之一,让你用统一方式调用多种模型;具体模型列表与计费以官网为准。
- Koboldcpp:常用来 本机跑模型 并通过 HTTP 暴露接口的程序之一。
- Oobabooga(text-generation-webui):另一套流行的 本地 Web UI + API 方案,很多人口里的「oob」。
名字会变、版本会分叉——你要抓住的只有两样:服务是否在跑、ST 里填的 URL/端口对不对。
接 API 的通用步骤(动词)
- 拿到:服务商给你的 API Base URL(或本机程序的监听地址,如
http://127.0.0.1:5000)。 - 生成 API Key(若需要),只在私密环境粘贴。
- 打开 ST 的 连接/API 设置,选对提供商/兼容模式(若有),填入 URL 与 Key。
- 保存,发一条测试消息;报错就复制错误原文去搜,比盲改快。
密钥:不要写进角色卡 JSON、不要截图发群。
本机推理多一步
- 先单独启动 Koboldcpp / Oobabooga,确认浏览器或 curl 能访问其健康检查或简单接口。
- 再把同一地址填进 ST。
- 显卡/内存不够时,换更小模型或降低上下文,比硬怼设置有效。
相关阅读
在 Mac 上整理本地 PNG 角色卡,可用 Sillycard。功能以 App Store 与应用内为准。