输入文本,开始多模型翻译对比
首次使用请先在右上角 ⚙️ 设置 OpenRouter API Key
输入文本,开始多模型翻译对比
首次使用请先在右上角 ⚙️ 设置 OpenRouter API Key
每个 provider 独立填 API Key(永不上云)。点击进入独立子页面管理。
主页底部三个下拉框(语气/场景/译文对象)的可选项。
长期使用下各模型的平均得分、胜率、耗时、费用对比。
导出文件包含 API Key、模型、历史、Token 统计。可通过 AirDrop / 网盘 / U盘传到其他设备导入。
在 github.com/settings/tokens/new 创建 Classic Token,**只勾选 gist 一项权限**即可。Token 仅本地保存,Gist 自动设为 Secret(仅你可访问)。
长期使用下每个模型的平均表现。点击列标题切换排序。可按时段和目标语言筛选。
| 模型 | 翻译数 | 评分数 | 平均分 | 胜率 | 分数分布 | 平均耗时 | 平均 tokens | 平均费用 | 性价比 |
|---|
翻译数 / 评分数:分别衡量"耗时/费用"类指标和"分数"类指标的样本量。看到平均分高但评分数只有 3,需谨慎判断。
分数分布:4 段彩色柱按比例显示评分落入各档的次数(≥90 绿 / 80-89 浅绿 / 75-79 橙 / <75 红),鼠标悬停看详细计数。看出模型是"稳定优秀"还是"高低不稳"。
性价比指数:将"每美元能买到多少分"归一化到 0-100。最高的模型为 100;如果模型是免费的且有评分,显示 ∞。
每行一个选项,主页下拉框会自动列出。"自动"档位永远存在,无需手动加。改完点保存即可生效。
每条记忆是给翻译模型的背景说明,模型自己决定怎么落到译文里。和术语词典(X→Y 的硬替换)不同,翻译记忆适合需要解释才能正确翻的歧义词。
例:标题"Plan B",内容"在广告语境下指泰国最大的户外广告供应商 Plan B Media,不是'备用方案'";标题"Haidong",内容"指我的客户公司'海东',不是人名"。
按 provider 分组。每条用其原生 model ID 命名(OpenRouter 用 厂商/模型 格式,DeepSeek/AI Studio 等直连用扁平 ID 如 deepseek-chat)。
没填 API Key 的 provider 模型会显示 ⚠ 提示且无法调用。
参与评分的模型(最多存储 5 个,同时最多启用 3 个;多个启用时每张卡片显示多个分数,可消除单模型偏好)。
译文卡片右下角显示总分(0-100),点击查看扣分详情。评分记忆是给评分模型的背景立场。
所有翻译 + 评分完成后,把分数最高的 N 个译文 + 各自扣分理由喂给一个模型,让它合成"取长补短"的最终版本。
默认使用第一个启用的评分模型(已读懂所有译文,最适合整合)。可改成更强的模型(如 Claude Sonnet 4.6 / GPT-5)以获得更高质量的合成。
每个 provider 独立填 API Key。所有 Key 仅保存在本浏览器 localStorage,永不上传到云端 / Gist。
每条记忆都会被注入到评分模型 prompt 顶部,作为它评判译文好坏的背景立场。可分条管理(如"行业背景"、"客户特点"、"风格偏好"、"常错术语"),也可临时关闭某条不参与本次评分。
添加中文专有名词及对应英文译法。AI 翻译时优先采用,评分时若译错也会按错译扣分(≥10 分,强制总分 ≤89)。例如:蓝标 → BlueFocus、省广 → Guangdong Advertising Group。