开源版免费自部署;企业版面向世界500强与政企客户,按部署实例授权。
研发团队、技术爱好者、中小型团队
开源自部署,研发团队和中小企业首选
世界500强、金融、医疗、政务等
世界500强、政企客户、私有化部署
开源版覆盖标准能力,企业版包含全部高阶能力与服务
| 功能特性 | 开源版 | 企业版 |
|---|---|---|
| 🛡️ 安全能力大模型 | ||
| 标准能力(提示词攻击防护 + 内容安全 + 数据防泄漏) | ||
| 基于通用数据精调 | ||
| 基于客户私有数据精调 | ||
| 符合客户所属行业特定要求的安全能力 | ||
| ⚡ Agent 网关 · 协议与多模型接入 | ||
| OpenAI Chat Completions / Embeddings 接口兼容 | ||
| 100+ 上游模型即插即用 | ||
| 国产模型:通义千问、DeepSeek、Kimi、文心一言、豆包、混元 | ||
| 海外模型:OpenAI、Anthropic、Gemini、Bedrock、Azure | ||
| 流式响应(SSE)、工具调用(Function Calling)、JSON Mode | ||
| 多模态:Vision、图像生成、语音(TTS / Whisper) | ||
| Embeddings 与重排(Rerank)模型代理 | ||
| 自定义模型接入(vLLM / TGI / 本地推理) | ||
| 推理模型(o1 / Thinking)原生协议适配 | ||
| 🔀 Agent 网关 · 路由与编排 | ||
| 多模型负载均衡 | ||
| 故障自动切换 / Fallback | ||
| 请求级重试与熔断策略 | ||
| 基于成本 / 延迟 / 能力的智能路由 | ||
| 灰度发布与影子流量对比 | ||
| A/B 测试与流量切分 | ||
| 多区域多活路由 | ||
| 模型集成(Ensemble)与回退链 | ||
| 📊 Agent 网关 · 配额、限流、计费 | ||
| 全局 RPM / TPM 限流 | ||
| 按 API Key / 用户 / 应用 / 租户维度配额 | ||
| Token 级精细限流与突发流量控制 | ||
| 跨上游模型成本归一与统一计费口径 | ||
| 多租户资源与计费隔离 | ||
| 预算告警与自动熔断 | ||
| 消费明细审计与导出 | ||
| 计费报表与成本分析看板 | ||
| 💾 Agent 网关 · 缓存与性能 | ||
| 精确匹配缓存 | ||
| 语义缓存(基于向量相似度) | ||
| 自定义缓存 TTL 与失效策略 | ||
| 缓存命中率统计与优化建议 | ||
| 毫秒级低延迟透传 | ||
| 🔍 Agent 网关 · 可观测性与审计 | ||
| 完整调用链路日志(Prompt / Response / 工具调用) | ||
| Token 用量与延迟统计 | ||
| 错误率与异常告警 | ||
| OpenTelemetry / Prometheus 集成 | ||
| 分布式追踪(Trace ID 贯穿网关 + 上游 + 下游) | ||
| 多维度查询与可视化看板 | ||
| Prompt / Response 全量留痕,可回溯 | ||
| 一键审计报告生成 | ||
| 🔑 Agent 网关 · 访问控制与多租户 | ||
| API Key 创建、轮换与吊销 | ||
| IP 白名单 / 黑名单 | ||
| RBAC 角色与权限管理 | ||
| 多租户数据与配额隔离 | ||
| SSO / OIDC 单点登录 | ||
| 操作审计与回溯 | ||
| 🛠️ Agent 网关 · 工具与 MCP 治理 | ||
| MCP Server 接入与代理 | ||
| 工具调用白名单 / 黑名单 | ||
| 工具调用拦截与策略控制 | ||
| 工具调用全链路审计与回溯 | ||
| Agent 真正执行动作前的策略判断 | ||
| 📝 Agent 网关 · Prompt 与策略管理 | ||
| 网关层下发护栏策略 | ||
| 输入 / 输出双向检测 | ||
| Prompt 模板库与版本管理 | ||
| Prompt A/B 测试与效果对比 | ||
| 按租户 / 应用差异化策略 | ||
| 🛡️ Agent 护栏 · 提示词攻击防护(OWASP Top 10 for LLM 2025) | ||
| 提示词注入(直接/间接/递归/系统提示词泄漏) | ||
| 越狱攻击(角色扮演、上下文操纵、对抗性攻击等) | ||
| 资源消耗攻击(随机字符、重复令牌、过度推理) | ||
| 恶意操作(SQL 注入、MCP 工具投毒、命令注入、SSRF 等) | ||
| 🔒 Agent 护栏 · 内容安全(GB/T45654—2025) | ||
| A.1 包含违反社会主义核心价值观的内容 | ||
| A.2 包含歧视性内容 | ||
| A.3 商业违法违规 | ||
| A.4 侵犯他人合法权益 | ||
| A.5 无法满足特定服务类型的安全需求 | ||
| 🔐 Agent 护栏 · 数据防泄漏 | ||
| 个人敏感信息识别 | ||
| 企业敏感数据识别 | ||
| 脱敏还原能力 | ||
| 切换私有模型能力 | ||
| 🔍 Agent 护栏 · 输入风险识别管控 | ||
| 语义级分析、自定义关键词 | ||
| 超长会话上下文关联分析 | ||
| 基于用户角色识别越权提问 | ||
| 基于业务场景识别超范围提问 | ||
| 📤 Agent 护栏 · 输出风险识别管控 | ||
| 违法不良信息过滤 | ||
| 拒答 / 代答库管理 | ||
| 敏感内容脱敏输出 | ||
| 基于业务场景过滤超范围内容 | ||
| 🎯 Agent 护栏 · 支持的模态 | ||
| 文本识别 | ||
| 图像识别 | ||
| 音频识别 | ||
| 视频识别 | ||
| 文件识别 | ||
| 📋 Agent 护栏 · 合规审计 | ||
| 日志留存与审计 | ||
| 一键生成多监管部门审计报告 | ||
| 🇨🇳 Agent 护栏 · 信创支持 | ||
| Nvidia GPU | ||
| 华为昇腾 NPU | ||
| 软硬一体机交付(信创 / Nvidia) | ||
| 🤝 Agent 护栏 · 服务规格 | ||
| 开源社区支持 | ||
| 7x24 增强级原厂支持(1 小时响应) | ||
| 一年维保含模型与软件升级 | ||
7x24 工单及电话支持,1 小时内响应;故障申报后工程师远程接入或现场协助。
5 人天原厂级专业保障:远程或现场安装部署、紧急救助、故障排查。
提供安装文档、远程或现场安装服务。
提供离线视频、远程会议或现场培训。
提供安全能力大模型更新与软件小版本无缝升级。
在线访问最新软件特性、维护经验、使用技巧。