Обзор
Wombat AI — единый агрегатор популярных AI-моделей с биллингом в рублях через СБП/банковские карты РФ. Один аккаунт, один ключ, одна оплата вместо десятка подписок на OpenAI/Anthropic/Google/etc.
API полностью совместим с OpenAI Chat Completions — то есть код, написанный для OpenAI SDK, работает у нас сменой base_url и api_key.
sk-kvs-… в кабинете, ставите base_url = https://api.wombatai.app/v1, выбираете модель в формате provider/model — всё.
Быстрый старт
- Зарегистрируйтесь на wombatai.app/register — получите 50 ₽ кредитов на тесты.
- Пополните баланс любой суммой на /topup (или сразу пользуйтесь стартовыми кредитами).
- Подключите Pro (1 990 ₽/мес) на /pricing — без подписки доступен только веб-чат, для API-ключей нужен Pro/Business.
- Создайте ключ в кабинете → API-ключи — нажмите СОЗДАТЬ, скопируйте
sk-kvs-…. Полный ключ покажется один раз, после — только preview. - Пробный запрос через curl — подставьте свой ключ:
curl https://api.wombatai.app/v1/chat/completions \
-H "Authorization: Bearer sk-kvs-…" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-4o-mini",
"messages": [{"role": "user", "content": "Привет!"}]
}'
Авторизация
Каждый запрос идёт с заголовком Authorization: Bearer sk-kvs-…. Ключ привязан к вашему аккаунту, скидке тарифа и балансу кредитов. Один аккаунт может иметь до 20 активных ключей одновременно — для прода/стейджа/CI разные.
Формат ключа
- Префикс:
sk-kvs- - Тело: 48 hex-символов (192 бит энтропии)
- Пример:
sk-kvs-f43d0c213c96172d1fdfba9c2b4eb0b49ef7617d615e5cc9
Базовый URL
Все эндпоинты — относительно базы. Только HTTPS (TLS 1.2/1.3), HTTP не поддерживаем.
GET /v1/models
Список моделей, которые Wombat AI умеет проксировать. Используйте id из ответа в поле model при запросе.
Пример запроса
curl https://api.wombatai.app/v1/models \ -H "Authorization: Bearer sk-kvs-…"
Пример ответа
{
"object": "list",
"data": [
{"id": "openai/gpt-5", "object": "model", "owned_by": "openai"},
{"id": "openai/gpt-4o", "object": "model", "owned_by": "openai"},
{"id": "openai/gpt-4o-mini", "object": "model", "owned_by": "openai"},
{"id": "openai/o3", "object": "model", "owned_by": "openai"}
]
}
Список расширяется по мере подключения новых провайдеров. Актуальная сетка цен и моделей — на странице тарифов.
POST /v1/chat/completions
Главный эндпоинт: текстовая и мультимодальная генерация. Полностью повторяет OpenAI Chat Completions API.
Параметры тела
| Параметр | Тип | Описание |
|---|---|---|
model | string | Идентификатор в формате provider/model, напр. openai/gpt-4o-mini. Если не из списка /v1/models — 400. |
messages | array | Лента сообщений. Каждое — {role, content}. role: system / user / assistant. |
max_tokens | integer | Лимит токенов ответа. Жёсткий верхний предел — 16 384. |
temperature | number | 0.0 — детерминированный, 1.0 — баланс, 2.0 — креатив. По умолчанию 1.0. |
top_p | number | Nucleus sampling 0..1. |
stream | boolean | SSE-стрим ответа. soon для веб-чата, в API уже работает. |
response_format | object | JSON-mode: {"type": "json_object"} (на совместимых моделях). |
tools | array | Function calling — передаётся в апстрим как есть. |
Заголовки
Authorization: Bearer sk-kvs-…— обязательно.X-Request-Id— необязательный идемпотентный ключ. Повторный запрос с тем же ID не дублирует биллинг и возвращает кешированный ответ (10 мин).
Пример
curl https://api.wombatai.app/v1/chat/completions \
-H "Authorization: Bearer sk-kvs-…" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-4o-mini",
"messages": [
{"role": "system", "content": "Отвечай по-русски."},
{"role": "user", "content": "Что такое СБП в двух словах?"}
],
"max_tokens": 100
}'
Структура ответа
{
"id": "chatcmpl-…",
"object": "chat.completion",
"created": 1782111712,
"model": "gpt-4o-mini-2024-07-18",
"choices": [{
"index": 0,
"message": {"role": "assistant", "content": "СБП — Система быстрых платежей…"},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 42,
"total_tokens": 66
}
}
Vision: картинки в запросах
Vision-модели принимают изображения через массив content в OpenAI-формате. Поддерживается data:-base64 и https://-URL.
Vision-модели: GPT-5, GPT-5 mini, GPT-4o, GPT-4o mini, o3, o3 mini, Claude Opus 4, Claude Sonnet 4, Claude Haiku 4.5, Gemini 2.5 Pro, Gemini 2.5 Flash, Grok 4.
Лимиты
- Размер: до 2 МБ оригинала на картинку (≈2.7 МБ base64).
- Количество: до 10 картинок на запрос.
- Форматы: JPEG, PNG, WebP, GIF.
Пример с картинкой
curl https://api.wombatai.app/v1/chat/completions \
-H "Authorization: Bearer sk-kvs-…" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-4o-mini",
"messages": [{
"role": "user",
"content": [
{"type": "text", "text": "Что на картинке?"},
{"type": "image_url", "image_url": {"url": "https://example.com/photo.jpg"}}
]
}],
"max_tokens": 100
}'
В JSON ответа — обычное choices[0].message.content с текстом описания.
Коды ошибок
| HTTP | type | Что значит |
|---|---|---|
| 400 | invalid_request_error | Невалидный body или модель не из списка /v1/models. |
| 401 | authentication_error | Нет/неверный/отозванный API-ключ. |
| 402 | insufficient_quota | Баланс кредитов не покрывает запрос. Пополните на /topup. |
| 422 | invalid_request_error | Картинка слишком большая, лимит 10 файлов, vision-only-модели, и т.п. |
| 429 | rate_limit_exceeded | Превышен RPM. См. rate-limits. |
| 502 | server_error | Апстрим-провайдер вернул ошибку. Повторите через 5 сек. |
| 503 | server_error | Сервис временно недоступен (БД, конфигурация). Обычно проходит само за минуту. |
Тело ошибки всегда:
{
"error": {
"message": "Insufficient credits. Top up via СБП.",
"type": "insufficient_quota"
}
}
Rate-limits
| Тариф | RPM | RPD |
|---|---|---|
| Free | 60 | — |
| Lite | 60 | — |
| Pro | 600 | — |
| Business | 600 | по запросу выше |
Каждый ответ содержит заголовки:
x-ratelimit-limit— текущий лимит RPMx-ratelimit-remaining— сколько запросов осталось в окнеx-ratelimit-reset— секунд до сброса окна
При 429 — пауза до x-ratelimit-reset сек и повтор. Реализуйте экспоненциальный backoff.
Стоимость
Стоимость каждого запроса = себестоимость у провайдера × наша наценка 20% × скидка вашего тарифа. Подробная сетка цен по моделям — на /pricing.
Курс провайдеров пересчитывается ежедневно по ЦБ РФ. Скидки:
- Free / Lite: 0% / 10%
- Pro: −20%
- Business: −30%
В каждом ответе usage.prompt_tokens/completion_tokens позволяют посчитать стоимость локально. Реальное списание — атомарное, сразу после ответа.
SDK и инструменты
Поскольку API совместим с OpenAI, работают любые библиотеки и инструменты, поддерживающие OpenAI: openai (Python/Node.js/Go), LangChain, LlamaIndex, Vercel AI SDK, Cursor, Continue.dev, Cline, ChatBox, BoltAI, Raycast AI, Open WebUI и десятки других.
Для большинства из них достаточно прописать:
- Custom endpoint / Base URL:
https://api.wombatai.app/v1 - API key:
sk-kvs-… - Model:
openai/gpt-4o(или любая из/v1/models)
Скачать готовые коллекции
Cursor / Continue.dev
{
"models": [{
"title": "GPT-4o via Wombat AI",
"provider": "openai",
"model": "openai/gpt-4o",
"apiBase": "https://api.wombatai.app/v1",
"apiKey": "sk-kvs-…"
}]
}
LangChain (Python)
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="openai/gpt-4o",
base_url="https://api.wombatai.app/v1",
api_key="sk-kvs-…",
)
print(llm.invoke("Hello!").content)
Помощь
Нашли баг или не работает интеграция — напишите на support@wombatai.app или через /support. Включите id запроса (заголовок x-request-id в ответе) и фрагмент кода — отвечаем в рабочие часы за 1–4 часа.