Перейти к основному содержимому

Документация gpt2giga

gpt2giga — это шлюз совместимости на FastAPI, который принимает запросы в форматах OpenAI, Anthropic и Gemini и перенаправляет их в GigaChat. Он нужен, когда клиент, редактор, агентный фреймворк или SDK умеет работать с API OpenAI/Anthropic/Gemini, а в роли реального бэкенда должен выступать GigaChat.

Локальный адрес по умолчанию:

http://localhost:8090

Что закрывает прокси

ВозможностьГде читать
Быстрый запуск через Docker Compose или uvБыстрый старт
Поддерживаемые маршруты OpenAI, Anthropic, Gemini и LiteLLMСовместимость API
Поведение extra_headers, extra_query, extra_body и необязательных полейПараметры клиентов
Встроенные инструменты GigaChat и их сопоставление с OpenAI/Anthropic/GeminiВстроенные инструменты
Переменные окружения, аутентификация, лимиты, метрики, наблюдаемостьКонфигурация
Профили Compose, Traefik, nginx, Postgres, OpenSearch, PhoenixРазвёртывание
Журналы выполнения, журналы трафика, admin API, отладочная трансляцияОперации
Настройка редакторов, агентов, SDK и обратного проксиИнтеграции

Текущий набор API

Публичные маршруты доступны в корне и под версионированными префиксами:

  • /chat/completions, /v1/chat/completions, /v2/chat/completions
  • /responses, /v1/responses, /v2/responses
  • /embeddings, /v1/embeddings, /v2/embeddings
  • /messages, /v1/messages, /v2/messages
  • /v1beta/models/{model}:generateContent и совместимые пути Gemini
  • /models, /model/info, /health, /ping

Правило выбора бэкенда одинаково для маршрутов, совместимых с OpenAI, Anthropic и Gemini: /v1/... всегда отправляет чат-подобные запросы в контракт GigaChat v1, /v2/... — в контракт GigaChat v2, а корневой путь без /v1 или /v2 использует GPT2GIGA_GIGACHAT_API_MODE=v1|v2.

OpenAI Files/Batches, Anthropic Message Batches и Gemini Files/Batches подготовлены в коде, но намеренно не подключены до появления сквозного (end-to-end) выполнения в SDK или бэкенде вышестоящего сервиса.

Быстрый путь

  1. Скопируйте .env.example в .env.
  2. Заполните GIGACHAT_CREDENTIALS, GIGACHAT_SCOPE, GIGACHAT_MODEL.
  3. Запустите docker compose --env-file .env -f deploy/base.yaml --profile DEV up -d.
  4. Проверьте curl http://localhost:8090/health.
  5. Подключите SDK к http://localhost:8090/v1 или http://localhost:8090/v2 для явного контракта бэкенда, либо к http://localhost:8090, если корень должен следовать GPT2GIGA_GIGACHAT_API_MODE.

Для разработчиков