Qwen 3.7 Max через API в VS Code

Соберите рабочий конфиг для Continue, памятку для Cline или `.http` smoke-test без отправки ключа с этой страницы. Все значения остаются в браузере.

Конструктор конфигурации

Выберите расширение, endpoint, модель и роли в VS Code.

Подходит для обычного API-ключа Qwen Cloud.
Флагман для сложного reasoning и coding.
В Continue и Cline URL должен указывать на корень OpenAI-compatible API, обычно с `/v1` в конце.
Ключ нужен только для генерации файла. Сайт не делает API-запросы.
Используется как `${{ secrets.NAME }}` в `config.yaml`.
0.20
Для agent/edit обычно спокойнее 0.1-0.3, для brainstorming можно выше.
Роли Continue
Параметры Qwen
Для `qwen3.7-max` максимум thinking budget по документации - 256k, но в IDE чаще хватает 4k-16k.
config.yaml

Предпросмотр файла

Порядок подключения

Рабочий путь без лишних догадок

Qwen Cloud совместим с OpenAI API, поэтому в VS Code обычно достаточно OpenAI-compatible provider, правильного endpoint, model ID и ключа от того же плана.

Получите API key

Ключ pay-as-you-go, Token Plan и Coding Plan не взаимозаменяемы. Если ключ не от того плана, часто будет 401.

Выберите расширение

Для файла конфигурации удобнее Continue. Для agent workflow можно Cline, там профиль обычно вводится через UI.

Вставьте config

Continue читает локальный `config.yaml` из `%USERPROFILE%\.continue\config.yaml` на Windows.

Проверьте запрос

Если сомневаетесь в ключе или URL, скачайте REST test и запустите его через расширение REST Client в VS Code.

Главный нюанс: `qwen3.7-max` поддерживает thinking mode, function calling и 1M context. Для Cline с Qwen3/thinking официальная рекомендация - включить `Enable R1 messages format` в Model Configuration.

Нюансы

Что важно учесть именно для Qwen 3.7 Max

Эти настройки экономят часы на типовых ошибках: неверный URL, смешанные ключи, reasoning в edit-ответах и слишком дорогой context.

Endpoint

Pay-as-you-go использует `https://dashscope-intl.aliyuncs.com/compatible-mode/v1`. Token Plan и Coding Plan имеют отдельные URL.

Thinking

`enable_thinking`, `thinking_budget` и `preserve_thinking` не являются стандартными OpenAI-полями, но поддерживаются Qwen через extra body.

Tools

В Continue добавьте `capabilities: [tool_use]`, чтобы Agent mode мог использовать tool calls. В Cline tools управляются самим расширением.

Edit/apply

Если reasoning просачивается в изменения кода, отключите thinking для edit/apply или сделайте отдельный профиль с меньшим budget.

Секреты

Для Continue можно использовать `${{ secrets.DASHSCOPE_API_KEY }}` и хранить значение в Continue Secrets или `.env`, не в `config.yaml`.

Стоимость

1M context не значит, что его нужно отправлять каждый раз. Ограничивайте context providers и включайте большой контекст только на задачах, где он нужен.

Диагностика

Если не подключилось с первого раза

Самые частые ошибки обычно видны по статус-коду или по тому, в каком расширении появляется сбой.

Continue config.yaml

  1. Откройте Continue sidebar, затем Local Config settings, либо файл %USERPROFILE%\.continue\config.yaml.
  2. Вставьте сгенерированный блок. Для OpenAI-compatible endpoint используйте provider: openai, apiBase, apiKey и точный model.
  3. Сохраните файл. Continue должен обновить конфиг автоматически; если модель не появилась, перезапустите VS Code.
  4. Для agent mode проверьте роль chat и capability tool_use. Для Apply нужны роли edit и apply.

Cline через OpenAI Compatible

  1. Откройте Cline в боковой панели VS Code, выберите Bring my own API key.
  2. API Provider: OpenAI Compatible. Base URL, API key и Model ID должны относиться к одному и тому же Qwen-плану.
  3. Для Qwen3/thinking откройте Model Configuration и включите Enable R1 messages format.
  4. Если Cline возвращает 400 InvalidParameter, первым делом проверьте R1 format и thinking settings.

Коды и симптомы

  1. 401: ключ не подходит к выбранному endpoint, истек, скопирован с пробелом или создан в другом плане.
  2. 404: неверный path или model ID. Base URL должен оканчиваться на `/v1`, а запрос идти в `/chat/completions`.
  3. 400 InvalidParameter: часто связан с thinking/R1 format или неподдержанным extra body параметром.
  4. Timeout: включите streaming в клиенте, уменьшите context, max tokens или thinking budget.

Источники

Документация, на которой основан сайт

Ссылки ведут на официальные страницы Qwen Cloud и Continue. Проверьте их, если модельный список или тарифы поменяются.

Готово