Claude Code 免费使用魔搭社区的任意模型

Claude Code 免费使用魔搭社区的任意模型，每天 2000 次免费调用额度，让本地 AI 编码助手真正做到“又强又便宜”。

好

写在前面：Claude Code + 魔搭，有啥用？

对于已经习惯用 Claude Code 辅助写代码的同学来说，最纠结的问题往往不是“好不好用”，而是“用得起吗”。魔搭（ModelScope）现在正式支持 Anthropic 协议，并且提供每天共计 2000 次的免费 API-Inference 调用，其中 Qwen3-Coder 模型单独有 500 次免费额度，相当于给 Claude Code 用户送了一张长期饭票。

更关键的是：通过简单配置，Claude Code 不仅可以无缝切换到魔搭作为后端，还能直接调用魔搭社区中的任意兼容模型，比如 Qwen3-Coder、GLM-4.5 等，真正实现“本地一个助手，后台一片算力农场”。

一步搞定：拿到魔搭 Access Token

想让 Claude Code 免费连上魔搭，第一步就是拿到魔搭的 Access Token。

注册 / 登录：访问 modelscope.cn，完成账号注册或登录。
必须绑定阿里云账号：魔搭免费推理 API 的算力由阿里云提供，账号未绑定阿里云是无法正常使用免费推理服务的。
获取 Access Token：进入「个人中心」的「我的 Access Token」页面生成或查看 Token。注意它通常以 ms- 开头。

需要特别强调的一点：在所有后续配置中，都要去掉 ms- 前缀，只保留后面的实际密钥内容，否则调用会失败。

核心原理：魔搭的 Anthropic 兼容接口

魔搭的 API-Inference 已经提供了与 Anthropic API 兼容的调用方式，可以直接被 Anthropic SDK 识别，这也是能被 Claude Code 利用的关键。

基础配置要点：
- base_url 固定为：https://api-inference.modelscope.cn（无需追加/v1）。
- api_key 使用你在魔搭生成并去掉 ms- 前缀后的 Access Token。
- model 填写魔搭模型库中的 Model ID，例如 “Qwen/Qwen2.5-7B-Instruct”、“Qwen/Qwen3-Coder-480B-A35B-Instruct” 等。模型库 ID 在这里
这个就是模型 ID
Anthropic 风格调用：
- 使用官方 anthropic SDK，即可直接进行流式或非流式调用；
- 接口遵循 Anthropic 的 messages 结构和必须显式指定 max_tokens 的约束，方便控制生成长度和成本。

对有自研服务 / 内部工具的团队来说，可以先在代码中调通这个兼容接口，再把同样的配置应用到 Claude Code 上，实现统一后端。

实操：把 Claude Code 后端切到魔搭

真正对开发者有用的，是如何把这些配置落地成 Claude Code 的免费“后端”。操作思路很简单：按 Anthropic 的方式设置环境变量或配置文件，指向魔搭即可。

典型做法是修改 Claude Code 的 settings.json（或环境变量）：

找到配置文件：
- Windows：C:\Users\你的用户名.claude\settings.json
- Linux / macOS：~/.claude/settings.json（可用 vim、nano 或 VS Code 编辑）。
在 settings.json 中写入核心配置（示意）：
- ANTHROPIC_API_KEY：你的魔搭 Access Token（去掉 ms-）。
- ANTHROPIC_BASE_URL：https://api-inference.modelscope.cn
- ANTHROPIC_MODEL：如 “Qwen/Qwen3-Coder-480B-A35B-Instruct”。
- ANTHROPIC_SMALL_FAST_MODEL：可与主模型保持一致，或换成更轻量的模型做快捷响应用。

修改后重启 Claude Code，直接在编辑器里进行代码生成、补全、重构等操作，如果一切正常且调用记录能在魔搭后台看到，就说明已经在用魔搭的免费额度驱动 Claude Code 了。

为什么值得折腾一次？

把 Claude Code 接到魔搭，看似只是“换个后端”，但实际上带来的收益不少。

维度	带来的好处
成本	每个账号每天 2000 次免费调用，其中 Qwen3-Coder 单独 500 次，足够覆盖日常开发和实验场景，大幅压缩 API 成本。
效率	利用 Claude Code 的交互体验 + 魔搭高性能模型算力，代码生成、补全、重构速度和质量都有明显提升。
模型多样性	可在魔搭平台自由切换和试用不同模型（如 Qwen3-Coder、GLM-4.5、DeepseekV3.2 等），根据语言、场景和成本自由“择优录用”。
风险控制	免费额度适合开发、测试、学习和原型验证，官方也建议不要直接把免费接口当作高并发、强 SLA 的生产服务使用。