免费的AI大模型api接口

西园公子原创...大约 10 分钟AI搜索AIGCAI搜索引擎

前言

国产大模型真的卷疯了，一个个都开始提供免费API。有幸见证大模型的发展，且看谁能一统市场，拭目以待~

国产

1. 讯飞星火open in new window

讯飞星火：拥有跨领域的知识和语言理解能力，完成问答对话和文学创作等任务。持续从海量文本数据和大规模语法知识中学习进化，实现从提出问题、规划问题到解决问题的全流程闭环

免费模型

general

generalv3

「2024.06.27」赠送Spark Max 模型 1亿Tokens，领取链接open in new window

2. 混元

腾讯混元大模型（Tencent Hunyuan）是由腾讯研发的大语言模型，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。

免费模型

hunyuan-lite

3. 百度open in new window

ERNIE Lite是百度自研的轻量级大语言模型，兼顾优异的模型效果与推理性能，适合低算力AI加速卡推理使用。ERNIE-Lite-8K-0922（原ERNIE-Bot-turbo-0922）是模型的一个模版，本文介绍了相关API及应用。

免费模型

Lite-8K

Lite-8K-0922

Lite-8K-0308

Lite-128K

Tiny-8K

4. 硅基流动open in new window服务商

siliconflow：加速 AGI普惠人类，让生成式人工智能惠及开发者和终端用户。

永久免费模型

Qwen/Qwen2-7B-Instruct (32K)

Qwen/Qwen2-1.5B-Instruct (32K)

Qwen/Qwen1.5-7B-Chat (32K)

THUDM/glm-4-9b-chat (32K)

THUDM/chatglm3-6b (32K)

01-ai/Yi-1.5-9B-Chat-16K (16K)

01-ai/Yi-1.5-6B-Chat (4K)

5. 无问芯穹open in new window服务商

无问芯穹：创新、智能的AI产品，利用顶尖的技术为用户打造面向最前沿AI的平台产品。

免费模型

平台所有模型都免费，仅仅有访问速率限制。

国外模型： DBRX、LLaMA3、Gemma 等。
国内模型：千问2、智谱3、零一万物等。

6. 火山open in new window

领取地址open in new window
api文档open in new window
在线调试open in new window
速率open in new window：3RPS，100RPM
每个模型都有免费 5 亿tokens，可以说，爽歪歪

免费模型

Doubao-pro-4K
Doubao-pro-32k
Doubao-pro-128k
Doubao-lite-4k
Doubao-lite-32k
Doubao-lite-128k
Doubao-embedding
Moonshot-v1-128k
Moonshot-v1-32k
Moonshot-v1-8k

国外

1. Cloudflare

支持的最新模型open in new window（有很多）
开发文档open in new window
速率：每天1万次请求
不限tokens

1）文本类的：

个人推荐：qwen1.5-14b-chat-awqopen in new window，阿里开源的，效果很好。

免费模型详情

模型	描述
llama-2-7b-chat-fp16open in new window	来自 Meta 的具有 70 亿个参数的全精度（fp16）生成文本模型
mistral-7b-instruct-v0.1open in new window	指导具有 70 亿个参数的 Mistral-7b 生成文本模型的微调版本
deepseek-coder-6.7b-base-awqopen in new window	Deepseek Coder 由一系列代码语言模型组成，每个模型都基于 2T 个 token 从头进行训练，其中 87% 为代码，13% 为英文和中文的自然语言。
deepseek-coder-6.7b-instruct-awqopen in new window	Deepseek Coder 由一系列代码语言模型组成，每个模型都基于 2T 个 token 从头进行训练，其中 87% 为代码，13% 为英文和中文的自然语言。
deepseek-math-7b-baseopen in new window	DeepSeekMath 使用 DeepSeek-Coder-v1.5 7B 初始化，并继续对来自 Common Crawl 的数学相关标记以及 500B 标记的自然语言和代码数据进行预训练。
deepseek-math-7b-instructopen in new window	DeepSeekMath-Instruct 7B 是一个基于数学指导的调优模型，源自 DeepSeekMath-Base 7B。DeepSeekMath 使用 DeepSeek-Coder-v1.5 7B 进行初始化，并继续对来自 Common Crawl 的数学相关标记以及 500B 个标记的自然语言和代码数据进行预训练。
discolm-german-7b-v1-awqopen in new window	DiscoLM German 7b 是基于 Mistral 的大型语言模型，专注于德语应用。AWQ 是一种高效、准确且速度极快的低位权重量化方法，目前支持 4 位量化。
falcon-7b-instructopen in new window	Falcon-7B-Instruct 是一个 7B 参数因果解码器专用模型，由 TII 基于 Falcon-7B 构建，并根据聊天/指令数据集的混合进行了微调。
gemma-2b-it-loraopen in new window	这是 Cloudflare 专用于使用 LoRA 适配器进行推理的 Gemma-2B 基础模型。Gemma 是 Google 推出的轻量级、先进开放模型系列，采用与创建 Gemini 模型相同的研究和技术构建而成。
gemma-7b-itopen in new window	Gemma 是 Google 推出的轻量级、先进开放模型系列，采用与 Gemini 模型相同的研究和技术构建而成。它们是文本到文本、仅用于解码器的大型语言模型，提供英语版本，具有开放权重、预训练变体和指令调整变体。
gemma-7b-it-loraopen in new window	这是 Cloudflare 专用于使用 LoRA 适配器进行推理的 Gemma-7B 基础模型。Gemma 是 Google 推出的轻量级、先进开放模型系列，采用与创建 Gemini 模型相同的研究和技术构建而成。
hermes-2-pro-mistral-7bopen in new window	Mistral 7B 上的 Hermes 2 Pro 是新的旗舰 7B Hermes！Hermes 2 Pro 是 Nous Hermes 2 的升级版和再训练版，包含 OpenHermes 2.5 数据集的更新版和清理版，以及内部开发的新引入的函数调用和 JSON 模式数据集。
llama-2-13b-chat-awqopen in new window	Llama 2 13B Chat AWQ 是一种高效、准确、速度极快的低位权重量化 Llama 2 变体。
llama-2-7b-chat-hf-loraopen in new window	这是 Cloudflare 专用于使用 LoRA 适配器进行推理的 Llama2 基础模型。Llama 2 是一组经过预训练和微调的生成文本模型，其规模从 70 亿到 700 亿个参数不等。这是 7B 微调模型的存储库，针对对话用例进行了优化，并转换为 Hugging Face Transformers 格式。
llama-3-8b-instructopen in new window	一代又一代，Meta Llama 3 在广泛的行业基准上展示了最先进的性能，并提供了新的功能，包括改进的推理能力。
llama-3-8b-instruct-awqopen in new window	来自 Meta 的具有 80 亿个参数的量化（int4）生成文本模型。
llamaguard-7b-awqopen in new window	Llama Guard 是一种使用安全风险分类法对 LLM 提示和响应的安全性进行分类的模型。

mistral-7b-instruct-v0.1-awqopen in new window	Mistral 7B Instruct v0.1 AWQ 是一种高效、准确且速度极快的低位权重量化 Mistral 变体。
mistral-7b-instruct-v0.2open in new window	Mistral-7B-Instruct-v0.2 大型语言模型 (LLM) 是 Mistral-7B-v0.2 的指令微调版本。与 Mistral-7B-v0.1 相比，Mistral-7B-v0.2 有以下变化：32k 上下文窗口（v0.1 中为 8k 上下文）、rope-theta = 1e6，并且没有滑动窗口注意。
mistral-7b-instruct-v0.2-loraopen in new window	Mistral-7B-Instruct-v0.2 大型语言模型 (LLM) 是 Mistral-7B-v0.2 的指令微调版本。
neural-chat-7b-v3-1-awqopen in new window	该模型是来自开源数据集 Open-Orca/SlimOrca 上的 mistralai/Mistral-7B-v0.1 在 Intel Gaudi 2 处理器上微调的 7B 参数 LLM。
openchat-3.5-0106open in new window	OpenChat 是一个创新的开源语言模型库，通过 C-RLFT 进行微调 - 一种受离线强化学习启发的策略。
openhermes-2.5-mistral-7b-awqopen in new window	OpenHermes 2.5 Mistral 7B 是一种先进的 Mistral Fine-tune，它是 OpenHermes 2 模型的延续，在额外的代码数据集上进行训练。
phi-2open in new window	Phi-2 是一个基于 Transformer 的模型，具有下一个词预测目标，该模型在用于 NLP 和编码的合成数据集和 Web 数据集的混合数据集上多次训练了 1.4T 个标记。
qwen1.5-0.5b-chatopen in new window	Qwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本。
qwen1.5-1.8b-chatopen in new window	Qwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本。
qwen1.5-14b-chat-awqopen in new window	Qwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本，AWQ是一种高效、准确、极速的低位权重量化方法，目前支持4位量化。
qwen1.5-7b-chat-awqopen in new window	Qwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本，AWQ是一种高效、准确、极速的低位权重量化方法，目前支持4位量化。
sqlcoder-7b-2open in new window	该模型旨在供非技术用户使用，以了解其 SQL 数据库中的数据。
starling-lm-7b-betaopen in new window	我们引入了 Starling-LM-7B-beta，这是一个由人工智能反馈强化学习 (RLAIF) 训练的开放式大型语言模型 (LLM)。Starling-LM-7B-beta 是从 Openchat-3.5-0106 训练而来，使用了我们的新奖励模型 Nexusflow/Starling-RM-34B 和策略优化方法根据人类偏好微调语言模型 (PPO)。
tinyllama-1.1b-chat-v1.0open in new window	TinyLlama 项目旨在基于 3 万亿个 token 预训练 1.1B Llama 模型。这是在 TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T 基础上微调的聊天模型。
una-塞伯坦-7b-v2-bf16open in new window	Cybertron 7B v2 是基于 7B MistralAI 的模型，是该系列中最好的。它使用 SFT、DPO 和 UNA（统一神经对齐）在多个数据集上进行训练。
[zephyr-7b-beta-awqopen in new window](https://developers.cloudflare.com/workers-ai/models/zephyr-7b-beta-awq/)	Zephyr 7B Beta AWQ 是一种高效、准确且速度极快的低位权重量化 Zephyr 模型变体。

最后

多用用多对比，选择适合自己的~

参考文章：
国产大模型API免费榜 open in new window
OpenAI突然断供开发者，国产大模型无痛搬家服务立即上线open in new window