跳至主要內容

免费的AI大模型api接口

西园公子原创...大约 10 分钟AI搜索AIGCAI搜索引擎

前言

国产大模型真的卷疯了,一个个都开始提供免费API。有幸见证大模型的发展,且看谁能一统市场,拭目以待~

国产

1. 讯飞星火open in new window

讯飞星火:拥有跨领域的知识和语言理解能力,完成问答对话和文学创作等任务。持续从海量文本数据和大规模语法知识中学习进化,实现从提出问题、规划问题到解决问题的全流程闭环

免费模型

general

generalv3

「2024.06.27」赠送Spark Max 模型 1亿Tokens,领取链接open in new window

2. 混元

腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

免费模型

hunyuan-lite

3. 百度open in new window

ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE-Lite-8K-0922(原ERNIE-Bot-turbo-0922)是模型的一个模版,本文介绍了相关API及应用。

免费模型

Lite-8K

Lite-8K-0922

Lite-8K-0308

Lite-128K

Tiny-8K

4. 硅基流动open in new window服务商

siliconflow:加速 AGI普惠人类,让生成式人工智能惠及开发者和终端用户。

永久免费模型

Qwen/Qwen2-7B-Instruct (32K)

Qwen/Qwen2-1.5B-Instruct (32K)

Qwen/Qwen1.5-7B-Chat (32K)

THUDM/glm-4-9b-chat (32K)

THUDM/chatglm3-6b (32K)

01-ai/Yi-1.5-9B-Chat-16K (16K)

01-ai/Yi-1.5-6B-Chat (4K)

5. 无问芯穹open in new window服务商

无问芯穹:创新、智能的AI产品,利用顶尖的技术为用户打造面向最前沿AI的平台产品。

免费模型

平台所有模型都免费,仅仅有访问速率限制。

  • 国外模型: DBRX、LLaMA3、Gemma 等。
  • 国内模型: 千问2、智谱3、零一万物等。

6. 火山open in new window

免费模型

  • Doubao-pro-4K
  • Doubao-pro-32k
  • Doubao-pro-128k
  • Doubao-lite-4k
  • Doubao-lite-32k
  • Doubao-lite-128k
  • Doubao-embedding
  • Moonshot-v1-128k
  • Moonshot-v1-32k
  • Moonshot-v1-8k

国外

1. Cloudflare

1)文本类的:

个人推荐:qwen1.5-14b-chat-awqopen in new window,阿里开源的,效果很好。

免费模型详情
模型描述
llama-2-7b-chat-fp16open in new window来自 Meta 的具有 70 亿个参数的全精度(fp16)生成文本模型
mistral-7b-instruct-v0.1open in new window指导具有 70 亿个参数的 Mistral-7b 生成文本模型的微调版本
deepseek-coder-6.7b-base-awqopen in new windowDeepseek Coder 由一系列代码语言模型组成,每个模型都基于 2T 个 token 从头进行训练,其中 87% 为代码,13% 为英文和中文的自然语言。
deepseek-coder-6.7b-instruct-awqopen in new windowDeepseek Coder 由一系列代码语言模型组成,每个模型都基于 2T 个 token 从头进行训练,其中 87% 为代码,13% 为英文和中文的自然语言。
deepseek-math-7b-baseopen in new windowDeepSeekMath 使用 DeepSeek-Coder-v1.5 7B 初始化,并继续对来自 Common Crawl 的数学相关标记以及 500B 标记的自然语言和代码数据进行预训练。
deepseek-math-7b-instructopen in new windowDeepSeekMath-Instruct 7B 是一个基于数学指导的调优模型,源自 DeepSeekMath-Base 7B。DeepSeekMath 使用 DeepSeek-Coder-v1.5 7B 进行初始化,并继续对来自 Common Crawl 的数学相关标记以及 500B 个标记的自然语言和代码数据进行预训练。
discolm-german-7b-v1-awqopen in new windowDiscoLM German 7b 是基于 Mistral 的大型语言模型,专注于德语应用。AWQ 是一种高效、准确且速度极快的低位权重量化方法,目前支持 4 位量化。
falcon-7b-instructopen in new windowFalcon-7B-Instruct 是一个 7B 参数因果解码器专用模型,由 TII 基于 Falcon-7B 构建,并根据聊天/指令数据集的混合进行了微调。
gemma-2b-it-loraopen in new window这是 Cloudflare 专用于使用 LoRA 适配器进行推理的 Gemma-2B 基础模型。Gemma 是 Google 推出的轻量级、先进开放模型系列,采用与创建 Gemini 模型相同的研究和技术构建而成。
gemma-7b-itopen in new windowGemma 是 Google 推出的轻量级、先进开放模型系列,采用与 Gemini 模型相同的研究和技术构建而成。它们是文本到文本、仅用于解码器的大型语言模型,提供英语版本,具有开放权重、预训练变体和指令调整变体。
gemma-7b-it-loraopen in new window这是 Cloudflare 专用于使用 LoRA 适配器进行推理的 Gemma-7B 基础模型。Gemma 是 Google 推出的轻量级、先进开放模型系列,采用与创建 Gemini 模型相同的研究和技术构建而成。
hermes-2-pro-mistral-7bopen in new windowMistral 7B 上的 Hermes 2 Pro 是新的旗舰 7B Hermes!Hermes 2 Pro 是 Nous Hermes 2 的升级版和再训练版,包含 OpenHermes 2.5 数据集的更新版和清理版,以及内部开发的新引入的函数调用和 JSON 模式数据集。
llama-2-13b-chat-awqopen in new windowLlama 2 13B Chat AWQ 是一种高效、准确、速度极快的低位权重量化 Llama 2 变体。
llama-2-7b-chat-hf-loraopen in new window这是 Cloudflare 专用于使用 LoRA 适配器进行推理的 Llama2 基础模型。Llama 2 是一组经过预训练和微调的生成文本模型,其规模从 70 亿到 700 亿个参数不等。这是 7B 微调模型的存储库,针对对话用例进行了优化,并转换为 Hugging Face Transformers 格式。
llama-3-8b-instructopen in new window一代又一代,Meta Llama 3 在广泛的行业基准上展示了最先进的性能,并提供了新的功能,包括改进的推理能力。
llama-3-8b-instruct-awqopen in new window来自 Meta 的具有 80 亿个参数的量化(int4)生成文本模型。
llamaguard-7b-awqopen in new windowLlama Guard 是一种使用安全风险分类法对 LLM 提示和响应的安全性进行分类的模型。
mistral-7b-instruct-v0.1-awqopen in new windowMistral 7B Instruct v0.1 AWQ 是一种高效、准确且速度极快的低位权重量化 Mistral 变体。
mistral-7b-instruct-v0.2open in new windowMistral-7B-Instruct-v0.2 大型语言模型 (LLM) 是 Mistral-7B-v0.2 的指令微调版本。与 Mistral-7B-v0.1 相比,Mistral-7B-v0.2 有以下变化:32k 上下文窗口(v0.1 中为 8k 上下文)、rope-theta = 1e6,并且没有滑动窗口注意。
mistral-7b-instruct-v0.2-loraopen in new windowMistral-7B-Instruct-v0.2 大型语言模型 (LLM) 是 Mistral-7B-v0.2 的指令微调版本。
neural-chat-7b-v3-1-awqopen in new window该模型是来自开源数据集 Open-Orca/SlimOrca 上的 mistralai/Mistral-7B-v0.1 在 Intel Gaudi 2 处理器上微调的 7B 参数 LLM。
openchat-3.5-0106open in new windowOpenChat 是一个创新的开源语言模型库,通过 C-RLFT 进行微调 - 一种受离线强化学习启发的策略。
openhermes-2.5-mistral-7b-awqopen in new windowOpenHermes 2.5 Mistral 7B 是一种先进的 Mistral Fine-tune,它是 OpenHermes 2 模型的延续,在额外的代码数据集上进行训练。
phi-2open in new windowPhi-2 是一个基于 Transformer 的模型,具有下一个词预测目标,该模型在用于 NLP 和编码的合成数据集和 Web 数据集的混合数据集上多次训练了 1.4T 个标记。
qwen1.5-0.5b-chatopen in new windowQwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本。
qwen1.5-1.8b-chatopen in new windowQwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本。
qwen1.5-14b-chat-awqopen in new windowQwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本,AWQ是一种高效、准确、极速的低位权重量化方法,目前支持4位量化。
qwen1.5-7b-chat-awqopen in new windowQwen1.5是阿里云自研的大型语言模型系列Qwen的改进版本,AWQ是一种高效、准确、极速的低位权重量化方法,目前支持4位量化。
sqlcoder-7b-2open in new window该模型旨在供非技术用户使用,以了解其 SQL 数据库中的数据。
starling-lm-7b-betaopen in new window我们引入了 Starling-LM-7B-beta,这是一个由人工智能反馈强化学习 (RLAIF) 训练的开放式大型语言模型 (LLM)。Starling-LM-7B-beta 是从 Openchat-3.5-0106 训练而来,使用了我们的新奖励模型 Nexusflow/Starling-RM-34B 和策略优化方法根据人类偏好微调语言模型 (PPO)。
tinyllama-1.1b-chat-v1.0open in new windowTinyLlama 项目旨在基于 3 万亿个 token 预训练 1.1B Llama 模型。这是在 TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T 基础上微调的聊天模型。
una-塞伯坦-7b-v2-bf16open in new windowCybertron 7B v2 是基于 7B MistralAI 的模型,是该系列中最好的。它使用 SFT、DPO 和 UNA(统一神经对齐)在多个数据集上进行训练。
[zephyr-7b-beta-awqopen in new window](https://developers.cloudflare.com/workers-ai/models/zephyr-7b-beta-awq/)Zephyr 7B Beta AWQ 是一种高效、准确且速度极快的低位权重量化 Zephyr 模型变体。

最后

多用用多对比,选择适合自己的~

参考文章:

国产大模型API免费榜 open in new window

OpenAI突然断供开发者,国产大模型无痛搬家服务立即上线open in new window

上次编辑于:
贡献者: zwj