便宜的大模型 API 推荐？

听说阿里云的通义千问 API 收费了，看了下价格。
阿里云 ==> 0.12 元/1000tokens
我看了下，我最近 20 天就用了大概 1000 * 1000 tokens,还好在免费额度里，算了下账，都差点要 120 远了😭，还好目前是免费的🤣
果断弃用，xdm ，还有什么便宜的 API 调用不？目前我了解到的最低价格是
GPT4 ==> 0.024 元/1000 tokens

国内的:kimi/ deepseek/ chatglm/ 01-ai/讯飞星火或者你用一个 sass 服务比如 openrouter.ai/市面上的大模型基本都有(开源或者闭源）

我用的 gpt4 0.07 /1k token

有一些算力的，自己部署开源模型，白嫖

如果能搞定绑卡支付，还是用 OpenAI 官方的省心：- 不限制不能并发（具体还是要看帐号的等级，而转发站现在 GPT 4 不能并发）- 转发站莫名其妙会请求失败（用过两三个，有一两个会出现这样的状况）又想省钱又想省心的办法可以自建一个 one-api ，然后加一个官方渠道，加几个一折左右的转发站，用它的负载均衡功能来达到省钱和稳定的目的。如果完全不想花钱，可以试试 ollama ，像 gemma7B 这种主观感觉跟 GPT 3.5 Turbo 差不多。

有开源模型推荐吗

meta LLaMA2

听闻 kimi 火，我去研究，🙏

为什么选择最贵的？😂

哈，并没有呀，GPT4 国内的 sass 只要 0.024 元

感觉 kiwi 也蛮贵的，moonshot-v1-32k 的 1M 上下文差不多也要 24 元了。😂

我使用 OpenRouter 免费的 API

成本在这，再怎么便宜也不会差距很大

你说的 gpt-4 能支持并发吗？据我所知国内的这些第三方应该是没有很高的 gpt-4 使用的 tier 的而且很多 gpt-4 都是用 azure 套壳的并不是 openai 的我记得 coze 的 dalle 的图就是微软的
吓得我去看了下 api ，发现 3.5 用了俩月，终于用了 1 刀了

Gemini 有免费额度 ai.google.dev/pricing

gemini 目前免费但是 api 很难用还不稳定

qwen-turbo 0.008 元 1000tokens

turbo 感觉回答问题不太精准哈，还是不太敢用😂

justchat.top

这个不支持 gpt4 吧

楼主说的 gpt4 0.024 是哪个

gemini 免费，买个域名在 cloudflare 上转发下国内就能访问了

chatglm4 0.1 元/1k tokens, 国内的模型算中文 tokens 比国外的少, 要用的话建议就是英文 gpt4, 中文 chatglm4, 不追求回答质量的话那选择更是非常多了等 claude-3-haiku api 放出来, 感觉可以考虑用这个, 看官网评测性能虽然弱于 gpt4, 但差距没有特别大, 而且看起来价格可能会很便宜

这个 api.kksj.me/ ，之前他们在 V2EX 推荐过，感觉还不错我就购买了，不过只买了 10 块钱😂

github.com/xai-org/grok-1

简单问题本地 ollama （ mistral/qwen-13b 这俩效果可以），M 芯片跑起来挺快复杂问题 Kimi / ChatGPT 4

为什么挑便宜的？便宜的能好用？一百多还不够一小时工资吧。

直接本地搭建一个 Qwen 7b 的，基本够用了应该，一张 4090 就可以跑

需要 gpu ？还是 cpu 也可以？

aws claude 3?

＃26 qwen-13b 是哪个？是 14B 么？想问一下你跑的哪个版本？速度怎么样？我用过一个，感觉有些慢，难道是我配置不行。。。。

与其找便宜的不如找效果最好的，要便宜有免费的那最便宜

我目前也用的是国内的转发站，大体就是 0.8 元人民币 ==> 1 美元额度。算下来就是楼上的 0.024/1k tokens 吧不过目前也就个人用用，冲了 200 刀（ 160 人民币）。claude 3 的三个相关模型，gpt-4 的模型看起来都能用。

所以不知道并发情况。之前还纳闷这些转发站的上游渠道，那现在似乎优点明白了：gpt-4 ---> Azureclaude ---> AWS

老哥用的那家的，推荐下，最近想试试

我去看了看，这家没 aff 啊，心好痛啊。还好他家域名短，辛苦老哥看图片👆 真·广告位出租 👆

纯 CPU 就可以。M1 Pro, 16G 跑着挺快对，14b 我说错了。
together.ai 有 25 美刀额度免费
这些本地“小模型”只能跑点文科东西，反正对我来说基本上没法用。快倒是真快，刷刷刷好几屏我眼睛都跟不上。

谢谢

支持中文不

低价的中转 API 平台上线 Claude 3 Opus 模型了 hesudu.com/t/1019642

＃42 qwen-13b ，国内的模型中文支持好些。mistral 中文很烂

＃39 写点 python 代码没问题的

合速度

便宜的大模型 API 推荐？

近期文章

热门推荐