便宜的大模型 API 推荐?
听说阿里云的通义千问 API 收费了,看了下价格。
阿里云 ==> 0.12 元/1000tokens
我看了下,我最近 20 天就用了大概 1000 * 1000 tokens,还好在免费额度里,算了下账,都差点要 120 远了😭,还好目前是免费的🤣
果断弃用,xdm ,还有什么便宜的 API 调用不?目前我了解到的最低价格是
GPT4 ==> 0.024 元/1000 tokens
国内的:kimi/ deepseek/ chatglm/ 01-ai/讯飞星火或者你用一个 sass 服务比如 openrouter.ai/市面上的大模型基本都有(开源或者闭源)
我用的 gpt4 0.07 /1k token
有一些算力的,自己部署开源模型,白嫖
如果能搞定绑卡支付,还是用 OpenAI 官方的省心:- 不限制不能并发(具体还是要看帐号的等级,而转发站现在 GPT 4 不能并发)- 转发站莫名其妙会请求失败(用过两三个,有一两个会出现这样的状况)又想省钱又想省心的办法可以自建一个 one-api ,然后加一个官方渠道,加几个一折左右的转发站,用它的负载均衡功能来达到省钱和稳定的目的。如果完全不想花钱,可以试试 ollama ,像 gemma7B 这种主观感觉跟 GPT 3.5 Turbo 差不多。
有开源模型推荐吗
meta LLaMA2
听闻 kimi 火,我去研究,🙏
为什么选择最贵的?😂
哈,并没有呀,GPT4 国内的 sass 只要 0.024 元
感觉 kiwi 也蛮贵的,moonshot-v1-32k 的 1M 上下文差不多也要 24 元了。😂
我使用 OpenRouter 免费的 API
成本在这,再怎么便宜也不会差距很大
你说的 gpt-4 能支持并发吗?据我所知国内的这些第三方 应该是没有很高的 gpt-4 使用的 tier 的 而且很多 gpt-4 都是用 azure 套壳的 并不是 openai 的 我记得 coze 的 dalle 的图就是微软的
吓得我去看了下 api ,发现 3.5 用了俩月,终于用了 1 刀了
Gemini 有免费额度 ai.google.dev/pricing
gemini 目前免费但是 api 很难用还不稳定
qwen-turbo 0.008 元 1000tokens
turbo 感觉回答问题不太精准哈,还是不太敢用😂
justchat.top
这个不支持 gpt4 吧
楼主说的 gpt4 0.024 是哪个
gemini 免费,买个域名在 cloudflare 上转发下国内就能访问了
chatglm4 0.1 元/1k tokens, 国内的模型算中文 tokens 比国外的少, 要用的话建议就是英文 gpt4, 中文 chatglm4, 不追求回答质量的话那选择更是非常多了等 claude-3-haiku api 放出来, 感觉可以考虑用这个, 看官网评测性能虽然弱于 gpt4, 但差距没有特别大, 而且看起来价格可能会很便宜
这个 api.kksj.me/ ,之前他们在 V2EX 推荐过,感觉还不错我就购买了,不过只买了 10 块钱😂
github.com/xai-org/grok-1
简单问题本地 ollama ( mistral/qwen-13b 这俩效果可以),M 芯片跑起来挺快复杂问题 Kimi / ChatGPT 4
为什么挑便宜的?便宜的能好用?一百多还不够一小时工资吧。
直接本地搭建一个 Qwen 7b 的,基本够用了应该,一张 4090 就可以跑
需要 gpu ?还是 cpu 也可以?
aws claude 3?
#26 qwen-13b 是哪个? 是 14B 么?想问一下你跑的哪个版本?速度怎么样?我用过一个,感觉有些慢,难道是我配置不行。。。。
与其找便宜的不如找效果最好的,要便宜有免费的那最便宜
我目前也用的是国内的转发站 ,大体就是 0.8 元人民币 ==> 1 美元额度。算下来就是楼上的 0.024/1k tokens 吧不过目前也就个人用用,冲了 200 刀( 160 人民币)。claude 3 的三个相关模型,gpt-4 的模型 看起来都能用。
所以不知道并发情况。之前还纳闷这些转发站的上游渠道,那现在似乎优点明白了:gpt-4 ---> Azureclaude ---> AWS
老哥用的那家的,推荐下,最近想试试
我去看了看,这家没 aff 啊,心好痛啊。 还好他家域名短,辛苦老哥看图片👆 真·广告位出租 👆
纯 CPU 就可以。M1 Pro, 16G 跑着挺快对,14b 我说错了。
together.ai 有 25 美刀额度免费
这些本地“小模型”只能跑点文科东西,反正对我来说基本上没法用。快倒是真快,刷刷刷好几屏我眼睛都跟不上。
谢谢
谢谢
支持中文不
低价的中转 API 平台上线 Claude 3 Opus 模型了 hesudu.com/t/1019642
#42 qwen-13b ,国内的模型中文支持好些。mistral 中文很烂
#39 写点 python 代码没问题的
不同安卓手机啊,求问大家,这款手机咋样,想给老婆换个手机。 目前,手持华为 mate30 ,存储不够了主要。 需求:旗舰机,不打游戏,拍照多,512g 存储,支持 5G 。 感…
首先,我不是应用的开发者。这个应用是我们公司内部用的 IM 软件,没有外部用户使用。在我手机上面只要一切到后台,十多分钟后就被杀了,然后我就收不到同事的消息了。头大 手机:on…
之前,@风枫峰 在“这是谁的错?”中说过开发团队对需求来者不拒,而@weidagang 也在“需求变更和IoC”中说过用IoC来最大程度地解决需求变更。今天我也想从Unix设计…