⚡ 性能媲美 OpenAI-o1
📖 完全开源的模型和技术报告
🏆 MIT 许可:可自由蒸馏、商业化!
X: x.com/deepseek_ai/status/1881318130334814301
Github: github.com/deepseek-ai/DeepSeek-R1
DeepSeek 太强了,再这样发展下去,感觉要成为开源大模型的扛把子了

牛逼。现在也感觉很强,已经接近非常 4o 。就是偶尔会卡主一会。

牛的,V3 已经挺好用的了,翻译,写代码都表现不错。

新的 R1 能力提升了,但价格也没有提高太多,大概是原来原价的两倍价格。

马上玩玩看🌚

不知道 lite 版本在本地跑效果怎么样, deepseek 卷起来了啊

之前充 Claude 会员,一直没有体验 o1 ,现在好了,都不用了,这个春节属于 deepseek

试了一下,挺强的

小白问一下,这东西应该怎么玩?
我只会在 app 商店下载 app 版,没见什么收费项目。
正确的玩法是怎么玩?

直接用官网的 chat 页面 chat.deepseek.com/ , 或者 api 调用 api-docs.deepseek.com/zh-cn/

网页版和 app 版不一样吗?

我觉得还是有差距,不过架不住便宜

现在 cursor 用 deepseek v3 比 claude 如何?

有人试过这个本地部署的话有没有屏蔽各种敏感词或者被特色化?
还是无论什么内容都不限制的可以随意生成呢?

看了各种评价,主要是成本太可怕了

话说现在 deepseek 有图像这个模态的接口了吗

目前是折扣价阶段吧,到 2 月中旬,价格应该是和 chat 模型是 44%的 4o 的价格,而 r1 模型是 88%的 4o 价格。毕竟 4o 是多模态,成本优势可能没有想象中那么大。

另外,如果不看分数,自己去跑一下带有大量数字的,同时需要 ocr 的又涉及略复杂计算处理,(比如退税表格)目前唯一接近满意的只有 claude-3.5-sonnet1022 。 大多数连数字 ocr 这关都错误百出,整理过程中也逻辑各种不可靠。openai 的 o1 ,google studio 的 1226 ,deepseek 的深度,都完成不好。

如果是日常聊天和百科,确实够用,但可能 4o mini 和 claude 3.5 haiku 也够用,价格优势又没了。

千万别搞涨价并关闭 v3 的做法. 并不是所有场景都需要用到更好的模型.

github.com/deepseek-ai/DeepSeek-R1
这里面一行代码没有
开的什么源?

模型文件能下载就已经算开了。小开也是开

huggingface.co/deepseek-ai/DeepSeek-R1

很期待的用了一下,没有期待的那么 nb 啊。
在我没要求的情况下,强行给我写代码,即使我说用文字解释,它还是用代码🤦

github 开源的是论文,模型在 HuggingFace

加油,期待让我用上更好的 chatgpt

api 还没有放出来吧

在复杂问题上 4o 和 r1 已经不是一个层次的模型了,对比其价格几乎没有任何意义(如果不考虑思维链 r1 甚至还便宜)。另外 OCR 你完全可以拿 mathpix 或者 gemini flash exp 做个预处理(成文本)再给文本模型做,因为几乎所有多模态模型带图片进行推理时能力都会退化

感谢告知, 刚刚测试了下思考的过程也是用中文(用户语言)了, 之前思考过程一直用的英文

邮箱注册好难啊。只能手机号

这玩意儿本地离线部署大概需要什么性能的机器?

试了一下 这几天正好用每天的日报写年终总结 感觉和 kimi 比还差点意思呢。。。

几百 G 显存吧好像

对不起,没看到提供了小参数模型

只有我觉得就是一个弱智吗?

之前官网一直能用的「深度思考」模型就是 deepseek r1 吧?现在是相当于把这个模型开源了?

#31 之前是 R1-Lite ,现在是 R1 完整版

搜了一下,好像之前是 r1-lite ,现在的官网版本应该也更新了,是说比原来响应速度快一些了

试了下,只有 Google 的 gemini 答对了

强不强先来一把谁是人工智障辩论再说

#6 用 ollama ,再结合一个前端 chat 交互就行,还能给别人用