DeepSeek-R1 对标 OpenAI-o1 模型开源了

⚡ 性能媲美 OpenAI-o1
📖 完全开源的模型和技术报告
🏆 MIT 许可：可自由蒸馏、商业化！
X: x.com/deepseek_ai/status/1881318130334814301
Github: github.com/deepseek-ai/DeepSeek-R1
DeepSeek 太强了，再这样发展下去，感觉要成为开源大模型的扛把子了

牛逼。现在也感觉很强，已经接近非常 4o 。就是偶尔会卡主一会。

牛的，V3 已经挺好用的了，翻译，写代码都表现不错。

新的 R1 能力提升了，但价格也没有提高太多，大概是原来原价的两倍价格。

马上玩玩看🌚

不知道 lite 版本在本地跑效果怎么样, deepseek 卷起来了啊

之前充 Claude 会员，一直没有体验 o1 ，现在好了，都不用了，这个春节属于 deepseek

试了一下，挺强的

小白问一下，这东西应该怎么玩？
我只会在 app 商店下载 app 版，没见什么收费项目。
正确的玩法是怎么玩？

直接用官网的 chat 页面 chat.deepseek.com/ ，或者 api 调用 api-docs.deepseek.com/zh-cn/

网页版和 app 版不一样吗？

我觉得还是有差距，不过架不住便宜

现在 cursor 用 deepseek v3 比 claude 如何?

有人试过这个本地部署的话有没有屏蔽各种敏感词或者被特色化？
还是无论什么内容都不限制的可以随意生成呢？

看了各种评价，主要是成本太可怕了

话说现在 deepseek 有图像这个模态的接口了吗

目前是折扣价阶段吧，到 2 月中旬，价格应该是和 chat 模型是 44%的 4o 的价格，而 r1 模型是 88%的 4o 价格。毕竟 4o 是多模态，成本优势可能没有想象中那么大。

另外，如果不看分数，自己去跑一下带有大量数字的，同时需要 ocr 的又涉及略复杂计算处理，（比如退税表格）目前唯一接近满意的只有 claude-3.5-sonnet1022 。大多数连数字 ocr 这关都错误百出，整理过程中也逻辑各种不可靠。openai 的 o1 ，google studio 的 1226 ，deepseek 的深度，都完成不好。

如果是日常聊天和百科，确实够用，但可能 4o mini 和 claude 3.5 haiku 也够用，价格优势又没了。

千万别搞涨价并关闭 v3 的做法. 并不是所有场景都需要用到更好的模型.

github.com/deepseek-ai/DeepSeek-R1
这里面一行代码没有
开的什么源？

模型文件能下载就已经算开了。小开也是开

huggingface.co/deepseek-ai/DeepSeek-R1

很期待的用了一下，没有期待的那么 nb 啊。
在我没要求的情况下，强行给我写代码，即使我说用文字解释，它还是用代码🤦

github 开源的是论文，模型在 HuggingFace

加油，期待让我用上更好的 chatgpt

api 还没有放出来吧

在复杂问题上 4o 和 r1 已经不是一个层次的模型了，对比其价格几乎没有任何意义（如果不考虑思维链 r1 甚至还便宜）。另外 OCR 你完全可以拿 mathpix 或者 gemini flash exp 做个预处理（成文本）再给文本模型做，因为几乎所有多模态模型带图片进行推理时能力都会退化

感谢告知, 刚刚测试了下思考的过程也是用中文(用户语言)了, 之前思考过程一直用的英文

邮箱注册好难啊。只能手机号

这玩意儿本地离线部署大概需要什么性能的机器？

试了一下这几天正好用每天的日报写年终总结感觉和 kimi 比还差点意思呢。。。

几百 G 显存吧好像

对不起,没看到提供了小参数模型

只有我觉得就是一个弱智吗？

之前官网一直能用的「深度思考」模型就是 deepseek r1 吧？现在是相当于把这个模型开源了？

＃31 之前是 R1-Lite ，现在是 R1 完整版

搜了一下，好像之前是 r1-lite ，现在的官网版本应该也更新了，是说比原来响应速度快一些了

试了下，只有 Google 的 gemini 答对了

强不强先来一把谁是人工智障辩论再说

＃6 用 ollama ，再结合一个前端 chat 交互就行，还能给别人用

合速度

DeepSeek-R1 对标 OpenAI-o1 模型开源了

近期文章

热门推荐