我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差
比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数
那就对了
那就对了
新版本的确实感觉有问题
ds 何德何能和 grok 比,现在中文 qwen QWQ ,英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员,不知道付费版体验怎么样。
唯一可以指责你的是政治不正确
我也感觉, 感觉铺天盖地吹捧 ds, 试水了几次都被劝退了
最近写 CUDA ,grok3 是唯一能写对的,其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。
我无法触发他的第二次回答
马斯克实在给的太多了,ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱
ds 幻觉那么严重各种瞎编, 你居然让他平替百度.....
真平替还是 perplexity 吧. 搜索真的接受不了幻觉.
虽然免费, 但是感觉质量挺好的
gro3k 本来就是目前最强的,差点很正常。
我代码主力 claude 的,前两天写了两个 awk 脚本,claude 3.7s 完全不对,ds r1 思考了 7 分钟,完美符合要求
只能说每个人遇到的问题都千奇百怪,哪怕是同一家 AI 也不是每次答案都一样。
同样问题,你问出来不对,我问出来对了。刚才问的不对,现在问对了……只能说不要只看一家,平时也可以多换着问问。
因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费
我现在日常琐事问题 deepseek R1 ,需要创意及比较新颖的问题 grok ,写逻辑代码 claude 3.7 ,生成前端 UI deepseek R1 或 V3
因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费
太赞同了。主要就是因为没有使用门槛,而且背后的「浙江六小龙」都在宣传和公关方面投入了很多,让 DeepSeek 充分曝光了。
为我自己的这篇文章引流: kutt.it/Z4bAtw
claude3.7 thinking 稳稳第一,grok3 第二,其他都是玩具
ds 有个最奇怪的现象是在其他 ai 没见过的,回答代码居然会漏一边括号这种低级错误
代码质量我觉得过得去,比 copilot 和 genmini 好,gpt 就暂时判断不出哪个更佳,当然说的都只是免费 web 之间比较
对大多数普通人来说 deepseek 已经够用了
编程领域 我提出的问题 ds 也能完美解决 80%以上
最后 马化腾财富全球排名 36 所以他很穷!!
文字工作者,深度使用,感觉 grok3 和阿里新出那个差不多,ds 在这两个之后,ds 比 chatgpt 好,gpt 降智太弱了,我说的都是免费版
最近再用 qwq-plus 感觉还可以,主要是吐字快!
deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了
只拿小红分滚出这个论坛
llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。
#24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~
温度调到 0 ,再试
#14 qwq-plus 也不用翻墙
这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边
我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论
刚出的 gemini 2.5 pro 也很强
别的不说,手机 app ,这几个中 grok 做的最好看
通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。
因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。
单一场景谁都有可能出错
grok3 确实能打
先不说质量,输出速度 ds 是最慢的。。。
百度和 Google 的区别
我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了
体感 grok 确实很好用,比其他都强
刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了...
deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低
新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。
最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。
其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物....
#13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀
它本来就很差,从没象吹的那么优秀过。
我真心佩服的就 Claude ,Grok
编程用 Claude Sonnet
我记得最常见的一句评论是:
deepseek 的逻辑推理能力很强
我当年参加物理竞赛和辩论赛的时候,都不知道原来有这么多深耕逻辑学的人士深藏网络
都不好用,一个问题多问几家,然后选择自己认为是正确的答案,也不排除都不对,一些小众领域还是不适合 ai
从我个人体验来看,ds 中文回复质量比免费的 4o 和 gemini 要好上不少,我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好,很容易发散,需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。
另外,光是他坚持开源权重这一点就让我没有任何理由批评他了,所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界,国产是多大仇啊
不好用就别用了吧。这样它就不要总是“服务器不可用”了。
刚刚提交了个提问,还不错。而同个问题,ChatGPT 只给出文字描述,必没有给代码。DeepSeek 给出代码实例了。
自从之前一直给“服务器不可用”,就很长时间不用了,改用 Kimi 。今天回来用,居然可用。不错不错。
代码这个,一般情况都是要多个平台提问,再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说,Shell 给的非常不错,但有时要使用 Kimi 补充。Grok 有限额,DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。
目前来说 Grok 体验最好,非常的专业,效率也很高,思考和搜索的过程非常干练。ChatGPT 也很棒,不过结果总是略逊一筹。
op 用的 v3 还是 r1 ?
话说 grok3 刚发布不久,r1 发布 2 个多月了,按照大模型半年一代的迭代周期,有差距也很正常。
在开源模型中 DeepSeek 和 Qwen 是目前最好的,自建成本也并不是高不可攀,我觉得没有责难的理由,那些闭源模型没有匹配的可能性
我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯.
最新的 v3
DeepSeek 就是一坨,让它写一段 matlab 代码结果死机了,一直重复输出一个字母
ds 有幻觉没错,但是你推荐 perplexity 就不对了,这东西还不如 ds 和 qwen 呢,而且注水非常严重,印度人搞的垃圾罢了。
grok3 很强
给老中打打鸡血就完事了 你还真用啊?
grok3 最近是主力
对啊,Sam Altman 就一傻逼,这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀,他要是提前问下你的意见估计就不会做这些小丑表演了。
楼上挺有乐子的
管理器类?管理者类? 经理类 参考 operator 看得懂就合适 不翻译,就当是术语好了。为什么一定要翻译。 master 你也要翻译吗? 主银…
前提:手头上准备有一个项目 project 要开发,目前规划是会开发出一个基础版本,然后这版本上线后,基于该版本会按照不同的客户需求有一些差异不大的定制化修改,可能就会出现 p…
上次发帖说( www.hesudu.com/t/991398 ),让帮忙测试狂发消息,却给我 oss 刷了 4.7TB 的流量。肉疼 4.7T 价格多少? 差不多 2 …