在编程能力方面, Gemini 和 GPT 哪个正确率更高?
最近我练算法主要使用 Gemini 和 GPT 。
我发现有时 GPT 会提供一些有错误的代码,这时候 Gemini 也可能会给错误的代码。
但 Gemini 强在速度比较快。
想问问各位的意见。
我比较喜欢 Claude 3.7 Sonnet ,其次 DeepSeek R1
gpt 正确率更高,Gemini 就只剩快了
代码问题个人感受是
开源的东西,Claude 3.7 Sonnet 最好, Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多
私有大项目的话,Gemini 靠 context window 大,把整个项目喂进去,稍稍有点优势,但不大
grok3 比 chatgpt 强
DeepSeekv3
最近用的挺多 windsurf 配合 3.7 很 ok ,部分问题使用 gpt-o3 解决的,至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法,解决原子性问题蹦出个死锁,解决死锁蹦出个嵌套事务,然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决,好嘛,解决完三个问题都出来了,最后用的 o3
#6 根本没在乎基础业务逻辑,就像面试,光顾着高并发等问题解决最后基础逻辑走不通,仅仅单次调用接口时间 x20 最后来个系统繁忙
Gemini 这个鸡毛犟种,打死不用
Claude 永远的神
ge-mini 名字不都已经告诉你了么 阉割 mini 模型
第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖 有时候容易出幻觉,o3 mini 更适合常规开发
其次是 git commit 的适合 qwen 总结合适
最后 Gemini 快、2M 输出一骑绝尘,正确率堪忧
推荐 Claude 3.7 Sonnet
对 flowith.io 怎么看
Claude 3.7 Sonnet 速度,准确性,代码质量一骑绝尘
grok3 目前推广期,免费版比较舍得出力
编码来说 claude 断崖领先,deepseek 紧随其后,其余差不多。 人文社科领域感觉 grok 更强
我只用过 o3 mini ,目前都能满足我的需求。想试下 Claude 3.7 Sonnet 。
我试过几次 Gemini, 就是大废物
同这样感觉,现在模型里面 Coding 领域 Claude 断崖领先,不知道那些用 openai 吭哧吭哧写代码的用没用过 Claude 。grok3 在日常使用(非 coding 领域)非常好用
基本所有有名的模型都使用过,写代码领域,除了 claude ,其它我都认为是垃圾,总是给我报错的代码,只有 claude 给了我直接替换运行的自信
三家的收费账户, 再加上 Grok 的免费试用
Claude >>> Gemini > ChatGPT > Grok (单说代码相关,Grok 其实挺好的)
欢迎大家二次创作更高精度的版本。 低水平重复也可以自 high 呀😂 但行好事莫问前程,管它有没有人用。 总结到位,好玩,待我下班编辑编辑 好家伙, 一棍子把我打到自 h…
目前用 TTRSS+RSSHUB ,但手机端支持不是很好,想问问看有没有对应的客户端,能同步已读、未读的。 -- 目前需求场景是 以 PC 端为主的 RSS 阅读 偶尔(比如…
都行 这不得看自己喜欢吗 js Java 挺好的,没必要搞个第二语言,都差不多 我觉得应该是 go Kotlin->C#-> Go 打算这么学 语言有区别?难道不…