在编程能力方面, Gemini 和 GPT 哪个正确率更高?
最近我练算法主要使用 Gemini 和 GPT 。
我发现有时 GPT 会提供一些有错误的代码,这时候 Gemini 也可能会给错误的代码。
但 Gemini 强在速度比较快。
想问问各位的意见。
我比较喜欢 Claude 3.7 Sonnet ,其次 DeepSeek R1
gpt 正确率更高,Gemini 就只剩快了
代码问题个人感受是
开源的东西,Claude 3.7 Sonnet 最好, Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多
私有大项目的话,Gemini 靠 context window 大,把整个项目喂进去,稍稍有点优势,但不大
grok3 比 chatgpt 强
DeepSeekv3
最近用的挺多 windsurf 配合 3.7 很 ok ,部分问题使用 gpt-o3 解决的,至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法,解决原子性问题蹦出个死锁,解决死锁蹦出个嵌套事务,然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决,好嘛,解决完三个问题都出来了,最后用的 o3
#6 根本没在乎基础业务逻辑,就像面试,光顾着高并发等问题解决最后基础逻辑走不通,仅仅单次调用接口时间 x20 最后来个系统繁忙
Gemini 这个鸡毛犟种,打死不用
Claude 永远的神
ge-mini 名字不都已经告诉你了么 阉割 mini 模型
第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖 有时候容易出幻觉,o3 mini 更适合常规开发
其次是 git commit 的适合 qwen 总结合适
最后 Gemini 快、2M 输出一骑绝尘,正确率堪忧
推荐 Claude 3.7 Sonnet
对 flowith.io 怎么看
Claude 3.7 Sonnet 速度,准确性,代码质量一骑绝尘
grok3 目前推广期,免费版比较舍得出力
编码来说 claude 断崖领先,deepseek 紧随其后,其余差不多。 人文社科领域感觉 grok 更强
我只用过 o3 mini ,目前都能满足我的需求。想试下 Claude 3.7 Sonnet 。
我试过几次 Gemini, 就是大废物
同这样感觉,现在模型里面 Coding 领域 Claude 断崖领先,不知道那些用 openai 吭哧吭哧写代码的用没用过 Claude 。grok3 在日常使用(非 coding 领域)非常好用
基本所有有名的模型都使用过,写代码领域,除了 claude ,其它我都认为是垃圾,总是给我报错的代码,只有 claude 给了我直接替换运行的自信
三家的收费账户, 再加上 Grok 的免费试用
Claude >>> Gemini > ChatGPT > Grok (单说代码相关,Grok 其实挺好的)
游戏引擎工程师 我接触计算机比较早,家里 98 年就买了电脑,从小玩游戏玩到大,之后高中开始就断断续续写代码,高考时也是直接报了计算机专业,本科期间基本没怎么听过课,没参加过 …
抽象的是让我们自查个人电脑有没有安装 docker ,自己卸载检查了签保证书…… 什!不是开源商业可用的吗? docker desktop 才是需要授权的吧?! 这…
新机,二手均可,不打游戏,希望屏幕舒服,有高刷就行,大家有推荐嘛。 realme 大探,小米 10s ,iqoo neo5 ,红米 k40 。。。。纠结了 K40 到手刷个 …