血压计数值图片识别怎么实现?
需求背景:想做个 App 方便我妈记录血压、心跳,老人家懂基础拍照,但打字这些玩不顺溜。因此想着让她每次量完血压后拍个照片,App 自动识别血压和心跳计数,上传到服务端。1.尝试了几个大模型的图片聊天,给了非常清晰的照片,一问血压计数就没一个能行的,全是乱猜的。心跳则完全识别不出来了。2.尝试了百度的 OCR 图片识别服务,识别度完全就不能用。是否有大佬可以推荐质量好的图片识别服务(针对血压计的),或者有没有大佬推荐其他方案可以快速自己训练一个针对血压计的算法?
现在 chatgpt 的多模态就是简单的把不同能力的多个模型拼接起来,类似于训练出几个残疾人让他们协同干活google gemini 号称是原生多模态,相当于直接训练出一个健全人,不过 ultra 还没出,也不知道具体效果如何
如果是记录,买个中档不是自带功能吗
嗯,现在确实是有自动上传数据的血压计。但想到图片这种方式,看看有没有办法能实现出来。
买个带数据记录功能且支持手机的血压计就可以了。
买个高级的血压表就好了。
买那种支持蓝牙的,直接同步手机 app 。不然还要拍照多麻烦
很多血压计都可以自动发测量结果到子女微信了,直接买来用就行
统一回复:其实是想看看图片识别这种方式,有没有办法能实现出来。元旦回家碰到这个问题的时候,第一反应就是上京东搜有没有联网款的。
用 opencv 当成二维码识别去设计,字形也都是固定的
说错了,验证码
这个不用 ai 把,ocr 就行,你发张图来试试
led 屏的话,百度 paddleocr 有个专门针对此种字体的模型,如果效果仍然不佳,也可以拿一些图片自行训练 paddleocr
这个问题不需要大模型,大模型也不是用来解决这类计算机视觉的问题。ocr 一般是正面拍照的纸张上文字,在一些复杂环境下无法使用,这种其实是 scene text recognition, 传统的 OCR 很多是机器学习的算法,在弱光、混合光线下非平整表面一些识别率不高,深度学习一些模型还可以。你发一个图片才能知道是什么样的场景。
你得给个图,拍照的方式,光线会直接影响到准确度
www.healthcapture.com.hk/感觉这个符合楼主需求啊
其实可以试试京东京造的 手腕式血压计,样子是一个很胖的手表。支持蓝牙连接手机,测完会自动上传数据到 app😂我给家里买了一个,只要测量时姿势正确,数据就和血压计测出来的一样图片识别方式感觉很吃拍照角度
几张我测试用的图。感谢指点!
我去研究下,感谢指点。 👍🏻,我下个试试看。
那你不如买个小米新出的血压计 可以自动从蓝牙网关上传数据到云端 更稳定
用了第一张图使用了腾讯云的高精度 ocr ,返回的数据结果让 gpt 处理了一遍,得到以下结果:In summary:High Pressure: 120 mmHgLow Pressure: 75 mmHgPulse: 86 beats per minute如果数字在图片中的位置差不多的话可以用程序筛选,就不用 gpt 了
你这种图片不能直接丢给 ocr ,你得先做预处理,把边缘没用的全部去掉。最新图片要白底黑字,只有你需要的信息。你这种图非常好处理,你看下 opencv 的阈值二值化方法,给个阈值先把边框啥的找出来,然后再裁剪。如果你啥都不想干,只想直接要结果的话,看看 yolo ,直接喂数据,只有 10 个数字,标注个两三万张图片估计就能拟合得很好了
对深度学习有了解的话,可以自己用 yolo 训练个模型,问题就是标注数据,通常需要上万的数据集标注 github.com/ultralytics/yolov5
让老妈把照图片发给自己🤣
有个小程序叫健康拍,可以试一试
这么精准的场景,要效果好不如自己训练一下
自己人肉识别得了。
多久量一次啊,你后台手动看下记录一下? 还能及时了解情况
这个我擅长,以前做过水表电表燃气表之类的 LED 读数识别,需要自己写算法。
这个问题不应该用技术解决
我直接丢给 Bing chat ,识别的很好啊
huggingface.co/spaces/breezedeus/CnOCR-Demo
开源的 ocr 大概率不行 从你发的图片来看这个大于 100 以后 百位和十位和个位隔的太远了
有时候不想用 sql 数据库 但想用简单点的文档数据库, 但又不想用 mongodb 有没有类似 sqlite 定位的本地轻量文档数据库呢 那为什么不 sqlite 呢? …
一般场景下,我们都是基于角色进行权限的管理,但是我感觉无法更加精细化权限控制 比如在一个知识付费场景,用户只有购买了对应的产品才能查看产品的具体内容,我能想到的是基于订单的购…
研究了半天如何实现 GMS/FCM 的稳定推送,大概搞明白了原理。其实就是三个条件,确保 FCM 连接,确保 FCM 不被杀,确保应用自启动。 确保 FCM 在线 拨号界面输入…