当前位置: 首页 > news >正文

西安网站建设kxccc主流网站关键词排名

西安网站建设kxccc,主流网站关键词排名,wordpress 自定义上传图片,凡科做网站怎么样昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。 老版本验证码 新版本验证码 新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 验证码识别…

昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。

老版本验证码

新版本验证码

 

新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 

验证码识别过程

1、利用爬虫采集图像

首先我们开发爬虫去采集新版本的图片素材。爬取过程中发现cookie有一定的时效性,没有花过多时间在图片的反爬上做研究。

2、人工标记

为了保障识别的精度,这里需要进行大量的人工标记,旋转角度可能有误差,最好控制在1-2度以内,数据质量决定了模型预测效果

  3、训练模型

4、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

5、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

6、总结分析
(1)目前见到的验证码图片可能是AI生成的,所以出现新图片的概率会很大,所以对标注、识别难度会大大增加。

(2)和老版本相比,新版本图像采集加入了一些反爬措施,也增加了一些难度。

(3)目前我没有使用 selenium 进行实战测试,可能会遇到更多反爬措施。

各位大神也请指出我的不足,或者有其他建议都可以给我留言,或私信我,谢谢指点。
 

 

http://www.laogonggong.com/news/48607.html

相关文章:

  • 网站后台怎么修改代码甘肃搜索引擎网络优化
  • 帮公司做网站怎么找seo推广一年要多少钱
  • 建设网站业务不好做百度网址大全电脑版旧版本
  • 福州企业做网站sem模型
  • 响应式食品企业网站seo的基本步骤顺序正确的是
  • 如何做百度网站推广产品推广平台有哪些
  • 靖州网站建设江西seo推广
  • 网站 关于我们 模板长沙seo行者seo09
  • 贵阳哪家网站做优化排名最好全球搜效果怎么样
  • 美国人建设网站济南网站seo
  • html5手机网站制作郑州做网络优化的公司
  • 解析网站接口怎么做中国500强最新排名
  • 购买网站空间的方法无线网络优化
  • 展馆设计布展关键词优化排名查询
  • 怎么做一个电商网站吗sem与seo的区别
  • 西安网站建设企业东莞seo建站优化哪里好
  • 使用wordpress标签库漳州seo建站
  • 独立站需要多少钱厦门seo蜘蛛屯
  • 网站中的宣传册翻页动画怎么做武汉seo排名优化
  • 今日头条做网站百度图像搜索
  • 做网站廊坊站外推广渠道
  • 个人备案号 可以做游戏网站吗百度指数官网入口
  • wordpress 不显示缩略图win7优化工具哪个好用
  • 网络营销主要是什么厦门seo排名公司
  • 余干县建设局网站热搜排行榜今日排名
  • 徐州网站建设费用广告加盟
  • 福永做网站收录优美图片topit
  • 前端网站开发毕设类型搜索网站哪个好
  • 如何做网站站长seo专员岗位要求
  • 备案 网站名收录查询api