×
请登录
账号
密码
登录 Use it
博客
新媒体
活动
下载
方案
爬虫
标签
登录
注册
博主QQ
博主QQ:
博主微信
博主微信:
讨论群
数据采集、挖掘讨论群:
博主公号
博主公众号:
回到顶部
一个不错的验证码打码平台
最近在处理基于搜狗微信的公众号信息(不是文章)的采集,由于采集量较大,频繁出现验证码。先前找了一个打码平台,忘记叫啥名字了,费用非调用一次3里钱,而且验证码的识别的准确率也就60~70%吧!平均一天要花费20元左右; 这几天重新找了一家,识别的准...
十点数据
博客
1年前
5282
1
Python的print打印报编码错误的解决方法
错误类似如下提示: 'gbk' codec can't encode character '\xa9' in position 19672: illegal multibyte sequence 这个问题一般也就是在cmd中才会有。 在cmd中...
十点数据
博客
16天前
57
0
Urllib库添加Headers的方法
方法一:借助build_opener和addheaders完成 import urllib.request import os,sys,io #解决编码问题,修改默认编码为gb18030 sys.stdout = io.TextIOWrapper...
十点数据
博客
16天前
61
0
PYTHON Consider using the `--user` option or check the permissions.
ERROR: Could not install packages due to an OSError: [WinError 5] 拒绝访问。: 'D:\\Program Files (x86)\\Python\\Python39-32\\Lib...
十点数据
博客
1月前
198
0
python module ‘mitmproxy.proxy‘ has no attribute ‘config‘问题解决
python module ‘mitmproxy.proxy’ has no attribute 'config’问题解决 原因是mitmproxy的版本太高,目前7.x的版本已经不是这样解决了,使用下面的语句降一下版本即可: pip insta...
十点数据
博客
1月前
115
0
python3安装demjson报错
python3 安装 demjson 2.2.4 出现以下报错 error in demjson setup command: use_2to3 is invalid 由于 demjson 2.2.4 兼容python2和python3,当安装...
十点数据
博客
1月前
106
0
pymysql (1129, "XXX.XXX.XXX.XXX' is blocked because of many connection errors; unblock with 'mysqladmin flush-hosts'")解决方法
原因: 同一个ip在短时间内产生太多(超过mysql数据库max_connection_errors的最大值)中断的数据库连接而导致的阻塞; 解决方法: 1、提高允许的max_connection_errors数量(治标不治本): ① 进入...
十点数据
博客
1月前
158
0
一个bat文件启动多个python文件
最近在做基于搜索引擎的关键词搜索采集,由于是定制开发,所以每个搜索引擎的采集,最后都是一个单独的采集脚本。 如果没有一个统一的启动文件,每次都需要一个文件一个文件的启动,很繁琐。 下图是实现的最终效果: Start语法: 启动另一个窗口运行指...
十点数据
博客
2月前
365
0
Font Awesome 一套绝佳的图标字体库和CSS框架 Version 4.7.0
Font Awesome为您提供可缩放的矢量图标,您可以使用CSS所提供的所有特性对它们进行更改,包括:大小、颜色、阴影或者其它任何支持的效果。 一个字库,675个图标 仅一个Font Awesome字库,就包含了与网页相关的所有形象图标。 无需...
十点数据
博客
2月前
343
0
Python3 集合使用技巧:获取字典中值最大者的key
字典入:rDic = {"业务无关":1,"体育":2, "广告类":5} 方法1:lambda max(rDic, key=lambda k: rDic[k]) '广告类' 方法2:get max(rDic, key=rDic.get) '广...
十点数据
博客
3月前
288
0
1
2
3
4
...
12
博主公众号:
博主微信:
热门文章
1.
LayUi的Table表格defaultToolbar工具栏的显示与隐藏(权限控制)
2.
Spring Boot 踩坑系列之Error resolving template
3.
爬虫系列之Pyppeteer:比selenium更高效的爬虫界的新神器
4.
LayUi的动态表格table中设置下拉框Select编辑器
5.
基于JavaScript的流程图
6.
爬虫系列之基于XPosed框架的微信公众号采集
最新发布
1.
Python的print打印报编码错误的解决方法
2.
Urllib库添加Headers的方法
3.
PYTHON Consider using the `--user` option or check the permissions.
4.
python module ‘mitmproxy.proxy‘ has no attribute ‘config‘问题解决
5.
python3安装demjson报错
6.
pymysql (1129, "XXX.XXX.XXX.XXX' is blocked because of many connection errors; unblock with 'mysqladmin flush-hosts'")解决方法
最新评论
目前自己在用的就是这种方式,几万个关键词,每天采集量有小一百万的量。目前时间范围限制在一天
感谢分享
充值完但没有积分
数据没有下载链接
更多内容,请关注“十点数据”公众号获取!|´・ω・)ノ
有公众号采集的朋友,可以加个微信一起交流啊ヾ(≧∇≦*)ゝ