谨记
非淡泊无以明志,非宁静无以致远。
  Recommended Posts
Data

JSON与XML区别

JSON简述:JavaScript Object Notation 译为 JavaScript 对象标记 本质概述:是一种轻量级的数据交换格式 再次强调 JSON是

Read more
Python

接口自动化介绍

导语合格的自动化测试工程师 -> 接口自动化测试框架 入门条件 -> 设计-开发-重构框架 进阶之路:接口基础 -> 接

Read more
Python

Python正则表达式

正则表达式 爬虫的基础掌握 是一个特殊的字符序列 检测一个字符串是否与我们设定的字符序列,相匹配 若匹配,则可以快速检索,替换文本的操作 场

Read more
Python

接口自动化测试

为什么要做接口测试? 在日常前后端开发中,他们之间为什么是独立完成的? 接口的由来:连接前后端,以及移动端 不同端的工作进度不一样,需要对最开始出来的接口,进行接口测

Read more
Python

settings组件分析

COOKIES_ENABLED 进入 scrapy 包 -> downloadermiddlewares 子包 -> cook

Read more
Network

IP地址

IP地址什么是IP地址 用来标记网络上的一台电脑 局域网ip地址可以相同,但会导致冲突(数据丢失) 所以ip地址允许重复 IP地址的

Read more
Linux

Linux命令

查看操作系统的网卡信息Ubuntu系统 安装查看工具:sudo apt-get install net-tools 安装完毕后输入:ifconfig 以太网:e

Read more
Network

网络基础

什么是网络 通信方式进行传输数据,这就是网络的一种体现 对讲机也是一种无线电电磁波传输信息,这就是网络。 网络不仅仅是可视化网线 简述:

Read more
Network

端口

什么是端口 网络通信必备IP ,端口 端口就好比是一个房子的门,是出入这间房子的必经之路。 扩展知识:一个程序没有运行之间称之为“程序

Read more
Network

套接字

Socket简介不同电脑上的进程之间如何通信 首先解决的问题是如何唯一标识一个进程,否则通信无从谈起。 在一台电脑上可以通过进程号(PID) 来唯一标识一个进程,但是在网

Read more
Git

Git基础

一.Git基础1.Git介绍 Git是目前世界上最先进的分布式版本控制系统 版本控制系统: 记录每个迭代版本的信息 版本号

Read more
MySQL

MySQL基础

查看库,表,内容 查看MySQL版本号 mysql -V or mysql --version 查看当前所有库 SHOW databa

Read more
Python

crawlspider源码分析

查看可用 scrapy 模板 进入项目目录,输入以下命令scrapy genspider --list 可用模板列表Available templates: bas

Read more
MySQL

拉钩网MySQL表结构设计

MySQL 表结构设计 分析网站数据,制定合理的表结构

Read more

个人简历

自我评价熟练 Fiddler,Postman,Wireshrak 抓包/请求数据分析,perfdog 性能监测工具。 熟练 Python 运

Read more
验证码识别方法 验证码识别方法
编码实现( tesseract-ocr ) 这是 google 开源的一款识别工具,最早是用来识别文字的。 识别率低 不建议自己去开发,因为识别各种验证码,是需要大量时间的。 而且验证码一旦更改了,代码就无效了 在线打码 识别率高达90%
2020-08-09 Ming Hui
解决倒立文字验证 解决倒立文字验证
引用第三方库,调用接口进行识别安装 zheye 第三方库git clone https://github.com/996refuse/zheye.git 安装依赖包,并移动到项目目录下其中 tensorflow 库,改为1.13版本接口调用
2020-08-09
模拟 Chrome 知乎登录 模拟 Chrome 知乎登录
创建 chromedriver 实例class ZhihuReqSpider(scrapy.Spider): name = 'zhihu_req' allowed_domains = ['www.zhihu.com'] start_u
2020-08-09
模拟 Firefox 知乎登录 模拟 Firefox 知乎登录
代码示例: # -*- coding: utf-8 -*- from ArticleSpider.utils.common import DataConvert import scrapy import pickle from mouse
2020-08-09
Selenium 模拟微博登录 Selenium 模拟微博登录
启用 ChromeDriverdef start_requests(self): """使用 selenium 获取 cookie""" # 获得 Options(操作)对象 chrome_option = Opti
2020-08-09
Selenium 简介 Selenium 简介
简单实例:from selenium import webdriver from scrapy.selector import Selector browser = webdriver.Chrome(executable_path='E:
2020-08-09
Selenium 基本使用 Selenium 基本使用
Selenium简介​ 自动化测试框架,最开始是用来做Web自动化测试的,测试网站系统开发。 Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE
2020-08-09
Scrapy 集成 Selenium Scrapy 集成 Selenium
设置中间件集成 selenium driver,实现动态加载以下方法改变了scrapy异步加载,变为了同步加载,会降低运行效率,当然也可以解决,需要重写 downloader(至少要了解 twisted API) 定义中间件class J
2020-08-09
session 与 cookie 的区别 session 与 cookie 的区别
Cookie 浏览器本地存储方式,存储键值对的格式 简介为什么有cookie的存在,http协议是一种无状态的协议,服务器接收到浏览器的请求后,服务器直接返回内容给浏览器。不管是谁发起的请求 ​ Cookie存储本地,存在隐患。随
2020-08-09 Ming Hui
存储知乎数据 存储知乎数据
Scrapy -> Shell 中配置 User-Agent ​ scrapy shell -s USER_AGENT="Browser AGENT" URL 分析URL 源URLhttps://www.zh
2020-08-09
1 / 3