🗒️py04-re+爬虫学习
2023-11-1
| 2023-11-3
字数 423阅读时长 2 分钟
type
status
date
slug
summary
tags
category
icon
password

re使用

几个小爬虫

  1. 抓取便民查询网的身份证和姓名
    1. 通过verify=False忽视证书问题
notion image
  1. 常用电话网的信息爬取
此处是以[\s\S]*?匹配很多的换行符,.*无法匹配
<td>(.*?)</td>括号中的就是我们需要的数据
简单的pattern是:<tr bgcolor="#EFF7F0">\s+<td>(.*?)</td>\s+<td>(.*?)</td>
\s+也可以用于匹配空格
notion image
 
  • 脚本编程
  • py03-文件扫描,帐密暴力破解py05 初尝试argparse制作工具,ip反查域名,子域名收集
    Loading...