博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬虫:正则表达式
阅读量:5978 次
发布时间:2019-06-20

本文共 423 字,大约阅读时间需要 1 分钟。

符号:

. : 匹配任意字符(类似占位符,多少个.就表示多少个字符),换行符除外(与re.S相反)

*:匹配前面一个字符0次或无限次

?:匹配前面一个字符0次或1次

 

组合:

.* : 贪心算法 一次匹配尽多

.*? :非贪心算法 匹配少量多次

() :括号内的数据作为返回结果

(.*?) :需要查找的内容   最常用

方法:

findall : 匹配所有符合规律的内容,返回包含结果的列表;

Search: 匹配并提取第一个符合规律的内容,返回一个正则表达式的对象(object)

Sub:替换复合规律的内容返回替换后的值

import re

text='''adsAlandadf

1123sdsdaasds'''

d = re.findall('ads(.*?)dadf',text,re.S)    #re.S代表匹配换行符后的下一行

转载于:https://www.cnblogs.com/alan-babyblog/p/5444912.html

你可能感兴趣的文章
.NET Core 之 MSBuild 介绍
查看>>
mongodb概念
查看>>
突破MIME限制上传
查看>>
EF Code First学习笔记:数据库创建
查看>>
终结符、非终结符
查看>>
Node.js刷新session过期时间
查看>>
详解Javascript中的Array对象
查看>>
iOS:即时通讯之<了解篇 SocKet>
查看>>
SQL Tuning 基础概述10 - 体会索引的常见执行计划
查看>>
kibana.yml(中文配置详解)
查看>>
Office文档如何转换 PDF 转 DOC XLS
查看>>
图解JAVA参数传递
查看>>
算法-插值查找
查看>>
NYOJ 10 skiing (深搜和动归)
查看>>
Javascript : require.js 的使用(例子)
查看>>
@EnableTransactionManagement注解理解
查看>>
vue前后分离动态路由和权限管理方案
查看>>
Winform 设置formborderStyle 为None后如何移动窗体
查看>>
如何下载防盗链的歌曲?
查看>>
《JavaScript高级程序设计》读书笔记(十):本地对象Date
查看>>