正则匹配空行实例,去掉各种各样的空行

2021年4月7日11:24:48 评论 5

学而时习之,文本处理时发现个问题,把采集来的html代码用正则匹配去掉标签后会留下各式各样空行换行。

去网上找解决方案,看到这位大神写的还是很靠谱的。遇到的问题基本都能解决。

正则表达式去空行,废话不多说,把人家的代码搬过来,留着用是个好习惯。

一个空行,可能包括,换行符, ,空格。对字符串进行处理时,难免会遇到对空行进行处理。

1,替换空行,空行可包括空格, ,\t,\f,\n

$s= preg_replace('/(^(\s| )*$)/m', '',$s);

2,替换空行,只包括换行符

$s= preg_replace('/(($\n\r*$)|(^\n\r*^))+/m', '',$s)

3,替换空行,并将非空行的开头和结尾的空格去掉

$s= preg_replace('/^( |\s)*|( |\s)*$/m', '',$s);

4,不匹配空行,直接不匹配空行,挺难的。其实不匹配空行,就是匹配非空行

preg_match_all('/\S+/m',$s,$match);

5,多行匹配实例

$s= "

test:

11111

22222

33333333333333333333

44444444444444444444

";

$s= preg_replace('/(^(\s|&nbsp;)*$)/m', '<br>',$s);

$pa= "/test:(((\s)*[^<]*)*)/i";

preg_match($pa,$s,$m);

echo$m[1];

匹配test行到下面多空行之间的内空,也是11111,22222

6,常用匹配模式

i 模式中的字符将同时匹配大小写字母

m 字符串视为多行

s 将字符串视为单行,换行符作为普通字符

x 将模式中的空白忽略

e preg_replace() 函数在替换字符串中对逆向引用作正常的替换,将其作为 PHP 代码求值,并用其结果来替换所搜索的字符串。

A 强制仅从目标字符串的开头开始匹配

D 模式中的 $ 元字符仅匹配目标字符串的结尾

U 匹配最近的字符串

u 模式字符串被当成 UTF-8

正则表达式去空行,测试效果如下

测试工具https://c.runoob.com/front-end/854 注^前面加个空格或者/才能达到预期效果,这可能是这个工具的小bug。

正则匹配空行实例,去掉各种各样的空行

正则表达式测试

  • 君子仁爱:取之有道。刷新有惊喜,看头像。
  • 原创不易,转载注明出处和链接:https://acg.92ylq.com/anime/qu-kong-hang/
Uibot 学习笔记 自留地

Uibot 学习笔记

1、Uibot教程里那些坑 adodb插件 32位的用不了 domtools插件,正则替换,64位版的uibot用不了 来回折腾很费劲。 2、 Chrome调试正则字符串时用到的语法 var tem1...
Nginx宝塔wnmp访问日志分析语句 转载资料

Nginx宝塔wnmp访问日志分析语句

最近不知怎么回事网站贼慢。自学日志分析,发现原来是度娘的蜘蛛爬的太勤了。这个好解决,管理员工具降低抓取频率,robot为其指路。希望以后会好些。 日志分析原来也不难,会这些语句来回折腾就能应付基本的需...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: