去重复行
1、先排序。
2、查找重复行:
^(.+)$[\r\n](^\1$[\r\n]{0, 1})+
3、替换:
\1\n
贪婪匹配和懒惰匹配
- .就是贪婪匹配,以A.B为例,它将会匹配最长的以A开始,以B结束的字符串,如用A.*B来搜索A111B222A333B,它会匹配整个A111B222A333B(因为是从A开始到B结束)。
- .?就是懒惰匹配,也就是匹配尽可能少的字符,如用A.B来搜索A111B222A333B,它会匹配A111B和A333B。
1、先排序。
2、查找重复行:
^(.+)$[\r\n](^\1$[\r\n]{0, 1})+
3、替换:
\1\n