php正则的简单使用_正则匹配音标-程序员宅基地

技术标签: 杂谈  

 
对于开发人员来说,正则表达式是一个非常有用的功能。它提供了 查找,匹配,替换 句子,单词,或者其他格式的字符串。

【开始使用正则表达式】

对初学者来说,正则 看起来很难学习和使用。事实上他们并非你想想的那么难,在我们深入掌握正则之前,先迅速看看这些入门基础:

正则表达式语法
正则表达式     将会匹配
foo ——————字符串“foo”  
^foo ——————以“foo”开头的字符串  
foo$ ——————以“foo”结尾的字符串  
^foo$ ——————“foo”开头和结尾,(只能是他自己 )  
[abc]—————— a 或者b 或者c  
[a-z] —————— a到z之间任意字母  
[^A-Z]——————除了 A-Z这些之外的字符  
(gif|jpg)——————“gif”或者 “jpeg”  
[a-z]+—————— 一个或者多个 a到z之间任意字母  
[0-9.-]—————— 0-9之间任意数字,或者 点 或者 横线  
^[a-zA-Z0-9_]{1,}$—————— 至少一个字母数字下划线  
([wx])([yz])—————— wy或wz或xy或xz  
[^A-Za-z0-9]—————— 字符数字之外的字符  
([A-Z]{3}|[0-9]{4})—————— 三个大写字母或者4个数字  
 

\ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。
^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。  
$ 匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性,$ 也匹配 '\n' 或 '\r' 之前的位置。  
* 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。  
+ 匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。  
? 匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。  
{n} n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。  
{n,} n 是一个非负整数。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。  
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。  
? 当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串 "oooo",'o+?' 将匹配单个 "o",而 'o+' 将匹配所有 'o'。  
. 匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符,请使用象 '[.\n]' 的模式。  
(pattern) 匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合得到,在VBScript 中使用 SubMatches 集合,在JScript 中则使用 $0…$9 属性。要匹配圆括号字符,请使用 '\(' 或 '\)'。  
(?:pattern) 匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用。例如, 'industr(?:y|ies) 就是一个比 'industry|industries' 更简略的表达式。  
(?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。  
(?!pattern) 负向预查,在任何不匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始  
x|y 匹配 x 或 y。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food"。  
[xyz] 字符集合。匹配所包含的任意一个字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。  
[^xyz] 负值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。  
[a-z] 字符范围。匹配指定范围内的任意字符。例如,'[a-z]' 可以匹配 'a' 到 'z' 范围内的任意小写字母字符。  
[^a-z] 负值字符范围。匹配任何不在指定范围内的任意字符。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范围内的任意字符。  
\b 匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。  
\B 匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。  
\cx 匹配由 x 指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符。  
\d 匹配一个数字字符。等价于 [0-9]。  
\D 匹配一个非数字字符。等价于 [^0-9]。  
\f 匹配一个换页符。等价于 \x0c 和 \cL。  
\n 匹配一个换行符。等价于 \x0a 和 \cJ。  
\r 匹配一个回车符。等价于 \x0d 和 \cM。  
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。  
\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。  
\t 匹配一个制表符。等价于 \x09 和 \cI。  
\v 匹配一个垂直制表符。等价于 \x0b 和 \cK。  
\w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。  
\W 匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。  
\xn 匹配 n,其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,'\x41' 匹配 "A"。'\x041' 则等价于 '\x04' & "1"。正则表达式中可以使用 ASCII 编码。.  
\num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。例如,'(.)\1' 匹配两个连续的相同字符。  
\n 标识一个八进制转义值或一个向后引用。如果 \n 之前至少 n 个获取的子表达式,则 n 为向后引用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制转义值。  
\nm 标识一个八进制转义值或一个向后引用。如果 \nm 之前至少有 nm 个获得子表达式,则 nm 为向后引用。如果 \nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的向后引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 \nm 将匹配八进制转义值 nm。  
\nml 如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八进制转义值 nml。  
\un 匹配 n,其中 n 是一个用四个十六进制数字表示的 Unicode 字符。例如, \u00A9 匹配版权符号 (?)。  
 
【常用的正则表达式】
    1、非负整数:”^\d+$”
    2、正整数:”^[0-9]*[1-9][0-9]*$”
    3、非正整数:”^((-\d+)|(0+))$”
    4、负整数:”^-[0-9]*[1-9][0-9]*$”
    5、整数:”^-?\d+$”
    6、非负浮点数:”^\d+(\.\d+)?$”
 7、正浮点数:”^((0-9)+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$”
    8、非正浮点数:”^((-\d+\.\d+)?)|(0+(\.0+)?))$”
    9、负浮点数:”^(-((正浮点数正则式)))$”
    10、英文字符串:”^[A-Za-z]+$”
    11、英文大写串:”^[A-Z]+$”
    12、英文小写串:”^[a-z]+$”
    13、英文字符数字串:”^[A-Za-z0-9]+$”
    14、英数字加下划线串:”^\w+$”
    15、E-mail地址:”^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$”
    16、URL:”^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$”
 
【php 正则表达式的方法】

preg_match() 该函数preg_match按照模式去匹配字符串,如果符合则返回TRUE,否则返回FALSE  
preg_match_all() 该函数 preg_match_all() 在字符串中匹配出全部符合模式的字符串.  
 
* preg_match() 返回 pattern 所匹配的次数。要么是 0 次(没有匹配)或 1 次,因为 preg_match() 在第一次匹配之后将停止搜索。  
 
 
* preg_match_all() 则相反,会一直搜索到 subject 的结尾处。如果出错 preg_match() 返回 FALSE。  

 
 
 preg_replace()  该函数与ereg_replace()类似,不同在于它利用匹配的模式去替换输入的参数  
 
 
 preg_split() 该函数与split()类似 不同在于它将与正则表达式匹配的字符当做分割的模式  
 
 
 preg_grep() 该函数preg_grep() 匹配数组中全部元素,返回符合正则表达式的元素组成的数组  
 
 preg_quote() 转义正则表达式字符  

1)验证域名

检验一个字符串是否是个有效域名.

$url = "http://komunitasweb.com/";  
if (preg_match('/^(http|https|ftp)://([A-Z0-9][A-Z0-9_-]*(?:.[A-Z0-9][A-Z0-9_-]*)+):?(d+)?/?/i', $url)) {  
    echo "Your url is ok.";  
} else {  
    echo "Wrong url.";  
}  

从一个字符串中 突出某个单词
这是一个非常有用的在一个字符串中匹配出某个单词 并且突出它,非常有效的搜索结果

$text = "Sample sentence from KomunitasWeb, regex has become popular in web programming. Now we learn regex. According to wikipedia, Regular expressions (abbreviated as regex or  
 
regexp, with plural forms regexes, regexps, or regexen) are written in a formal language that can be interpreted by a regular expression processor";  
$text = preg_replace("/b(regex)b/i", '<span style="background:#5fc9f6">1</span>', $text);  
echo $text;  

突出查询结果在你的 WordPress 博客里就像刚才我说的,上面的那段代码可以很方便的搜索出结果,而这里是一个更好的方式去执行搜索在某个WordPress的博客上打开你的文件 search.php ,然后找到 方法 the_title() 然后用下面代码替换掉它

echo $title;  
 
Now, just before the modified line, add this code:  
 
<?php  
    $title     = get_the_title();  
    $keys= explode(" ",$s);  
    $title     = preg_replace('/('.implode('|', $keys) .')/iu',  
        '<strong>\0</strong>',  
        $title);  
?>  
 
Save the search.php file and open style.css. Append the following line to it:  
 
strong.search-excerpt { background: yellow; }  

2)从HTML文档中获得全部图片

如果你曾经希望去获得某个网页上的全部图片,这段代码就是你需要的,你可以轻松的建立一个图片下载机器人

$images = array();  
preg_match_all('/(img|src)=("|')[^"'>]+/i', $data, $media);  
unset($data);  
$data=preg_replace('/(img|src)("|'|="|=')(.*)/i',"$3",$media[0]);  
foreach($data as $url)  
{  
    $info = pathinfo($url);  
    if (isset($info['extension']))  
    {  
        if (($info['extension'] == 'jpg') ||  
        ($info['extension'] == 'jpeg') ||  
        ($info['extension'] == 'gif') ||  
        ($info['extension'] == 'png'))  
        array_push($images, $url);  
    }  
}  

3)删除重复字母

经常重复输入字母? 这个表达式正适合.

$text = preg_replace("/s(w+s)1/i", "$1", $text);   
 
4)删除重复的标点

功能同上,但只是面对标点,白白重复的逗号
Php代码  收藏代码
$text = preg_replace("/.+/i", ".", $text);  
 
5)匹配一个XML或者HTML标签

这个简单的函数有两个参数:第一个是你要匹配的标签,第二个是包含XML或HTML的变量,再强调下,这个真的很强大

function get_tag( $tag, $xml ) {  
  $tag = preg_quote($tag);  
  preg_match_all('{<'.$tag.'[^>]*>(.*?)</'.$tag.'>.'}',  
                   $xml,  
                   $matches,  
                   PREG_PATTERN_ORDER);  
 
  return $matches[1];  
}  
 
6)匹配具有属性值的XML或者HTML标签

这个功能和上面的非常相似,但是它允许你匹配的标签内部有属性值,例如你可以轻松匹配 <div id=”header”>

function get_tag( $attr, $value, $xml, $tag=null ) {  
  if( is_null($tag) )  
    $tag = '\w+';  
  else  
    $tag = preg_quote($tag);  
 
  $attr = preg_quote($attr);  
  $value = preg_quote($value);  
 
  $tag_regex = "/<(".$tag.")[^>]*$attr\s*=\s*".  
                "(['\"])$value\\2[^>]*>(.*?)<\/\\1>/"  
 
  preg_match_all($tag_regex,  
                 $xml,  
                 $matches,  
                 PREG_PATTERN_ORDER);  
 
  return $matches[3];  
}  

6)匹配十六进制颜色值

web开发者的另一个有趣的工具,它允许你匹配和验证十六进制颜色值.

$string = "#555555";  
if (preg_match('/^#(?:(?:[a-fd]{3}){1,2})$/i', $string)) {  
echo "example 6 successful.";  
}  

7)查找页面 title

这段代码方便查找和打印 网页 <title> 和</title> 之间的内容
Php代码  收藏代码
$fp = fopen("http://www.catswhocode.com/blog","r");  
while (!feof($fp) ){  
    $page .= fgets($fp, 4096);  
}  
 
$titre = eregi("<title>(.*)</title>",$page,$regs);  
echo $regs[1];  
fclose($fp);  

8)解释 Apache 日志

大多数网站使用的都是著名的Apache服务器,如果你的网站也是,那么使用PHP正则表达式解析 apache 服务器日志 怎么样?

//Logs: Apache web server  
//Successful hits to HTML files only.  Useful for counting the number of page views.  
'^((?#client IP or domain name)S+)s+((?#basic authentication)S+s+S+)s+[((?#date and time)[^]]+)]s+"(?:GET|POST|HEAD) ((?#file)/[^ ?"]+?.html?)??((?#parameters)[^ ?"]+)? HTTP/[0-9.]+"s+(?#status code)200s+((?#bytes transferred)[-0-9]+)s+"((?#referrer)[^"]*)"s+"((?#user agent)[^"]*)"$'  
 
//Logs: Apache web server  
//404 errors only  
'^((?#client IP or domain name)S+)s+((?#basic authentication)S+s+S+)s+[((?#date and time)[^]]+)]s+"(?:GET|POST|HEAD) ((?#file)[^ ?"]+)??((?#parameters)[^ ?"]+)? HTTP/[0-9.]+"s+(?#status code)404s+((?#bytes transferred)[-0-9]+)s+"((?#referrer)[^"]*)"s+"((?#user agent)[^"]*)"$'  
 
9)使用智能引号代替双引号

如果你是一个印刷爱好者,你将喜欢这个允许用智能引号代替双引号的正则表达式,这个正则被WORDPRESS在其内容上使用
Php代码  收藏代码
preg_replace('B"b([^"x84x93x94rn]+)b"B', '?1?', $text);  
 
10)检验密码的复杂度

这个正则表达式将检测输入的内容是否包含6个或更多字母,数字,下划线和连字符. 输入必须包含至少一个大写字母,一个小写字母和一个数字

'A(?=[-_a-zA-Z0-9]*?[A-Z])(?=[-_a-zA-Z0-9]*?[a-z])(?=[-_a-zA-Z0-9]*?[0-9])[-_a-zA-Z0-9]{6,}z'  
 
11)WordPress: 使用正则获得 帖子上的图片
 
我知道很多人是WORDPRESS的使用者,你可能会喜欢并且愿意使用 那些从帖子的内容检索下来的图像代码。使用这个代码在你的BLOG只需要复制下面代码到你的某个文件里

<?php if (have_posts()) : ?>  
<?php while (have_posts()) : the_post(); ?>  
 
<?php  
$szPostContent = $post->post_content;  
$szSearchPattern = '~<img [^>]* />~';  
 
// Run preg_match_all to grab all the images and save the results in $aPics  
preg_match_all( $szSearchPattern, $szPostContent, $aPics );  
 
// Check to see if we have at least 1 image  
$iNumberOfPics = count($aPics[0]);  
 
if ( $iNumberOfPics > 0 ) {  
     // Now here you would do whatever you need to do with the images  
     // For this example the images are just displayed  
     for ( $i=0; $i < $iNumberOfPics ; $i++ ) {  
          echo $aPics[0][$i];  
     };  
};  
 
endwhile;  
endif;  
?>  

12)自动生成笑脸图案

被WordPress使用的另一个方法, 这段代码可使你把图像自动更换一个笑脸符号
Php代码  收藏代码
$texte='A text with a smiley  ';  
echo str_replace(':-)','<img src="smileys/souriant.png">',$texte);  
 
13)移除图片的链接


<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />  
<?php  
    $str = '  
        <a href="http://www.5idev.com/">5idev</a>其他字符  
        <a href="http://www.sohu.com/">sohu</a>  
        <a href="http://www.sohu.com/"><img src="http://www.fashion-press.net/img/news/3176/mot_06.jpg" /></a>  
        <br>';  
 
 
    //echo  preg_replace("/(<a.*?>)(<img.*?>)(<\/a>)/", '$2', $str);   
    echo  preg_replace("/(<a.*?>)(<img.*?>)(<\/a>)/", '\2', $str);   
?>  
 
【PHP 常用正则表达式整理】

表单验证匹配
验证账号,字母开头,允许 5-16 字节,允许字母数字下划线:^[a-zA-Z][a-zA-Z0-9_]{4,15}$
验证账号,不能为空,不能有空格,只能是英文字母:^\S+[a-z A-Z]$
验证账号,不能有空格,不能非数字:^\d+$
验证用户密码,以字母开头,长度在 6-18 之间:^[a-zA-Z]\w{5,17}$
验证是否含有 ^%&',;=?$\ 等字符:[^%&',;=?$\x22]+
匹配Email地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配腾讯QQ号:[1-9][0-9]{4,}
匹配日期,只能是 2004-10-22 格式:^\d{4}\-\d{1,2}-\d{1,2}$
匹配国内电话号码:^\d{3}-\d{8}|\d{4}-\d{7,8}$
评注:匹配形式如 010-12345678 或 0571-12345678 或 0831-1234567
匹配中国邮政编码:^[1-9]\d{5}(?!\d)$
匹配身份证:\d{14}(\d{4}|(\d{3}[xX])|\d{1})
评注:中国的身份证为 15 位或 18 位
不能为空且二十字节以上:^[\s|\S]{20,}$
 
字符匹配
匹配由 26 个英文字母组成的字符串:^[A-Za-z]+$
匹配由 26 个大写英文字母组成的字符串:^[A-Z]+$
匹配由 26 个小写英文字母组成的字符串:^[a-z]+$
匹配由数字和 26 个英文字母组成的字符串:^[A-Za-z0-9]+$
匹配由数字、26个英文字母或者下划线组成的字符串:^\w+$
匹配空行:\n[\s| ]*\r
匹配任何内容:[\s\S]*
匹配中文字符:[\x80-\xff]+ 或者 [\xa1-\xff]+
只能输入汉字:^[\x80-\xff],{0,}$
匹配双字节字符(包括汉字在内):[^\x00-\xff]
 
匹配数字
只能输入数字:^[0-9]*$
只能输入n位的数字:^\d{n}$
只能输入至少n位数字:^\d{n,}$
只能输入m-n位的数字:^\d{m,n}$
匹配正整数:^[1-9]\d*$
匹配负整数:^-[1-9]\d*$
匹配整数:^-?[1-9]\d*$
匹配非负整数(正整数 + 0):^[1-9]\d*|0$
匹配非正整数(负整数 + 0):^-[1-9]\d*|0$
匹配正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
匹配负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
匹配浮点数:^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
匹配非负浮点数(正浮点数 + 0):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
匹配非正浮点数(负浮点数 + 0):^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
 
其他
匹配HTML标记的正则表达式(无法匹配嵌套标签):<(\S*?)[^>]*>.*?</\1>|<.*? />
匹配网址 URL :[a-zA-z]+://[^\s]*
匹配 IP 地址:((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)
匹配完整域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?
 
提示
上述正则表达式通常都加了 ^ 与 $ 来限定字符的起始和结束,如果需要匹配的内容包括在字符串当中,可能需要考虑去掉 ^ 和 $ 限定符。
以上正则表达式仅供参考,使用时请检验后再使用

【php正则修正符】

<?php   
     //标记在整个模式之外;
       例://$mode="/\bis\b/U",其中U在外面;
    //修正符:i 不区分大小写的匹配;

         //如:"/abc/i"可以与abc或aBC或ABc等匹配;
    //修正符:m 将字符串视为多行,不管是那行都能匹配;

       例://模式为:$mode="/abc/m";
         //要匹配的字符串为:$str="bcefg5e\nabcdfe"
             //注意其中\n,换行了;abc换到了下一行;
         //$str和$mode仍可以匹配,修正符m使得多行也可匹配;
    //修正符:s 将字符串视为单行,换行符作为普通字符;

       例://模式为:$mode="/pr.y/";
           //要匹配字符串为:$str="pr\ny";
           //两者不可匹配; . 是除了换行以外的字符可匹配;
           //修改下模式为:$mode="/pr.y/s";
               //其中修正符s将\n视为普通字符,即不是换行;
           //最后两者可以匹配;
    //修正符:x 将模式中的空白忽略;
    //修正符:A 强制从目标字符串开头匹配;

         例://$mode="/abc/A";
           //可以与$str="abcsdfi"匹配,
           //不可以与$str2="sdsdabc"匹配;
           //因为$str2不是以abc开头;
    //修正符:D 如果使用$限制结尾字符,则不允许结尾有换行;

         例://模式为:$mode="/abc$/";
           //可以与最后有换行的$str="adshabc\n"匹配;
           //元子符$会忽略最后的换行\n;
           //如果模式为:$mode="/abc/D",
           //则不能与$str="adshabc\n"匹配,
           //修正符D限制其不可有换行;必需以abc结尾;
    //修正符:U 只匹配最近的一个字符串;不重复匹配;

         例:
             如模式为:
            $mode="/a.*c/";
            $str="abcabbbcabbbbbc" ;
            preg_match($mode,$str,$content);
            echo $content[0]; //输出:abcabbbcabbbbbc;

            //如果$mode="/a.*c/";变成$mode="/a.*c/U";
             // 则只匹配最近一个字符串,输出:abc;

//修正符:e 配合函数preg_replace()使用,
           可以把匹配来的字符串当作正则表达式执行;
?>

    
    
    
修正符:

POSIX兼容正则没有修正符。

PERL兼容正则中可能使用的修正符(修正符中的空格和换行被忽略,其它字符会导致错误):

i (PCRE_CASELESS):
匹配时忽略大小写。

m (PCRE_MULTILINE):
当 设定了此修正符,行起始(^)和行结束($)除了匹配整个字符串开头和结束外,还分别匹配其中的换行符(\n)的之后和之前。

s (PCRE_DOTALL):
如 果设定了此修正符,模式中的圆点元字符(.)匹配所有的字符,包括换行符。没有此设定的话,则不包括换行符。

x (PCRE_EXTENDED):
如 果设定了此修正符,模式中的空白字符除了被转义的或在字符类中的以外完全被忽略。

e :
如果设 定了此修正符,preg_replace() 在替换字符串中对逆向引用作正常的替换,将其作为 PHP 代码求值,并用其结果来替换所搜索的字符串。 只有 preg_replace() 使用此修正符,其它 PCRE 函数将忽略之。

A (PCRE_ANCHORED):
如 果设定了此修正符,模式被强制为“anchored”,即强制仅从目标字符串的开头开始匹配。

D (PCRE_DOLLAR_ENDONLY):
如 果设定了此修正符,模式中的行结束($)仅匹配目标字符串的结尾。没有此选项时,如果最后一个字符是换行符的话,也会被匹配在里面。如果设定了 m 修正符则忽略此选项。

S :
当一个模式将被使用若干次时,为加速匹配起见值得先对其进行分析。 如果设定了此修正符则会进行额外的分析。目前,分析一个模式仅对没有单一固定起始字符的 non-anchored 模式有用。

U (PCRE_UNGREEDY):
使 “?”的默认匹配成为贪婪状态的。

X (PCRE_EXTRA):
模式中的任何反斜线后面跟上 一个没有特殊意义的字母导致一个错误,从而保留此组合以备将来扩充。默认情况下,一个反斜线后面跟一个没有特殊意义的字母被当成该字母本身。

u (PCRE_UTF8):
模 式字符串被当成UTF-8。

注意:

     模式修正符(Pattern Modifiers)
i     -可同时匹配大小写字母
M     -将字符串视为多行
S     -将字符串视为单行,换行符做普通字符看待,使“.”匹配任何字符
X     -模式中的空白忽略不计    
U     -匹配到最近的字符串
e     -将替换的字符串作为表达使用
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/luyaran/article/details/52433987

智能推荐

使用nginx解决浏览器跨域问题_nginx不停的xhr-程序员宅基地

文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的,浏览器出于安全考虑是禁止的。警告信息如下:不过jQuery对跨域问题也有解决方案,使用jsonp的方式解决,方法如下:$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr

在 Oracle 中配置 extproc 以访问 ST_Geometry-程序员宅基地

文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry,也就是我们所说的 使用空间SQL 的方法,官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下,主要就分为以下几个步骤。..._extproc

Linux C++ gbk转为utf-8_linux c++ gbk->utf8-程序员宅基地

文章浏览阅读1.5w次。linux下没有上面的两个函数,需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数,转换过程中受到系统编码类型的影响,需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8

IMP-00009: 导出文件异常结束-程序员宅基地

文章浏览阅读750次。今天准备从生产库向测试库进行数据导入,结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误,google一下,发现可能有如下原因导致imp的数据太大,没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件,向高版本imp导出的dmp文件出错传输dmp文件时,文件损坏解决办法:imp时指定..._imp-00009导出文件异常结束

python程序员需要深入掌握的技能_Python用数据说明程序员需要掌握的技能-程序员宅基地

文章浏览阅读143次。当下是一个大数据的时代,各个行业都离不开数据的支持。因此,网络爬虫就应运而生。网络爬虫当下最为火热的是Python,Python开发爬虫相对简单,而且功能库相当完善,力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页,按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息,通过分析请求信息可以了解请..._初级python程序员能力要求

Spring @Service生成bean名称的规则(当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致)_@service beanname-程序员宅基地

文章浏览阅读7.6k次,点赞2次,收藏6次。@Service标注的bean,类名:ABDemoService查看源码后发现,原来是经过一个特殊处理:当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname

随便推点

二叉树的各种创建方法_二叉树的建立-程序员宅基地

文章浏览阅读6.9w次,点赞73次,收藏463次。1.前序创建#include&lt;stdio.h&gt;#include&lt;string.h&gt;#include&lt;stdlib.h&gt;#include&lt;malloc.h&gt;#include&lt;iostream&gt;#include&lt;stack&gt;#include&lt;queue&gt;using namespace std;typed_二叉树的建立

解决asp.net导出excel时中文文件名乱码_asp.net utf8 导出中文字符乱码-程序员宅基地

文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能,如果文件名出现中文,便会以乱码视之。 解决方法: fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码

笔记-编译原理-实验一-词法分析器设计_对pl/0作以下修改扩充。增加单词-程序员宅基地

文章浏览阅读2.1k次,点赞4次,收藏23次。第一次实验 词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别,找出文件中所有的合法的单词,并给出一定的信息作为最后的结果,用于后续语法分析程序的使用;本实验针对 PL/0 语言 的文法、词汇表编写一个词法分析程序,对于每个单词根据词汇表输出: (单词种类, 单词的值) 二元对。词汇表:种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词

android adb shell 权限,android adb shell权限被拒绝-程序员宅基地

文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限

投影仪-相机标定_相机-投影仪标定-程序员宅基地

文章浏览阅读6.8k次,点赞12次,收藏125次。1. 单目相机标定引言相机标定已经研究多年,标定的算法可以分为基于摄影测量的标定和自标定。其中,应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统,在标定过程中,相机拍摄多个角度下(至少两个角度,推荐10~20个角度)的标定板图像(相机和标定板都可以移动),即可对相机的内外参数进行标定。下面介绍张氏标定法(以下也这么称呼)的原理。原理相机模型和单应矩阵相机标定,就是对相机的内外参数进行计算的过程,从而得到物体到图像的投影_相机-投影仪标定

Wayland架构、渲染、硬件支持-程序员宅基地

文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的 硬件支持简 述: 翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构;一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。 内核是从一个输入设备中获取一个事件,并通过 evdev 输入_wayland

推荐文章

热门文章

相关标签