<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>无标题文档</title>
</head>
<body>
<form name="form1" method="post" action="">
<p>姓名:lizhizhe2000(彬彬 )
</p>
<p>地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法。 <br>
除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经预先定义好了正则表达式 </p>
<p><img src=http://topic.csdn.net/t/20061227/20/"protfield.gif" width="16" height="16">
<img src=http://topic.csdn.net/t/20061227/20/"protmethod.gif" width="16" height="16"></p>
</form>
</body>
</html>
如何用正则表达式实现除了图片标记<img....>以外,将其他标记中的内容正确提取出, <img..>保持原样,即上面的文本处理后得到如下结果:
姓名:lizhizhe2000(彬彬 )
地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法。
除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经预先定义好了正则表达式
<img src=http://topic.csdn.net/t/20061227/20/"protfield.gif" width="16" height="16">
<img src=http://topic.csdn.net/t/20061227/20/"protmethod.gif" width="16" height="16">
占个沙发先
网上有现成的,过滤掉所有标签的。你得到<form>到</form>的字符串开始过滤
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>无标题文档</title>
| 论坛热门帖子: | [lch203] 写得蛮好的linux学习笔记(10-21) [黑马制造] 学习java的30个目标(10-19) [笑傲股林] 做测试半年了,有点迷茫,应该再学些什么提高自己的测试水平和测试能力呢?(10-19) [udp8589] 大家用google的来吱一声? 用百度的~~也来报道下?(10-18) [沂偌掳兆] 本人总结的一些认为C++比较经典的书籍,希望对大家有用(10-18) |
| TAG标签: | 内容 网页 提取 如何 表达式 属性 /p src height var |
注册
个人空间
