赞助连接

赞助连接

阅 读 文 章

如何用正则表达式提取网页内容?

[来源:网上转载 (CSDN转载) | 作者:网友(lizhizhe2000) | 时间:2007-09-28 | 浏览:人次 ]

要求如下:  
  <!DOCTYPE   HTML   PUBLIC   "-//W3C//DTD   HTML   4.01   Transitional//EN"  
  "http://www.w3.org/TR/html4/loose.dtd">  
  <html>  
  <head>  
  <meta   http-equiv="Content-Type"   content="text/html;   charset=gb2312">  
  <title>无标题文档</title>  
  </head>  
   
  <body>  
  <form   name="form1"   method="post"   action="">  
      <p>姓名:lizhizhe2000(彬彬   )          
  </p>  
      <p>地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法。   <br>  
      除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经预先定义好了正则表达式   </p>  
      <p><img   src=http://topic.csdn.net/t/20061227/20/"protfield.gif"   width="16"   height="16">  
      <img   src=http://topic.csdn.net/t/20061227/20/"protmethod.gif"   width="16"   height="16"></p>  
  </form>  
  </body>  
  </html>  
   
  如何用正则表达式实现除了图片标记<img....>以外,将其他标记中的内容正确提取出,   <img..>保持原样,即上面的文本处理后得到如下结果:  
  姓名:lizhizhe2000(彬彬   )    
   
  地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法。    
  除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经预先定义好了正则表达式    
  <img   src=http://topic.csdn.net/t/20061227/20/"protfield.gif"   width="16"   height="16">  
      <img   src=http://topic.csdn.net/t/20061227/20/"protmethod.gif"   width="16"   height="16">  
   
   
 
占个沙发先
网上有现成的,过滤掉所有标签的。你得到<form>到</form>的字符串开始过滤
 
  <!DOCTYPE   HTML   PUBLIC   "-//W3C//DTD   HTML   4.01   Transitional//EN"  
  "http://www.w3.org/TR/html4/loose.dtd">  
  <html>  
  <head>  
  <meta   http-equiv="Content-Type"   content="text/html;   charset=utf-8">  
  <title>无标题文档</title>  
论坛热门帖子: [lch203] 写得蛮好的linux学习笔记(10-21)
[黑马制造] 学习java的30个目标(10-19)
[笑傲股林] 做测试半年了,有点迷茫,应该再学些什么提高自己的测试水平和测试能力呢?(10-19)
[udp8589] 大家用google的来吱一声? 用百度的~~也来报道下?(10-18)
[沂偌掳兆] 本人总结的一些认为C++比较经典的书籍,希望对大家有用(10-18)
TAG标签: 内容 网页 提取 如何 表达式 属性 /p src height var

最新评论 共有0位网友发表了评论

发表评论

评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名:(注册)
密码:
验证码:
匿名发表

网站地图友情连接交流论坛网站投稿广告服务联系我们留言本站长统计
Some rights reserved: www.chmhome.com, 鄂ICP备07010232号 E-mail:chinakafei@live.com,QQ:552766
中国咖啡技术网(Chmhome):国外编程技术书籍,中文编程手册,经典编程文章,交流技术,技术软件下载,计算机论文,毕业论文.