这两天写了个采集网页的小tool,遇到个问题是如何用正则表达式排除特定内容。 我要采集一个网页的文章部分,我要替换掉一些不想要的标签为空,比如超链接,图片标签还有其他一些不想要的。。。 但是,我要保留这个段落标签,何解?经过搜索,确定用如下方法,去掉除 以外的其他html标签,主要是这样成对闭合的标签。 ?!是指排除,不匹配 p|(/p)就是或的意思啦。
Read more标签: 正则表达式
dreamware正则表达式-查找特定字符串
开始(.*)结束 dreamware正则表达式-查找特定字符串。显然 ,主要就是这个 (.*),点是任意字符的意思,*是任意若干次匹配前边的字符。问号是一次或0次???
Read more