这是一个创建于 4279 天前的主题,其中的信息可能已经有所发展或是发生改变。
从来没正经学过正则,只是能了解,能大概看懂的阶段。
现在要写一个很简单的正则,用来提取html文件中去除标签之后的部分。
提取所有标签的我会写
觉得 <[^>]*> 差不多就可以了,说不定还会有错。。
那请问如果要反过来用,要去掉这些标签,我的正则该怎么写呢?
谢谢!
2 条回复 • 1970-01-01 08:00:00 +08:00
|
|
1
laskuma 2013-02-28 10:08:31 +08:00
解决了。
|
|
|
2
RoshanWu 2013-02-28 12:04:11 +08:00
sed 's/<[^>]*>//g' source.html > source.txt
|