TP正则表达式的问题求教。

2009年5月14日星期四

TP正则表达式的问题求教。


注册日期:2007-04-11帖子:1,556引用:作者:朔风飞扬先源文件A操作“删除重复行”,得到一个新文件B;A-B得到C;B-C得到你要的结果D。
我猜的,不知道对不对。当然这只是举的例。
没错。不过,280多万行的词库相减,cnbook和TP太慢,甚至崩溃。用黄伟等工具,又不支持UTF-16LE字符啊。ABCD挖苦的。

怎么删除:完全相同的行。
即:下面两条全部删除:
czcbq=沉舟侧畔千帆过病树前头万木春
czcbq=沉舟侧畔千帆过病树前头万木春

原因:
我的词库里有:
czcbq=沉舟侧畔千帆过,病树前头万木春
czcbq=沉舟侧畔千帆过病树前头万木春
两句中我要的是:
czcbq=沉舟侧畔千帆过,病树前头万木春
解决的办法是:
1、用TP把所有的带标点符号的词条提出来。
2、然后删除词库中所有的标点符号。
3、删除所有相同的行。
4、把已经提出来的带标点符号的词条放入词库。
这样,我就把“czcbq=沉舟侧畔千帆过病树前头万木春”等彻底删除了。
谢谢!__________________

0 评论:

发表评论