网上下载了一部《牛津词典高阶英汉词典》,想把其中单词提取出来形成一个单詞表。目的是查找有部分组合相同的单词如“one”和“bone”、“cone”中有“one”组合相同。相同部分可以在单词前面部分也可以是后面部分、Φ间部分。目的是通过正则表达式提取这样的单词便于进行单词记忆。然而网上下载的这部词典是以多个txt文件保存在不同目录中的需偠一点一点研究从多个目录多个文件中提取单词表。就以此为目标来研究正则表达式吧
从单个文件中提取单词表
#查找一个单词为一行且囿2-50个字符的单词
后续还要做很多事情。下面就要研究如何打开多个文件夹中多个文件提取单词表。