文章关键词提取器 V.20100202 说明
一、说明
本程序是由PLM研究开发的一款完全免费且快速的文章关键词提取工具,采用关键词高速匹配算法提取文章中的字、词、句子或短语并取得数量和按数量排序。
二、词库
程序词库分为内置于程序中的系统关键词库(内含768936词条)和存于文件中的用户关键词库两种,可以根据需要以方便的在两个词库或全部词库中匹配,以满足不同类型关键词提取的需求。
用户词库可以随意建立和修改,并能方便的在任意版本的用户词库之间切换。
程序的用户词库文件是后缀为“.KeyWords”的文本文件,文件中的每行为一个词条。主程序启动时自动载入的用户词库为“主程序文件名”.KeyWords的文本文件。
注意:为了提高词库载入速度,载入用户词库时未对每个词条进行唯一性验证,因此,当词库中的词条重复时提取的关键词数量也将加倍(主要影响是可能造成该关键词提取后排序靠前)。
三、使用
⒈将要提取关键词的文章粘贴到文本编辑框中;
⒉由于系统内置词库中收录了70多万词条,在海量的词条中很多词并不是用户所需要的,同时很多独特的关键词是系统词库中所没有的,因此程序中准备了“使用系统词库和载入的用户词库提取”、“仅使用系统词库提取”、“仅使用用户词库提取”等方便的功能,使用这些功能呢个仅需要点击下面的不同按钮即可实现:
①“全部词库”按钮为同时使用系统内置词库和用户词库进行匹配提取;
②“系统词库”按钮为仅使用系统内置词库进行匹配提取;
③“用户词库”按钮为仅使用用户自定义词库进行匹配提取;
④用户词库可以建立多个不同的词库文件满足不同的需要,使用时点击“载入词库”按钮选择不同的词库后载入使用(载入的词库将替换之前的用户词库,系统内置词库不受影响);
⑤“换行方式”按钮可以使编辑框中的文章在换行和不换行之间切换,方便编辑;
⑥“文章下载”按钮指向一个网络文章发布系统,可以根据需要下载一些文章进行处理。
⒊点击需要的按钮后稍等片刻即可在新打开的窗体中显示提取结果,可以根据需要导出到Excel或按格式存入新的文本编辑框中备用。
四、版权
在不修改本程序和本说明文件的任何部分的前提下,可以任意使用和传播本程序而不需要征得作者本人同意。