有没有从文本中提取单词的软件?

Anki早期推广者

452 👍 / 46 💬

问题描述

有没有能够从电子书(.mobi;.txt;.epub等格式)中提取英语单词并按词频生成文件(.xls;.doc等等),文件中含有中文解释的软件?

我错了,下次不打包票说更新了,关于洛克生词本和爱英阅之后我会在专栏更新详细说明,再之后才会更新这个答案。【具体什么时候就不知道了……】

Anki——近乎完美的神器 - 知乎专栏

---------------------------------------------------------------------------------------------------------


答案是有的,而且刚好符合你所说的要求。

洛克生词本(作者:洛克街上
)

爱英阅iyingyue(作者:乐不思学)

-------------------------一、洛克生词本和爱英阅软件功能介绍-------------------

我先说两者软件的共同点:都可以对文章或书按照一定规则进行生词析出。这一点很重要,也就是说,你如果先把一本书用软件给析出之后,相当于有人用这些单词给你写了一本书(至于是什么书,小黄书、小说、社科...) 有人说一本书单词那么多,我哪里背的过来...你难道不会先析出一个章节的单词这样不就轻松了? =,=


爱英阅iyingyue(作者: @乐不思学 作者网站:sixue.info/iyingyue/

功能如下

为了更好的说明,截图以证明软件有多棒!

第一步,你需要建立一个词库。因为一开始的软件是默认都是生词的,包括最熟悉的a the is这些。不然的话就如上图所示会出现一些很简单的词例如:was were men这些。还好,作者已经给了我们最常见的几千词,我们所需要的只是导入即可。

第二步就进入重头戏了。选择你需要解析的书,然后导入,软件自动会帮你析出如下功能。

单词以及单词原型、生僻度、出现次数、所在位置、释义。 右键可以查看单词所在上下文!!

我特别喜欢作者添加的我的词库。当中包含了你学会的单词,你看到数字不断往上增长的时候,会有很大的成就感的,背单词也会上瘾的!

另外,kindle的生词本也可以加载哦~

2.0版已出,待更新


--------------------------------------------------------------------------------------------------------------------------

第二个软件是 洛克生词本(作者:洛克街上。新浪微博 豆瓣ID都是。)

这个软件也非常强大,我也很喜欢用(可能是第一个接触这个,其次才是爱英阅软件吧)

他的功能有

1三档——入门、进阶、高级来析出生词,好像是作者调用有道网页翻译的吧?不记得了,因为这三个档次和有道的差不多。

2配合作者开发的其他软件和功能使得洛克生词本更强大

例如AudioDownloader软件可以下载单词的发音(输入到手机或者ANKI简直炸裂!)

MyVocab可以增添自己已经会的单词(和爱英阅一样,输入已掌握单词到文本内,下次就不会有该单词出现)

dict_logging则包含单词原型以及 单词在原文中的形态(单复数、时态变化!)

sentences_logging可以得到单词所在的句子 就如洛克大神所说 语境背单词!


3生词在上下文当中,语境背单词。虽然爱英阅也是有上下文,但是它要右键点击才能看,而洛克生词本则是自动包含,这一点方便不少。

4良好的导出功能,配合ANKI简直无敌! ANKI是一个记忆软件(之后会介绍到)。你可以导入到有道、金山词霸、ANKI。 因为洛克生词本是用tab分隔的txt文件,格式很规律,所以你可以导入到喜欢的软件当中,不行的话你改一下格式咯...


-----------------2015 6 22更新--------------二、神器+神器=??????-----

这一次来介绍一下另外一个神器——ANKI

可能是ANKI太过小众? 知乎上知道了解的人都非常少,或者说是因为有一个更老牌的supermemo压着?我不懂...

目录

一、ANKI简单介绍

二、洛克生词本配合ANKI使用

****************************************************************************
什么是ANKI?

简单说就是一个记忆软件。,最基本的是就像一个卡片,正面是问题,反面是答案。

我来组成头部(正面)

我来组成尾部(反面)

记忆原理你懂得,烂大街了不多说。但是秒杀什么有道、金山单词本背单词这些,因为它是动态评估! 不是死硬的套用

上方图片有四个按钮:

生疏/错误 困难/模糊 犹豫/想起 顺利/正确

什么意思你们都懂,就是对这张卡片记忆程度的描述,你觉得自己属于哪个范畴就按哪个按钮

按钮上方的时间就是?天之后这张卡片出现的时间,比方说我选择第四个按钮:顺利 正确 则1.2个月之后才会再出现这张卡片

这是ANKI官方手册上的说明。加了()的是你用了ANKI后就能明白它说什么意思的


给你们看看ANKI的统计数据

****************************洛克生词本配合ANKI使用方法 2015 6.23*****************************

第一步、你需要一个TXT文本。

因为洛克生词本只支持TXT。所以你懂得.... 如果是MOBI、EPUB AZW3的得转一下格式才行,软件搜索都有。

第二步、导入进去选择生词档次

根据自身水平选择。然后得到生词本

注意:

1是洛克生词本只支持TXT,请留心。

2洛克生词本所在的目录,完整路径中不能含有中文。

3软件运行时间可能较久。如果是1M的大文件可能要好几分钟吧。几百K的话也要有几分钟....

4只能选择三个档次的一个,不能自行更改 这是程序设定成这样...

5单击“生成记忆库”,之后会在原始文本所在目录下生成类似*_output.txt的文本文件


得到生词本后,我们就可以导入了。

具体操作请看这儿,根据流程走就可以得到了:Anki如何批量导入or新建卡片?

douban.com/group/topic/