|
用户问答:大口啃英语·万词计划的确跑了一遍,软件记录的单词量为啥是8830?David同学《大口啃英语·万词计划》托福毕业了,他是第一个完成万词计划大满贯的同学! 这是他爸的一个疑问:万词计划的的确确跑了一遍。软件记录的单词量是8830,不知道是怎么回事?那1170个单词哪去了? 蒋老师:这确实是我的程序的一个小缺陷。 单词量这事说来话长。 大口啃英语里记录的单词量,当初主要是为“全文听写”做的。也就是我已经听写了十几本书,几十万单词了,这其中完全不同的单词究竟有多少? 仔细研究后才发现,这事并不简单。 因为整本书地听写,句子里夹杂着大量的稀奇古怪的“单词”,比如,Wu,5-year-old, C1,6GB,157g, 2008, 9.30...,还有就是各种的人名、地名,等等,这些确实不应算成单词量。 但很难用一个程序算法排除掉所有这些千奇百怪的“单词”。 理论上,单词量应该只统计那些真正的“大纲”单词。 问题是怎么判断一个单词是大纲单词呢? 我那时想出了一个将就的方法,就是,录一本能找到的最厚的大纲,我找的是专八大纲,14400词,然后你背熟的每个单词都到这个词表中去查一下,如果能找到,就算是正宗的大纲单词,计入单词量。 如此一来,就可以把所有的人名、地名和上述稀奇古怪的单词都排除掉了。 但这有个显而易见的问题,就是无论你背得再多,那怕三万五万,用这个算法单词量到顶了就是14400词! 答案就是:David同学用399个小时的学习,证明了万词计划里有1170个单词不属于专八大纲。 以前这个软件大家用得不太狠,尤其是只用全文听写,单词量很少有人上3000,所以这个问题并不明显。但今天,万词计划全部课程都毕业,第一位大满贯的同学已经闪亮登场,这个问题一下子就暴露了。 要解决这个问题其实也不难,我现在已经有思路了,就是把听句背词里背的“原书生词”均判为大纲单词,直接计入单词量就可以了。 也就是把全文听写和听句背词里的单词量完全打通。 只是这半年多我一直忙于做宣传材料等,没来得及改代码。不好意思。 |