V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
InsideSeed
V2EX  ›  雅思

[分享] 用剑桥在线词典拉了个 Anki 雅思单词牌组

  •  1
     
  •   InsideSeed · 2023-08-04 14:18:03 +08:00 · 2549 次点击
    这是一个创建于 458 天前的主题,其中的信息可能已经有所发展或是发生改变。

    正题

    因为剑桥在线词典的查询页面排版本身已经足够优秀(特别是英英释义用到的单词都很简单明了,我觉得这点是比其他词典好的地方),直接拉 HTML 下来做成 Anki 卡片就好了。

    有用 Anki 的朋友可以直接下载.apkg包导入就好了,样式在common.css里,复制粘到你卡片模板设置里面就好了,用过 Anki 的应该都知道。

    具体直接看这里

    示例

    以经典的abandon为例:

    正面

    front

    背面

    back

    其他工具

    另外不知道用 Anki 的朋友是不是都知道老黄的 ODH (在线词典助手),搜索引擎直接搜就可以找到这款浏览器插件,配合 Anki 制卡效果极佳,推荐。

    15 条回复    2023-09-20 20:45:22 +08:00
    InsideSeed
        1
    InsideSeed  
    OP
       2023-08-04 14:22:20 +08:00
    可能有人觉得直接把词典页面作为卡片是不是内容太多了,但我感觉其实剑桥的内容刚刚好,如果你背单词只是正面英文反面中文释义加几个例句的话,其实是训练自己对英文到中文的映射关系,最好还是按照一词多义分开稍微多加一些语料。不用太多,不用太少。
    InsideSeed
        2
    InsideSeed  
    OP
       2023-08-04 14:26:22 +08:00
    最近有一些 AI 口语练习的语言学习插件,我暂时还没有试过,有试过的朋友可以分享一下使用体验。
    如果效果可用的话,绝对是省钱高效。(毕竟雅思口语一对一价格大家都懂
    Noicdi
        3
    Noicdi  
       2023-08-04 17:33:17 +08:00 via iPhone
    请问点击单词或者音标,然后支持发音吗?以前一直有这个想法但是不会搞
    InsideSeed
        4
    InsideSeed  
    OP
       2023-08-04 20:04:23 +08:00
    @Noicdi 之前没有拉音频文件,我把无关的 dom 节点都删掉之后拉的 HTML 。等我有空看看 anki 卡片怎么链接多媒体文件的,应该可以加上
    InsideSeed
        5
    InsideSeed  
    OP
       2023-08-04 20:09:24 +08:00
    @Noicdi 其实就是个调 api 的脏活,你只要用你会的语言现有的爬虫库(能够获取页面 DOM 节点并按照你的需要裁剪)把你要的内容拉下来,以某种结构化的形式保存或者做进一步操作就可以了
    InsideSeed
        6
    InsideSeed  
    OP
       2023-08-04 20:22:48 +08:00
    路过的 v 友萌如果对你有帮助的话,记得点个小⭐⭐啊
    acerphoenix
        7
    acerphoenix  
       2023-08-04 22:04:10 +08:00
    正准备写个类似功能呢,刚用麦克米伦 7000 词过滤出了近 2000 的生词准备做 anki 。想找个查词接口批量查释义再导入 anki
    InsideSeed
        8
    InsideSeed  
    OP
       2023-08-04 22:25:58 +08:00
    @acerphoenix 哈哈哈,握个手。其实 github 上可用的词典接口还是有一些的。另外你也可以用 mdx-server 类似的工具把本地的 mdx 包装成接口使用,我前几天翻的时候看到的
    Noicdi
        9
    Noicdi  
       2023-08-04 22:45:46 +08:00
    @InsideSeed #5 之前我的考虑就是通过模板的形式把单词的正反面格式确定下来,发音的话就通过网易有道词典或者啥提供的 API 链接来。这个脚本就可以以一个单词作为参数,把具体的内容填充到模板的对应位置,形成一张卡片。然后导出欧陆词典的生词本,调用脚本形成一批生词的 anki 卡片来背。
    Noicdi
        10
    Noicdi  
       2023-08-04 22:47:56 +08:00
    InsideSeed #5 但是后面考虑到不熟悉脚本类语言,anki 也没有接触过,不会写模板,觉得没必要搞那么麻烦应该直接开始背单词,就单纯搞了解析欧陆词典生词本的脚本,需要的时候手动导出一次生词放在墨墨背单词里直接用了。
    InsideSeed
        11
    InsideSeed  
    OP
       2023-08-04 23:25:33 +08:00   ❤️ 1
    @Noicdi 你说的思路当然是对的。

    直接背单词肯定没毛病,主要是 anki 并不只是个背单词的软件,闪卡拿来干嘛都行。

    墨墨背单词的强项是间隔算法 fsrs (算法作者也是 anki 推行者,因此 anki 也可以配置同样的算法),墨墨的释义我觉得是普通水平,英英释义还是得靠别的词典资源。

    Anyway ,背单词才是第一要务。

    关于卡片模板,我就是想偷懒所以才直接用的 HTML 和原网页的 CSS ,只要往正反面填进去就行了,简单无脑。我只加了一个 Word 字段来作为排序列。
    欧陆生词本用 Dict2Anki 这个插件可以直接导入卡片和语音(语音有 bug 要修一下),但它的缺点就是释义真的有点拉,我是特别看重英英释义的,但它的英文释义我不知道从哪扒下来的,都是用生词解释生词。而且多义也不行。那个项目已经好久没维护了,作者处于弃疗状态,也不容易。如果有人擅长 QT 和 Python 且愿意的话去维护这个插件项目也是一件很有价值的事情。
    arischow
        12
    arischow  
       2023-08-05 17:34:52 +08:00 via iPhone
    op 你和我最近在做的事情很像!只不过我是把 OALD 的导入到 RemNote
    InsideSeed
        13
    InsideSeed  
    OP
       2023-08-06 14:37:58 +08:00
    @arischow 🤝自己动手丰衣足食
    VictorFrank1
        14
    VictorFrank1  
       2023-09-18 22:41:29 +08:00
    感谢楼主的无私分享。我从年初开始用 anki 背单词(随手下了个托福词库,不知道和雅思区别大吗?)到现在显示我已经背了 8000+单词了,但我感觉我还是好多单词记不住或者忘了,我现在有点开始怀疑算法了,比如某个单词当时背的很熟练,然后我选择了 Easy 1 年后再复习,但我很可能 3 月又忘了,然后陷入循环... 另外 感觉 Anki 复习的压力特别大,我最高的记录一天 Reviewed 1000 次,这两天试了下传统的手机 App 背单词,发现复习压力好像小很多,不知道哪个算法好了(哭
    InsideSeed
        15
    InsideSeed  
    OP
       2023-09-20 20:45:22 +08:00   ❤️ 1
    @VictorFrank1 谢谢支持( ps: 之前#3 楼提到的发音我也加上去了

    关于 Anki 的间隔算法,可以看看这位某乎答主: https://www.zhihu.com/people/L.M.Sherlock

    墨墨背单词的间隔算法是他负责的,他之前有提交一个 FSRS 算法对应的 js 实现在他的 github 上,

    以及这个回答: Anki 牌组参数该怎样设置,不会产生太多的刷卡压力 https://www.zhihu.com/question/465450224/answer/1945096976

    不妨试一试。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5123 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 05:42 · PVG 13:42 · LAX 21:42 · JFK 00:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.