第53期 软件使用!zotero抓取知网文献全要素及错误分析

**第2期**介绍过关于知网文献抓取失败的各种因素及处理

但经过跟同学朋友的交流后发现过程中还存在各种问题

本期从新视角着手介绍如何实现知网文献的确定抓取

抓取知网是第一关,但其实也是最后一关

抓取流程

zotero抓取知网文献的流程大致是

  • 安装浏览器的插件
  • 浏览器插件与zotero建立联系
  • 当特定的翻译器文件识别到目标网址(例如知网)
  • 抓取知网中的条目信息并获取全文

抓取报错

抓取流程错误,配置不完全时,会出现如下bug

  • 无法抓取,显示翻译器故障
    • 翻译器文件错误
    • 茉莉花版本不是最新
  • 可以抓取蓝色网页,无全文,无条目信息
    • 未检测到知网翻译器
  • 显示可以抓取,但无全文,无条目信息
    • 浏览器与翻译器不匹配
    • VPN网址
  • 可以抓取到条目信息,但无全文
    • 茉莉花版本非最新

抓取五要素

概览

浏览器插件

  • 每次更新翻译器后都需要同步更新浏览器插件

浏览器设置

  • 在使用过程中,edge浏览器bug最少(个人遇到的)
  • mac的safari无法使用zotero插件
  • 谷歌浏览器bug:近期(12.25):谷歌浏览器在120版本后无法抓取到条目信息和全文。暂时无法解决,需要切换浏览器

茉莉花版本

  • 由于知网近期进行了较大的更新
  • 务必确保茉莉花的插件(截至23-12-25)最新才能抓取知网条目
  • zotero 7 1.0.0-10
  • zotero 6 0.28

茉莉花配置

  • 安装茉莉花后,要手动在设置里更新才可以获取最新翻译器

网络条件

  • 校园VPN的环境下可能无法正常抓取
  • 显示翻译器抓取错误
  • 请切换到知网的官方网址进入,或使用校外访问
  • 如果可以抓取到条目信息无法抓取全文,可通过插件抓取条目信息并手动下载全文拖动到zotero里
  • 如果是特殊网络的vpn导致无法抓取条目,自行查阅是否是知网流量走了代理,设置好正确的规则可以解决错误

其它

茉莉花插件安装

公众号回复”插件“获取zotero6和zotero7最新版本茉莉花插件

手动更新翻译器

参考第二期内容

如何反馈插件错误

Issues · l0o0/jasminum (github.com)(https://github.com/l0o0/jasminum/issues)