Hypothes.is Annotate Everything

Posted by Adobe on September 3, 2017 | - view

The Hypothesis extension is a general purpose annotator you can carry around the web with you. Use it to have a discussion on web pages or PDF documents, to organize your research, or leave personal notes.

今天我要跟大家介绍一款在线标记注释开源免费服务:Hypothes.is。这款工具诞生于2011年,由非营利组织Hypothes.is开发创建。创始人Dan Whaley旨在建立一套Web注释的通用标准,并为广大学者、教育工作者等搭建一个便捷的在线注释评论平台[1]。简单来说,有了它,我们就可以在线为网页文章或PDF文档标记、注释、评论

使用

如何使用H呢?有几种方式。1.将一段JS代码添加为书签,点击书签打开;2. 通过via.hypothes.is;3. 个人强烈推荐安装官方插件[2]。具体可参考官方教程或者以下的视频。

主要步骤如下所示:

  1. 注册账号:Hypothesis
  2. 安装Chrome扩展程序 Hypothesis
  3. 在任何你需要操作的网页激活程序,然后选中文字,就会弹出Highlight与Annotate的图标,点击右侧浮层可以展开评论框。H的评论系统做得很精致,支持latex、Markdown、图片乃至视频等。

我们可以这样理解为,H为我们增加一个额外的图层,覆盖于原网页或文档,如同PS里面的图层,有别于传统的评论系统(在网页下方),如今你可以在网页的任何位置对文字进行操作,整个页面变得更为立体化[3]。我的博客现在就已经集成了H,留意一下网页的右边界,点击浮层,你便可以展开评论框,看到我悄悄写下来的笔记,也欢迎大家积极交换意见。

PDF标注

类似的服务其实有很多,例如前两天我刚介绍的Liner,但进行在线文档标记之前,Liner要求用户将PDF文档上传至服务器上。而Hypothesis非常巧妙地解决了这问题,它可以直接对在线文档乃至本地文档进行标注[4],这是一大亮点。为什么呢?

我们假设一个场景。我需要对一份PDF文档进行标注,并与其他人实时同步,标注内容永不冲突、永不消失。我日常的文档基本存放在Google Drive,我的办公电脑有台式机、Chromebook、HP Notebook。按理说,我个人使用是不需要操心,因为我的所有操作基于云,文档同步过来都是同一份。但同样一份稿子如果发到团队其他人手里呢?相信大家都见过一份稿子存在终版、最终版、不再修改版等等情况。我们每个人所做的标注仅仅是在当下这份文档上,你能得到及时更新么?你能确保在同一份文档上面别人所做的批注,你在下一秒就可以看到么?在A电脑做的评论不经复制,能同步到B电脑么?有了H,这样尴尬的情况将得到大大的改善,我个人认为这是革命性的突破。开发者巧妙地借助PDF的fingerprint,将其作为唯一标识码,这样子,同一份文档,复制成N份,分别命名为1234,分发到N个人手里,他们在这份文档进行的操作都能即时同步、不冲突,不管是线上还是本地文档。这便是所谓的协同式批注,运用场景可以是期刊审稿、教学互动、团队学习、个人装逼等。

开源

此外,Hypothesis的开源性质也使得整个开发环境非常友好。我们可以看到有不少学者利用官方API开发了一些小工具,例如数据导入、导出等,有了API,你可以做的事情就很多了,譬如用Python、R等语言去获取你的数据,如虎添翼。通过它收集数据,导出数据,借助tag,便可以将信息结构,方便后续处理。有学者便是利用它收集文献的基本信息,我觉得这是一个相当优雅的操作,其背后的思想值得学习。David Kennedy是一名神经生物学家,他日常需要阅读一些文献,并提取信息,所以他便借助H进行了此项工作,借助不同的tag去标记,最后合成一份文献阅读报告表,相当酷[5].

花了差不多一个周末研究,收获颇丰,幸福感十足。
一个人活成一只队伍大抵便是如此。
希望对大家有所帮助。

参考资料

  1. 可在线批注评论:Hypothes.is 促进网络学术交流
  2. How to annotate with Hypothes.is
  3. 用 Hypothes.is 为你喜欢的文字添加评论
  4. Annotating PDFs Without URLs – Hypothesis
  5. Annotating to extract findings from scientific papers – Hypothesis