About

<#TEMPLATE_INCLUDE_NINEPAGE_ABOUTME#>
  • Apr

    19

    提取 PDF Bookmark(书签) 的方法

    • 0 Comments
    • Miscellaneous
    • 发布:古树悬叶
    • 引用:0
    • 浏览:

    也许它们都并不是最好的……

    1、java 或 .NET 程序员可以利用开源的 itextsharp 库。另外,它也有独立的 dll 文件提供,使用方法参考《Extract Bookmark from PDF file》(相关资料《How to check if a pdf page has a bookmark?》)。

    2、一个基于命令行的 PDF Bookmark Print 小程序,但它是收费的,免费版会在抽出的书签中随机插入符号(可以自写脚本利用正则表达式去除这些符号),而且发现它并不能支持中文书签的抽出(不知道现在它的新版是否有更新过)。

    3、pdftk,它有 free、pro、以及 server 等不同的版本,它的免费版也能支持命令行导出书签,但我没有试用过它,所以不知道它是否能支持中文书签的导出……

    4、pdf2htmlEX 现在普遍用于 HTML5 网站中,为了适应移动端显示 PDF文件,许多文库类网站都放弃了 Flash 技术(因为 Flash 播放器无法使用于移动浏览器)。在它的功能简介中包含了支持转换导出链接、大纲(Bookmark)等。它提供了脚本和客户端命令行多种版本,并且放在 github 上授权方式是 GPLv3+(对于国人来说它就相当于是免费的了吧……)。

    没有下载试用过它,因为我是一个反 HTML5 技术的“异端”,我讨厌一却 HTML5 这种不够标准化的技术作为应用、游戏或网站的显示技术,至少现在是这样。然后看它的网页说明冒似原作者要放弃维护了,正在寻找新的维护者……我很开心:)

    • Tags:
    • 2017 / 4 / 19
    相关文章:
      Post Comment.

      发表评论