ArchiveBox:网页归档解决方案

ArchiveBox:网站归档平台

ArchiveBox 是基于 Python 的强大网页归档解决方案,可以自动把网页变成静态页面(HTML、PDF、图片),并自动提取和保存文本、音频等内容,可以用来做镜像站、档案馆、离线阅读等。

开源地址:https://github.com/ArchiveBox/ArchiveBox


使用ArchiveBox查看存档内容:
archivebox server 0.0.0.0:8000            # use the interactive web UI
archivebox list 'https://example.com'     # use the CLI commands (--help for more)
ls ./archive/*/index.json # or browse directly via the filesystem

 

作者:极客头条

传播有价值的资讯

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注