当前位置: 首页 > 教程 > Mac最新资讯 > 如何从浏览器中抓取网页内容和图片保存到 myBase 数据库中?

如何从浏览器中抓取网页内容和图片保存到 myBase 数据库中?

myBase 7.3发布更新!myBase是一款独特的自由格式数据库软件,允许输入非结构化文本,网页,图像,文档,电子邮件甚至任意文件,而不考虑长度或格式。所有信息都会自动压缩并存储在树形结构的大纲表单中。感兴趣的朋友欢迎前来 macdown下载体验!

如何从浏览器中抓取网页内容和图片保存到 myBase 数据库中?

内置网页编辑器,支持从浏览器中直接复制粘贴网页内容到数据库中, 并且在粘贴内容时会尝试自动下载网页中的图片,并以 Base64 编码保存到 HTML 内容中; 如果图片下载因故失败,比如网站限制图片访问,则可根据需要手动复制单项图片,然后再粘贴到页面中恰当位置处;
另外,有些网站可能需要通过 http 或 socks5 代理服务器访问,v7.x b-24+ 新增了代理服务器设置,可在选项框中进行设置
Webcollect 插件:除了直接复制粘贴外,还可以考虑安装 Webcollect 浏览器扩展,以便在浏览器的右键菜单中添加 [Save with myBase]; 最新版本 Webcollect 支持 Firefox/Chrome 浏览器,且跨系统平台通用,支持 Linux, MacOSX, Windows 三个主流系统平台;
针对 Firefox 浏览器,可在 myBase 中选择 Tools - Install Webcollect host for Firefox 菜单,然后根据指引,在 Firefox 浏览器中打开Firefox 扩展应用商店, 将 Webcollect addon 添加到 Firefox 浏览器中即完成安装;
针对 Chrome 浏览器,可在 myBase 中选择 Tools - Install Webcollect host for Chrome 菜单,然后根据指引,在 Chrome 浏览器中打开Chrome 扩展应用商店, 将 Webcollect addon 添加到 Chrome 浏览器中即完成安装;
安装成功后,在浏览器的右键菜单中会自动添加上 [Save with myBase 7.x];在浏览网页时,就可以利用此项工具保存页面内容到 myBase 数据库中。
新版本 Webcollect 插件采用全新的数据通讯接口,可跨平台通用,支持 myBase 7.0 Beta-26 (Linux, MacOSX, Windows) 及以后版本;以往旧版本无法感知/接收新版本 Webcollect 传输的网页内容; 请务必同时升级 myBase 和 WebCollect 到最新版本,才能实现网页保存功能;
注意:如果需要保存的网页布局/格式复杂,内嵌图片元素多,建议先选取页面中核心内容,尽量排除掉边栏广告等非必要元素,然后再复制或抓取选中的片断,以减少无关图片下载和资源耗费,同时提高页面内容抓取成功率;

以上就是小编为大家带来的如何从浏览器中抓取网页内容和图片保存到 myBase 数据库中?有需要的朋友,欢迎前来macdown下载体验!

相关文章

相关专题