星期五, 十月 12, 2007

开始使用百度的空间

以前的文章都帖在 google 的 blogspot 上面了,但我总是缺乏安全感(总之我活在这个现世里面就没有真正感到过安全),担心有一天如果 google 的帐号出问题访问不了了,那数据的损失就大了!

有一些备份的方法。对于 gmail,一般的邮件客户端没办法很好的备份,因为不在 Inbox 中的邮件无法下载,而且象 labels 这些东西也没有办法了;通过 filter forward 转到另一个邮箱的办法也不是太好,因为转过去不好分类,会很乱,而且对于同一个 session 的保存也不是很好,并且以前老的邮件也没办法处理。虽然有一个 libgmail 的 Python 模块,但是我当时使用了一下它的 demos/archive.py,效果不是太好,中间会退出,可能是中文的关系,而且它的界面也不是太好,交互终端的方式不是很灵活,我想有时间再研究它的基本原理和代码,然后自己写一个,可以直接提交 gmail 的查询指令就好了,然后在一个默认的交互式命令行里面操作——如果可能,再在上面包装终端和 GUI。

不过目前来说,没有时间,只能是用 filter forward 的办法了。但是对于其他的服务就不好办了。比如 blog——如果有一个程序能够一键搞定所有与这个帐号相关的数据的备份就好了,如果能够实现增量以及差分备份则更佳,不过目前我也没有发现这些东西,而且我现在实在也没有时间去做这些事情。所以对于以前的 blogspot,只能用一种土办法来备份了。一个备份脚本如下:

#!/bin/sh

day=`date -I`
backdir=/mnt/file/internet/google/$day
if ! [ -e $backdir ]; then
mkdir -p $backdir
elif ! [ -d $backdir ]; then
echo "Not a directory" >&2
exit 1
fi

wget http://chowroc.blogspot.com/search?max-results=999 -O $backdir/blog_all_public_posts.html
wget http://chowroc.blogspot.com/feeds/posts/default?max-results=999 -O $backdir/blog_all_xml_feeds.html
wget http://chowroc.blogspot.com/feeds/comments/default?max-results=999 -O $backdir/blog_all_comments.html

这个会生成 3 个 html 文件,包含所有文章。

不过,也是为了一种备份的需要,我决定现在开始使用百度空间,那么以后在 blogspot 上粘贴的文章,在这里也帖一份。不太敢使用博客搬家的功能,因为需要向服务器提交另一个 blog 地址的账户信息,那意味着这些程序将拥有完全的权限,甚至删掉以前的东西。事实上,好像有些博客搬家就是这么干的。我需要的实际上是博客镜像而不是搬家,所以我宁可麻烦一点也不去冒这个风险。

以前的文章不会再贴在这里,要访问以前的内容,到:
http://chowroc.blogspot.com/

因为朝廷构建的 GFW,一般情况下是没办法访问的,不过所幸我还知道一些方法可以比较快的访问。不过这里就不广泛传播了,一则意义不大,再则知道的人多了,气味太浓又要被鹰犬们嗅到了 :P

2 条评论:

bbbush 说...

gmail 的 IMAP 方式大概可以在 evolution 或者 outlook 里下载并打包,就包含了 label 的信息..

blog 么,推荐用 livejournal

Roc Zhou 说...

可以吗?那我试试看。我用 foxmail 和 thunderbird 的结果是只有 Inbox 里面的内容可以下载,而且,显然每次都只可能是一次完全下载,所以会非常的慢,而且似乎有些邮件还下不全,也没有办法按照 session 来排列。同时我又不希望用 POP 的时候把服务器上的文件删除了。

所以最好能利用 libgmail 来做,最好能够直接提交一个 gmail 的搜索语句比如按时间查找某些标签的邮件并备份之 ...