前言
这几天没更,主要是因为发生了一件大事。本来想着等事情圆满结束再来写成日记,将完整的经过记录在一篇日记中,现在看来是遥遥无期了…
这篇日记就专门记录这件事了
这么多篇日记,这是第一次Bad End
叙事
这真的是一件大事,牵扯到的人很多…..(雾)
说来话长…
盒子往事
2020年国庆后,盒子突然宣布即将停服,我作为老盒饭自然十分悲伤
在刷M社区时,我看到有“重启盒计划”的帖子。点进去看后,发现是打算新建一个社区,也就是一个新的”盒子”。很快奥,我就加入了他们的群。入群后了解到,他们想要保存M社所有的帖子,用来归档供查询。
我用python写了初代爬虫,后来群内管理写了一个java多线程爬虫,速度要快很多。于是一个超级工程就此展开。
我负责运行爬虫爬取tieid300w-700w和1100w-1800w的帖子。再陆续反复爬了几天来尽可能减少漏贴后,我将数据压缩到了移动硬盘中,上传了毒盘。
2021年春节前,盒子正式关服了。一个时代结束了
朝花夕拾
由于学业问题,大家都没有时间进行帖子的归档工作。
暑假是个好日子)于是被咕了很久归档工作又开始了)
噩耗传来
2021.7.19下午 噩耗传来了。其他管理告诉我,我的1100w-1800w的数据中,11054914后面的帖子全部为0kb。
噩梦来了。
艰难探索
2021.7.20,我起初认为是毒盘的锅。全部重新下载并且pd验证通过后,解压时压缩软件报错,显示头部数据损坏,无法正常解压后面的帖子。
那换个解压软件呢?360压缩,7zip,甚至当时压缩用的bandzip都不能正常解压
很快,我就想到了可以寻找修复zip的工具来修复。谁知道,这一找,就是一整天。开始最先找到的工具是ziprepair pro。扫描后可以看到里面的帖子数据文件的名称。我本来以为能恢复了,谁知,导出文件要钱。艹,前往官网查看后要30美元。
在百度搜索ziprepair pro的破解版的过程中,我陆陆续续找了十几家下载站。下载下来的文件基本分为两种:4.x的版本和4.x的注册机,但激活后仍然不能导出且重开软件后激活消失;另一种是5.x的版本带着4.x的注册机,就**离谱
前往google搜索,很快便找到了一个。下载后,刚运行安装文件火绒突然报毒。我一看,好家伙,后门病毒,还往我C:/windows写,赶紧杀毒删掉。Google看来是搜不到破解软件的
既然ziprepair pro的破解,那换个软件呢?于是我又开始搜索。又陆陆续续尝试了N款软件,然而都是收费的。其实这个时候收费也无所谓了,问题是这些”修复软件”看起来并不能修复我的压缩文件。使用一些有试用版的软件扫描后,基本都显示文件大小为0,也就是即使购买也不能恢复
我又尝试了使用winrar自带的修复功能。修复过程中没有报错,差点让我以为真修复了,结果一看导出zip只有900M。艹,合着损坏的帖子不要了就是修复了呗
有群友说可以尝试用win自带的explorer打开压缩文件,不过可能是文件太大太多还分卷的原因,使用explorer打开时一直在加载
修复zip受阻,那找到损坏前的zip或者压缩前的原始文件呢?我又翻箱倒柜把装数据的那个移动硬盘翻出来,再次解压,竟然还是报错。我赶紧查看硬盘中存储的原始文件,300w-700w的都在,唯独没有1100w-1800w的。艹,想起来了,我当时是直接下到原C盘了,而且那个C盘因为Windows损坏已经格式化并且重新分区重装了。
已经重新分区后再找回源文件就显得不大可能了,不过总归要试一下。使用diskgenius扫描,无论是扫描新C盘还是整个硬盘都没有任何效果。扫描移动硬盘也没有发现源文件。至此,寻找源文件的路也走不通了
路在何方?
至此,我已经完全失去了折腾的方向,还有继续折腾的毅力也不知道该怎么折腾了。无力,很无力。
总结
事故原因分析
压缩包存在移动硬盘里,怎么自己就损坏了呢?使用diskgenius扫描坏道,发现有很多多个”损坏”。估计是硬盘搞的鬼了,坏道导致数据损坏,而写入数据是2020.10,上传网盘已经是2021.4了,也就是上传时就已经损坏了。这很大程度上是硬盘的锅。wdnmd西数
另一方面就是数据安全意识不足了。重装删除源文件时没有检查压缩文件是否正常是原因之一
血的教训
下面是我总结的教训,希望这个惨案也能为你带来收获,避免类似的事情发生
- 数据要多备份。数据可能因为各种意想不到的原因丢失,一定要多备份
- 压缩文件后要检查压缩包是否正常,不要直接删除源文件夹
- 在安全的地方存储数据。不要像我一样存在电脑C盘和一个不靠谱的移动硬盘里。存数据在硬盘前可以先扫描并屏蔽坏道
- 不要在Google找破解软件,也一定不要关闭杀软或盲目信任
最后的最后
截至目前,盒子的帖子数据貌似已经随着盒子一起离开了
正如开头所说,这是这么多篇日记里第一个bad end,希望不要对你的心情产生影响
这篇日记叫”2021.7.21日记”,但却是2021.7.22发的,因为昨天晚上属实没有心情写日记
目前我仍然在做最后的挣扎。希望奇迹会发生吧,想完型阅读里那样,”There is always hope”
结束了
快进到:新的开始(笑