访问已不再可用的网页资源

缘由

今天需要找一个标准数据集,但是网页显示403,但是我又很想下载到这个资源

解决

数据集所在的网址是:https://prolog.univie.ac.at/research/OP/,目前是显示403错误的

但是,在之前的某个时间,这个网页应该是可用的,于是我打开一个网页存档网站:https://archive.org/web/

搜索一下这个网页的历史快照,幸运的是,这个网页在15年和22年都有存档,于是便可以愉快地访问了

但是还有一个问题,要下载的文件并没有存档

但是又一个幸运的事情发生了,这个文件的链接并没有失效

我猜测的原因是网页发生了变化,可能被删除了,但是对应的文件并没有被删除,就好像WordPress里面,删除网页不会影响图片、视频等媒体继续存在一样

于是,便成功下载到了所需要的数据集

虽然过程有一点点曲折,但最终问题解决了,便记录一下

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据