如何查找网页上次更新的时间(how to find last updated date of website)

有没有办法找出自网页更改以来已经过去了多少时间?

有没有办法找出自网页更改以来已经过去了多少时间?

例如,我有一个页面托管在:www.mywebsitenotupdated.com

有没有办法找出这个 HTML 页面被上传到服务器?

我无法访问服务器;只是指向网页的链接。

76

不,你不能知道什么时候页面最后更新或最后更改或上传到服务器(这可能取决于解释,是三个不同的东西)只是通过访问页面。

服务器可以而且应该(根据 HTTP 1.1 协议)发送Last-Modified header,您可以通过几种方式找到它,例如使用Rex Swain’s HTTP Viewer。但是,根据协议,这只是

"源服务器认为上次修改变体的日期和时间。"

该协议实际上增加了:

此头字段的确切含义取决于源服务器的实现和原始资源的性质。对于文件,它可能只是文件系统的最后修改时间。对于具有动态包含部分的实体,它可能是其组成部分的最后修改时间集中的最新时间。对于数据库网关,它可能是记录的最后更新时间戳。对于虚拟对象,它可能是内部状态的最后更改时间。

实际上,网页经常从内容管理系统或其它系统动态地创建,并且在这种情况下,Last-Modified报头通常示出创建响应的数据戳,其通常非常接近请求的时间,这意味着报头在这种情况下实际上是无用的。

即使在“静态”页面的情况下(服务器只是选择与请求匹配的文件并将其发送),Last-Modified日期戳通常也仅指示对服务器上文件的最后一次写访问。这可能与从备份副本还原文件的时间有关,或者与在服务器上编辑文件而不对内容进行任何更改的时间有关,或者与上一次更改后的时间相同。

65

打开浏览器控制台 (?) 并输入以下内容:

javascript:alert(document.lastModified)
18

还有另一种方法来找到页面更新,这可能是有用的一些场合(如果作品:)。

如果页面已被 Google 或Wayback Machine索引,则可以尝试找出它们保存的日期(这些方法不适用于任何页面,并且有一些限制,在此 webs.stackexchangequestion's answers中进行了广泛的研究。但是在许多情况下,它们可以帮助您找出页面更新日期:

谷歌方式:通过链接https://www.google.com.ua/search?q=site%3Awww.example.com&biw=1855&bih=916&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000%2Ccd_max%3A&tbm=

您可以通过所需的任何页面 URL 更改搜索字段中的文本。

For example, the current stackoverflow question page search gives us as a result May 14, 2014 - which is the question creation date: enter image description here

回程机器方式:通过链接https://web.archive.org/web/*/www.example.com

对于此 stackoverflow 页面 wayback machinegives us更多结果:Saved 6 times between June 7, 2014 and November 23, 2016.,您可以查看每个日期的所有保存的副本

4

要检查Last Modified头,可以使用httpie(docs)。

安装

pip install httpie --user

用法

$ http -h https://martin-thoma.com/author/martin-thoma/ | grep 'Last-Modified\|Date'
Date: Fri, 06 Jan 2017 10:06:43 T
Last-Modified: Fri, 06 Jan 2017 07:42:34 T

Date很重要,因为它报告的是服务器时间,而不是您的本地时间。此外,并非每个服务器都发送Last-Modified(例如,超级用户似乎没有这样做)。

本站系公益性非盈利分享网址,本文来自用户投稿,不代表码文网立场,如若转载,请注明出处

(961)
PHP版本 其中包括时区亚洲/北京
上一篇
在 Powershell中创建日志文件
下一篇

相关推荐

发表评论

登录 后才能评论

评论列表(4条)