有没有办法找出自网页更改以来已经过去了多少时间?
例如,我有一个页面托管在:www.mywebsitenotupdated.com
有没有办法找出这个 HTML 页面被上传到服务器?
我无法访问服务器;只是指向网页的链接。
不,你不能知道什么时候页面最后更新或最后更改或上传到服务器(这可能取决于解释,是三个不同的东西)只是通过访问页面。
服务器可以而且应该(根据 HTTP 1.1 协议)发送Last-Modified
header,您可以通过几种方式找到它,例如使用Rex Swain’s HTTP Viewer。但是,根据协议,这只是
"源服务器认为上次修改变体的日期和时间。"
该协议实际上增加了:
此头字段的确切含义取决于源服务器的实现和原始资源的性质。对于文件,它可能只是文件系统的最后修改时间。对于具有动态包含部分的实体,它可能是其组成部分的最后修改时间集中的最新时间。对于数据库网关,它可能是记录的最后更新时间戳。对于虚拟对象,它可能是内部状态的最后更改时间。
实际上,网页经常从内容管理系统或其它系统动态地创建,并且在这种情况下,Last-Modified
报头通常示出创建响应的数据戳,其通常非常接近请求的时间,这意味着报头在这种情况下实际上是无用的。
即使在“静态”页面的情况下(服务器只是选择与请求匹配的文件并将其发送),Last-Modified
日期戳通常也仅指示对服务器上文件的最后一次写访问。这可能与从备份副本还原文件的时间有关,或者与在服务器上编辑文件而不对内容进行任何更改的时间有关,或者与上一次更改后的时间相同。
打开浏览器控制台 (?) 并输入以下内容:
javascript:alert(document.lastModified)
还有另一种方法来找到页面更新,这可能是有用的一些场合(如果作品:)。
如果页面已被 Google 或Wayback Machine索引,则可以尝试找出它们保存的日期(这些方法不适用于任何页面,并且有一些限制,在此 webmasters.stackexchangequestion's answers中进行了广泛的研究。但是在许多情况下,它们可以帮助您找出页面更新日期:
您可以通过所需的任何页面 URL 更改搜索字段中的文本。
For example, the current stackoverflow question page search gives us as a result May 14, 2014 - which is the question creation date:
回程机器方式:通过链接https://web.archive.org/web/*/www.example.com
对于此 stackoverflow 页面 wayback machinegives us更多结果:Saved 6 times between June 7, 2014 and November 23, 2016.
,您可以查看每个日期的所有保存的副本
要检查Last Modified
头,可以使用httpie
(docs)。
安装
pip install httpie --user
用法
$ http -h https://martin-thoma.com/author/martin-thoma/ | grep 'Last-Modified\|Date'
Date: Fri, 06 Jan 2017 10:06:43 T
Last-Modified: Fri, 06 Jan 2017 07:42:34 T
Date
很重要,因为它报告的是服务器时间,而不是您的本地时间。此外,并非每个服务器都发送Last-Modified
(例如,超级用户似乎没有这样做)。
本站系公益性非盈利分享网址,本文来自用户投稿,不代表码文网立场,如若转载,请注明出处
评论列表(84条)