01统一资源定位系统
url是统一资源定位系统(uniform resource locator;URL)的简称,是因特网的万维网服务程序上用于指定信息位置的表示方法。它最初是由蒂姆·伯纳斯·李发明用来作为万维网的地址。现在它已经被万维网联盟编制为互联网标准RFC1738。
因特网上的可用资源可以用简单字符串来表示,而这些字符串则被称为:“统一资源定位器”(URL)。URL是由一串字符组成,这些字符可以是字母,数字和特殊符号。
URL 包含以下信息:
1.用于访问资源的协议
2.服务器的位置(无论是通过 IP 地址还是域名)
3.服务器上的端口号(可选)
4.资源在服务器目录结构中的位置
5.片段标识符(可选)
也称为统一资源定位器(URL)或 Web 地址。URL 是一种统一资源标识符(URI)。通常,术语 URI 不使用,或与 URL 同义使用,即使这在技术上是不正确的。
Tim Berners-Lee 和互联网工程任务组工作组在 1994 年开发了 URL。它在 RFC 1738 中正式指定。在因特网的历史上,统一资源定位符(URL)的发明是一个非常基础的步骤。统一资源定位符的语法是一般的,可扩展的,它使用 ASCII 代码的一部分来表示互联网的地址。一般统一资源定位符的开始标志着一个计算机网络所使用的网络协议。
统一资源定位符是统一资源标志符的一个下种。统一资源标志符确定一个资源,而统一资源定位符不但确定一个资源,而且还表示出它在哪里。
一个URL可以用多种方法来表现,例如:纸上的字迹,或者是用字符集编码的八位字节序列。URL的解释仅取决于所用字符的特性。在大多数URL方案中,都是使用URL不同部分的字符序列来代表因特网协议中所使用的八位字节序列。例如,在ftp方案中主机名,目录名和文件名就是这样的八位字节序列,它们用URL的不同部分代表。在这些部分里,一个八位字节数可以用这样的字符来表示:该字符在US—ASCII[20]编码字符集中的编码是这个八位字节数。另外,八位字节数可以被编成如下形式的代码:“%”后加两个十六进制数字(来自于“0123456789ABCDEF”),这两个十六进制数字代表了这八位字节数的值。(字符“abcdef”也可以用于十六进制编码)。如果存在下面的情况:八位字节数在US-ASCII字符集中没有相应的可显示字符,或者使用相应字符会产生不安全因素,或者相应的字符被保留用于特定的URL方案的解释,那么它们必须被编成代码。
URL通常被写成如下形式:<方案>:<方案描述部分>
一个URL包含了它使用的方案名称(<方案>), 其后紧跟一个冒号,然后是一个字符串(<方案描述部分>),这部分的解释由所使用的方案来决定。方案名称由一串字符组成。小写字母“a”——“z”,数字,字符加号(“+”),句点(“.”)和连字号(“-”)都可以。为了方便起见,程序在解释URL的时候应该视方案名称中的大写字母和小写字母一样。(例如:视“HTTP”和“http”一样)。