使用
URL是Uniform Resource Locator的縮寫,譯為“統一資源定位符”。
◇URL的格式
URL的格式由下列三部分組成:
第一部分是協議(或稱為服務方式);
第二部分是存有該資源的主機IP地址(有時也包括端口号);
第三部分是主機資源的具體地址。,如目錄和文件名等。
第一部分和第二部分之間用“://”符号隔開,第二部分和第三部分用“/”符号隔開。第一部分和第二部分是不可缺少的,第三部分有時可以省略。
◇URL示例
文件的URL:
用URL表示文件時,服務器方式用file表示,後面要有主機IP地址、文件的存取路徑(即目錄)和文件名等信息。有時可以省略目錄和文件名,但“/”符号不能省略。
例:file://a:1234/b/c/d.txt
代表獲取資源使用ftp協議,資源目标是a主機的1234端口的b目錄下的c目錄下的d.txt。
HTTP的URL已經在URI的組成中做過示範,在此不再陳述。
區别
URI、URL和URN
URL:Uniform Resource Identifier,統一資源标識符;
URL:Uniform Resource Locator,統一資源定位符;
URN:Uniform Resource Name,統一資源名稱。
其中,URL,URN是URI的子集。
Web上地址的基本形式是URI,它代表統一資源标識符。有兩種形式:
URL:目前URI的最普遍形式就是無處不在的URL或統一資源定位器。
URN:URL的一種更新形式,統一資源名稱(URN, Uniform Resource Name)不依賴于位置,并且有可能減少失效連接的個數。但是其流行還需假以時日,因為它需要更精密軟件的支持。
URI是以某種統一的(标準化的)方式标識資源的簡單字符串。
典型情況下,這種字符串以scheme(命名URI的名字空間的标識符——一組相關的名稱)開頭,語法如下:
[scheme:] scheme-specific-part
URI以scheme和冒号開頭。Scheme用大寫/小寫字母開頭,後面為空或者跟着更多的大寫/小寫字母、數字、加号、減号和點号。冒号把scheme與scheme-specific-part分開了,并且scheme-specific-part的語法和語義(意思)由URI的名字空間決定。如下面的例子:
http://域名,其中http是scheme,//域名是scheme-specific-part,并且它的scheme與scheme-specific-part被冒号分開了。
URI有絕對和相對之分,絕對的URI指以scheme(後面跟着冒号)開頭的URI。前面提到的http://域名就是絕對的URI的一個例子,其它的例子還有mailto:[email protected]、news:地址和xyz://whatever。你可以把絕對的URI看作是以某種方式引用某種資源,而這種方式對标識符出現的環境沒有依賴。如果使用文件系統作類比,絕對的URI類似于從根目錄開始的某個文件的徑。
與絕對的URI不同的,相對的URI不是以scheme(後面跟着冒号)開始的URI。它的一個例子是articles/articles.html。你可以把相對的URI看作是以某種方式引用某種資源,而這種方式依賴于标識符出現的環境。如果用文件系統作類比,相對的URI類似于從當前目錄開始的文件路徑。
URL是Uniform Resource Location的縮寫,譯為"統一資源定位符"。通俗地說,URL是Internet上用來描述信息資源的字符串,主要用在各種WWW客戶程序和服務器程序上,特别是著名的Mosaic。采用URL可以用一種統一的格式來描述各種信息資源,包括文件、服務器的地址和目錄等。
目前最大的缺點是當信息資源的存放地點發生變化時,必須對URL作相應的改變。因此人們正在研究新的信息資源表示方法,例如:URI(Universal Resource Identifier)即"通用資源标識"(參見RFC 1630)、URN(Uniform Resource Name)即"統一資源名"和URC(Uniform Resource Citation)即"統一資源引用符"等。
URI還在進一步的研究當中。研究的方向就是彌補URL的缺點。
與URN
URI可被視為定位符(URL),名稱(URN)或兩者兼備。統一資源名(URN)如同一個人的名稱,而統一資源定位符(URL)代表一個人的住址。換言之,URN定義某事物的身份,而URL提供查找該事物的方法。URN僅用于命名,而不指定地址。
用于标識唯一書目的ISBN系統是一個典型的URN使用範例。例如,ISBN 0486275574(urn:isbn:0-486-27557-4)無二義性地标識出莎士比亞的戲劇《羅密歐與朱麗葉》的某一特定版本。為獲得該資源并閱讀該書,人們需要它的位置,也就是一個URL地址。在類Unix操作系統中,一個典型的URL地址可能是一個文件目錄,例如file:///home/username/RomeoAndJuliet.pdf。該URL标識出存儲于本地硬盤中的電子書文件。因此,URL和URN有着互補的作用。
技術觀點
URL是标識一個互聯網資源,并指定對其進行操作或取得該資源的方法的URI。可能通過對主要訪問手段的描述,也可能通過網絡“位置”進行标識。例如一個URL,标識一個特定資源(首頁)并表示該資源的某種形式(例如以編碼字符表示的,首頁的HTML代碼)是可以通過URL指定的網絡主機獲得的。URN是基于某命名空間通過名稱指定資源的URI。人們可以通過URN來指出某個資源,而無需指出其位置和獲得方式。資源無需是基于互聯網的。例如,URN urn:isbn:0-395-36341-1指定标識系統(即國際标準書号ISBN)和某資源在該系統中的唯一表示的URI。它可以允許人們在不指出其位置和獲得方式的情況下談論這本書。
技術刊物,特别是IETF和W3C發布的标準中,基本不再使用“URL”這一術語,因為很少需要區别URL和URI。但是,在非技術文獻和萬維網軟件中,URL這一術語仍被廣泛使用。此外,術語“網址”在非技術文獻中時常作為URL或URI的同義詞出現,雖然往往其指代的隻是“http”和“https”協議。
RFC3305
關于URI的讨論多源于題目為《W3C/IETF URI規劃聯合小組報告:統一标識資源符(URI),URL和統一資源名(URN):闡明與建議》的RFC3305文件。這一RFC文件描述了一個,以統一W3C和IETF内部對于各種“UR*”術語之間關系的不同看法為目的而設立的,W3C/IETF聯合工作小組的工作。雖然未作為标準被這兩個組織所發布,但該文件确立了上述種種共識,并就此催生了許多标準的誕生。
相關介紹
發展
URI與URL有着共同的曆史。在1990年,Tim Berners-Lee的關于超文本的提案間接地引入了使用URL作為一個表示超鍊接目标資源的短字符串的概念。當時,人們稱之為“超文本名”或“文檔名”。
在之後的三年半中,由于萬維網的HTML(超文本标記語言)核心技術、HTTP與浏覽器都得到了發展,區别提供資源訪問和資源标記的兩種字符串的必要性開始顯現。雖然其時尚未被正式定義,但“統一資源定位符”這一術語開始被用于代表前者,而後者則由“統一資源名稱”所表示。
在關于定義URL和URN的争論中,人們注意到兩者事實上基于同一個基礎的“資源标識”的概念。在1994年6月,IETF發布了Berners-Lee的RFC 1630,(非正式地)指出了URL和URN的存在,并進一步定義了“通用資源标識符”——語義和語法由具體協議規定的類URL字符串的規範文法。此外,該RFC文檔亦嘗試定義了其時正被使用着的URL協議的文法,同時指出(但并未标準化)了相對URL和片段标識符的存在。
标準改良
1994年12月,RFC 1738 正式定義了絕對和相對URL,改進了URL文法,定義了如何解析URL為絕對形式,并更加完善地列舉了其時正處于使用中的URL協議。而URN定義和文法直到1997年5月RFC 2141公布後才正式統一。
1998年8月,随着RFC 2396的發表,URI文法形成了獨立的标準,同時RFC 1630和1738中關于URI和URL的許多部分也得到了修訂和增補。新RFC修改了“URI”中“U”的含義:它開始代表統一(Uniform)而不再是通用(Universal)。RFC 1738中總結了既存URL協議的部分被移至另外一篇獨立文檔中。IANA保留着這些協議的注冊信息,而RFC 2717首次描述了注冊它們的流程。
在1999年12月,RFC 2732對RFC 2396進行了小幅更新,開始允許URI包括IPv6地址。一段時間以後,在兩個标準中暴露出的一些問題促使了一系列的修訂草案的發展,這些草案被統稱為rfc2396bis。這一由RFC 2396的共同作者Roy Fielding引導協調的集體努力,由2005年1月RFC 3986的發布推至了頂峰。該RFC文檔成為了現今(2009年)于互聯網上被推薦使用的URI文法版本,并使得RFC 2396成為了曆史。然而,它卻并未替代現有的URL協議細節;RFC 1738繼續管轄着大多數協議,除了某些已被它取而代之的場合——例如被RFC 2616改良的”HTTP”協議等。與此同時,IETF發布了RFC 3986,亦即完整的STD 66标準,标識着URI通用文法正式成官方因特網協議。
在2002年8月,RFC 3305指出,雖然術語“URL”仍被廣泛地用于日常用語之中,但其本身已幾乎被廢棄。其功用,僅是作為對于某些URI因包含某種指示着網絡可達性的協議而作為地址存在的提醒而已。基于URI的衆多标準,例如資源描述框架等,已經清楚地表明,資源标識本無需指出通過互聯網獲得資源副本的方法,亦無須指出資源是否基于網絡。
在2006年2月,RFC 4395用了15頁詳細闡述了《關于新的URI方案的指導方針和登記程序》
在2006年11月1日,W3C技術架構小組公布了《連接替代副本使查找和發布可行化》,一個對于發布給定資源的多個版本的權威URI和其最佳實踐的指導。例如,内容可能因用于訪問資源的設備的支持性和設定不同,而語言或大小上有所調整已适應這種差異。
與XML命名空間
XML擁有一個叫命名空間的,一個可包含元素集和屬性名稱的抽象域的概念。命名空間的名稱(一個必須遵守通用URI文法的字符串)用于标識一個XML命名空間。但是,命名空間的名稱一般不被認為是一個URI,因為URI規範定義了字符串的“URI性”是根據其目的而不是其詞法組成決定的。一個命名空間名稱同時也并不一定暗示任何URI協議的語義;例如,一個以”http:”開頭的命名空間名稱很可能與HTTP協議沒有任何關系。XML專家們就這一問題在XML開發電子郵件列表上進行了深入的辯論;一部分人認為命名空間名稱可以是URI,由于包含一個具體命名空間的名稱集可以被看作是一個被标識的資源,也由于“XML中的命名空間”規範的一個版本指出過命名空間名稱“是”一個URI引用。但是,集體共識似乎指出一個命名空間名稱隻是一個湊巧看起來像URI的字符串,僅此而已。
早先,命名空間名稱是可以匹配任何非空URI引用的語法的,但後來的一個對于“XML命名空間建議”的訂正廢棄了相對URI引用的使用。一個獨立的、針對XML1.1的命名空間的規範允許使用IRI引用作為命名空間名稱的基準,而不僅是URI引用。
為了消除XML新人中産生的對于URI(尤其是HTTP URL)的使用的困惑,一個被稱為RDDL(資源目錄描述語言)的描述語言被建立了,雖然RDDL的規範并沒有正式地位,也并沒有獲得任何相關組織(例如W3C)的檢查和支持。一個RDDL文檔可以提供關于一個特定命名空間和使用它的XML文檔的,機器與人類都能讀懂的信息。XML文檔的作者鼓勵使用RDDL文檔,這樣一旦文檔中的命名空間名稱被索引,(系統)就會取得一個RDDL文檔。這樣,許多開發者對于讓命名空間名稱指向網絡可達資源的需求就能得到滿足。



















