data:image/s3,"s3://crabby-images/25931/2593108af4eb80a75dce8b39dd01c998e4b92c8b" alt="Java核心技术·卷Ⅱ:高级特性(原书第10版)"
4.4.1 URL和URI
URL和URLConnection类封装了大量复杂的实现细节,这些细节涉及如何从远程站点获取信息。例如,可以自一个字符串构建一个URL对象:
data:image/s3,"s3://crabby-images/91d9e/91d9e7ab571b5523947da35586c587fc9677428e" alt=""
如果只是想获得该资源的内容,可以使用URL类中的openStream方法。该方法将产生一个InputStream对象,然后就可以按照一般的用法来使用这个对象了,比如用它构建一个Scanner对象:
data:image/s3,"s3://crabby-images/f39d9/f39d9dcf15ba4910e14b811f8691a3a9d85476bc" alt=""
java.net包对统一资源定位符(Uniform Resource Locator,URL)和统一资源标识符(Uniform Resource Identifier,URI)作了非常有用的区分。
URI是个纯粹的语法结构,包含用来指定Web资源的字符串的各种组成部分。URL是URI的一个特例,它包含了用于定位Web资源的足够信息。其他URI,比如
data:image/s3,"s3://crabby-images/8a5fa/8a5fad6dbe4cf6af6f4ef98d6bc88532fcd932e9" alt=""
则不属于定位符,因为根据该标识符我们无法定位任何数据。像这样的URI我们称之为URN(uniform resource name,统一资源名称)。
在Java类库中,URI类并不包含任何用于访问资源的方法,它的唯一作用就是解析。但是,URL类可以打开一个到达资源的流。因此,URL类只能作用于那些Java类库知道该如何处理的模式,例如http:、https:、ftp:、本地文件系统(file:)和JAR文件(jar:)。
要想了解为什么对URI进行解析并非小事一桩,那么考虑一下URL会变得多么复杂。例如,
data:image/s3,"s3://crabby-images/b9cde/b9cde0b38064742c5c4c93d53bf1bbb4e8cbf075" alt=""
URI规范给出了标记这些标识符的规则。一个URI具有以下句法:
data:image/s3,"s3://crabby-images/f7ba5/f7ba519e83e393e37391b525b1cd1a324e9d0ce9" alt=""
上式中,[...]表示可选部分,并且:和#可以被包含在标识符内。
包含scheme:部分的URI称为绝对URI。否则,称为相对URI。
如果绝对URI的schemeSpecificPart不是以/开头的,我们就称它是不透明的。例如:
data:image/s3,"s3://crabby-images/39789/397899ab2a496c6e73437d3a14827c2e6f1614af" alt=""
所有绝对的透明URI和所有相对URI都是分层的(hierarchical)。例如:
data:image/s3,"s3://crabby-images/da740/da740f05853c97aaad01f3f0b72aaa41763cf4c5" alt=""
一个分层URI的schemeSpecificPart具有以下结构:
data:image/s3,"s3://crabby-images/c5555/c5555f1c7a61c96797678cff140ca17406a010d2" alt=""
在这里,[...]同样表示可选的部分。
对于那些基于服务器的URI,authority部分具有以下形式:
data:image/s3,"s3://crabby-images/d71a2/d71a23f9a6a0e1b06becaba507d92b8425c8b8ef" alt=""
port必须是一个整数。
RFC 2396(标准化URI的文献)还支持一种基于注册表的机制,此时authority采用了一种不同的格式。不过,这种情况并不常见。
URI类的作用之一是解析标识符并将它分解成各种不同的组成部分。你可以用以下方法读取它们:
data:image/s3,"s3://crabby-images/e4c3e/e4c3ef7d890024b5c52fff2c03943fe5d757dcd0" alt=""
URI类的另一个作用是处理绝对标识符和相对标识符。如果存在一个如下的绝对URI:
data:image/s3,"s3://crabby-images/565f1/565f1bb7a7b220457af0b76c7efa15bccba7d5c5" alt=""
和一个如下的相对URI:
data:image/s3,"s3://crabby-images/bd53b/bd53bf1722cbc84fddae4e0584a026e969f4a53a" alt=""
那么可以用它们组合出一个绝对URI:
data:image/s3,"s3://crabby-images/fe772/fe772050c9fd1f731f8048d13f4cc957bb87dced" alt=""
这个过程称为解析相对URL。
与此相反的过程称为相对化(relativization)。例如,假设有一个基本URI:
data:image/s3,"s3://crabby-images/e51f7/e51f7ae3d80eaf65a48d21a6f73fe01507e3883f" alt=""
和另一个URI:
data:image/s3,"s3://crabby-images/df287/df287247aab65d06485cf1fc879a2b8877a07742" alt=""
那么相对化之后的URI就是:
data:image/s3,"s3://crabby-images/cc211/cc21146b4896afbebe650fd0d9860b097ca2a27e" alt=""
URI类同时支持以下两个操作:
data:image/s3,"s3://crabby-images/d71da/d71dae75da85abf621a22e6b37bb5e833ef27f56" alt=""