3. Principles of the Same-Origin Policy (同源策略的原则)

许多用户代理 (user agent) 代表远程方执行操作。例如, HTTP 用户代理遵循重定向 (redirect), 这是来自远程服务器的指令, 而 HTML 用户代理向从远程服务器检索的脚本暴露丰富的文档对象模型 (Document Object Model, DOM) 接口。

如果没有任何安全模型, 用户代理可能会执行对用户或其他方有害的操作。随着时间的推移, 许多与 Web 相关的技术已经趋向于一个通用的安全模型, 通俗地称为"同源策略 (same-origin policy)"。尽管这种安全模型在很大程度上是自然演化而来的, 但同源策略可以通过少数几个关键概念来理解。本节介绍这些概念, 并提供有关如何安全使用这些概念的建议。

3.1 Trust (信任)

同源策略通过 URI 指定信任关系。例如, HTML 文档使用 URI 指定要运行哪个脚本:

<script src="https://example.com/library.js"></script>

当用户代理处理这个元素时, 用户代理将获取指定 URI 的脚本, 并使用文档的特权 (privilege) 执行该脚本。通过这种方式, 文档将其拥有的所有特权授予由 URI 指定的资源。本质上, 文档声明它信任从该 URI 检索的信息的完整性 (integrity)。

除了从 URI 导入库之外, 用户代理还向由 URI 指定的远程方发送信息。例如, 考虑 HTML 表单元素:

<form method="POST" action="https://example.com/login">
 ... <input type="password"> ...
</form>

当用户输入其密码并提交表单时, 用户代理将密码发送到由 URI 指定的网络端点。通过这种方式, 文档将其秘密数据导出到该 URI, 本质上声明它信任发送到该 URI 的信息的机密性 (confidentiality)。

在设计使用同源策略的新协议时, 请确保重要的信任区分在 URI 中可见。例如, 如果 TLS (传输层安全, Transport Layer Security) 和非 TLS 保护的资源都使用 "http" URI 方案 (如 [RFC2817] 中所述), 文档将无法指定它希望仅通过 TLS 检索脚本。通过使用 "https" URI 方案, 文档能够表明它们希望与受保护的资源进行交互, 这些资源可以免受主动网络攻击者的攻击。

3.2 Origin (源)

原则上, 用户代理可以将每个 URI 视为一个单独的保护域 (protection domain), 并要求从一个 URI 检索的内容与另一个 URI 交互时需要明确同意。不幸的是, 这种设计对开发人员来说很麻烦, 因为 Web 应用程序通常由多个协同工作的资源组成。

相反, 用户代理将 URI 组合到称为"源 (origin)"的保护域中。粗略地说, 如果两个 URI 具有相同的方案 (scheme), 主机 (host) 和端口 (port), 则它们是同一源的一部分 (即, 代表相同的主体, principal)。(有关完整详细信息, 请参见第 4 节。)

问: 为什么不只使用主机 (host)?

答: 在源元组 (origin tuple) 中包含方案 (scheme) 对于安全性至关重要。如果用户代理不包括方案, 则 http://example.com 和 https://example.com 之间将没有隔离, 因为两者具有相同的主机。但是, 如果没有这种隔离, 主动网络攻击者可能会破坏从 http://example.com 检索的内容, 并让该内容指示用户代理损害从 https://example.com 检索的内容的机密性和完整性, 从而绕过 TLS [RFC5246] 提供的保护。

问: 为什么使用完全限定域名 (fully qualified host name) 而不只是"顶级"域?

答: 尽管 DNS 具有层次化委托 (hierarchical delegation), 但主机名之间的信任关系因部署而异。例如, 在许多教育机构中, 学生可以在 https://example.edu/~student/ 托管内容, 但这并不意味着学生编写的文档应该与托管在 https://grades.example.edu/ 的成绩管理 Web 应用程序成为同一源的一部分 (即, 驻留在同一保护域中)。

example.edu 的部署说明, 按源分组资源并不总是与每个部署场景完美对齐。在此部署中, 每个学生的网站都驻留在同一源中, 这可能不是理想的。从某种意义上说, 源粒度 (origin granularity) 是安全模型演化方式的历史遗留产物。

3.2.1 Examples (示例)

以下所有资源具有相同的源:

http://example.com/
http://example.com:80/
http://example.com/path/file

每个 URI 都具有相同的方案, 主机和端口组件。

以下每个资源的源都与其他资源不同:

http://example.com/
http://example.com:8080/
http://www.example.com/
https://example.com:80/
https://example.com/
http://example.org/
http://ietf.org/

在每种情况下, 方案, 主机和端口组件中至少有一个与列表中的其他组件不同。

3.3 Authority (权限)

尽管用户代理将 URI 分组为源, 但并非源中的每个资源都具有相同的权限 (authority) (在"权限"一词的安全意义上, 而不是 [RFC3986] 意义上)。例如, 图像是被动内容 (passive content), 因此不具有权限, 这意味着图像无法访问其源可用的对象和资源。相比之下, HTML 文档具有其源的完全权限, 文档内的 (或导入到) 脚本可以访问其源中的每个资源。

用户代理通过检查资源的媒体类型 (media type) 来确定授予资源多少权限。例如, 媒体类型为 image/png 的资源被视为图像, 媒体类型为 text/html 的资源被视为 HTML 文档。

在托管不受信任的内容 (如用户生成的内容) 时, Web 应用程序可以通过限制其媒体类型来限制该内容的权限。例如, 将用户生成的内容作为 image/png 提供比作为 text/html 提供的风险要小。当然, 许多 Web 应用程序在其 HTML 文档中包含不受信任的内容。如果处理不当, 这些应用程序可能会将其源的权限泄漏给不受信任的内容, 这是一个通常称为跨站脚本 (cross-site scripting) 的漏洞。

3.3.1 Pitfalls (陷阱)

在设计 Web 平台的新部分时, 请注意不要不考虑媒体类型就授予资源权限。许多 Web 应用程序使用受限的媒体类型提供不受信任的内容。授予这些内容权限的新 Web 平台功能可能会将漏洞引入现有应用程序。相反, 最好将权限授予已经拥有源的完全权限的媒体类型, 或授予专门设计用来承载新权限的新媒体类型。

为了与提供不正确媒体类型的服务器保持兼容, 一些用户代理采用"内容嗅探 (content sniffing)", 并将内容视为具有与服务器提供的媒体类型不同的媒体类型。如果处理不当, 内容嗅探可能会导致安全漏洞, 因为用户代理可能会授予低权限媒体类型 (如图像) 高权限媒体类型 (如 HTML 文档) 的特权 [SNIFF]。

3.4 Policy (策略)

一般来说, 用户代理隔离不同的源, 并允许源之间进行受控通信。用户代理如何提供隔离和通信的细节取决于多个因素。

3.4.1 Object Access (对象访问)

用户代理暴露的大多数对象 (也称为应用程序编程接口或 API) 仅对同一源可用。具体来说, 从一个 URI 检索的内容可以访问与从另一个 URI 检索的内容相关联的对象, 当且仅当这两个 URI 属于同一源, 例如, 具有相同的方案, 主机和端口。

这个一般规则有一些例外。例如, HTML 的 Location 接口的某些部分可以跨源使用 (例如, 允许导航其他浏览上下文, browsing context)。再例如, HTML 的 postMessage 接口明确跨源可见, 以促进跨源通信。将对象暴露给外部源是危险的, 应该非常小心地进行, 因为这样做会将这些对象暴露给潜在的攻击者。

3.4.2 Network Access (网络访问)

对网络资源的访问取决于这些资源是否与尝试访问它们的内容属于同一源。

一般来说, 禁止从另一个源读取信息。但是, 允许一个源使用从其他源检索的某些类型的资源。例如, 允许源执行脚本, 渲染图像, 并应用来自任何源的样式表。同样, 源可以显示来自另一个源的内容, 例如 HTML 框架中的 HTML 文档。网络资源也可以选择让其他源读取其信息, 例如, 使用跨源资源共享 (Cross-Origin Resource Sharing, CORS) [CORS]。在这些情况下, 通常按每个源的基础授予访问权限。

允许向另一个源发送信息。但是, 以任意格式通过网络发送信息是危险的。因此, 用户代理限制文档使用特定协议发送信息, 例如在没有自定义头部的 HTTP 请求中。扩展允许的协议集, 例如, 通过添加对 WebSocket 的支持, 必须小心进行以避免引入漏洞 [RFC6455]。

3.4.3 Pitfalls (陷阱)

每当用户代理允许一个源与来自另一个源的资源交互时, 它们就会引发安全问题。例如, 显示来自另一个源的图像的能力会泄漏它们的高度和宽度。同样, 向另一个源发送网络请求的能力会引起跨站请求伪造 (cross-site request forgery, CSRF) 漏洞 [CSRF]。但是, 用户代理实现者通常会在这些风险与允许跨源交互的好处之间取得平衡。例如, 阻止跨源网络请求的 HTML 用户代理将阻止其用户跟随超链接, 而这是 Web 的核心功能。

在向 Web 平台添加新功能时, 授予一个资源特权但拒绝授予同一源中的另一个资源特权可能很诱人。但是, 以这种方式拒绝授予特权是无效的, 因为没有特权的资源通常仍然可以获得该特权, 因为用户代理不会隔离源内的资源。相反, 应该将特权授予或拒绝授予整个源 (而不是区分源内的各个资源) [BOFGO]。

3.5 Conclusion (结论)

同源策略使用 URI 指定信任关系。URI 被分组到源中, 源代表保护域。源中的某些资源 (例如, 主动内容, active content) 被授予源的完全权限, 而源中的其他资源 (例如, 被动内容, passive content) 则不被授予源的权限。承载其源权限的内容被授予访问其自己源内的对象和网络资源的权限。此内容还被授予对其他源的对象和网络资源的有限访问权限, 但这些跨源特权必须仔细设计以避免安全漏洞。

📊 翻译质量自检

段落对齐: 原文 18 段 = 译文 18 段
链接格式: 所有章节标题已转为链接
术语双语: 首次术语已标注双语
RFC 2119: 关键词已合理翻译
MDX 安全: URL 已包裹反引号, HTML 已自闭合
标点规范: 已符合中文使用英文标点规范
清理杂项: 已移除页码/页眉
语言纯净: 内容为真实的简体中文, 无其他语言混入
目录正确: 文件已放置在 zh-Hans 目录中

📍 当前进度

RFC 编号: 6454
目标语言: 🇨🇳 简体中文 (zh-Hans)
已完成章节: 1, 2, 3
当前章节: 3 (完成)
总体进度: 30%