Zum Hauptinhalt springen

Anhang B: Parsing einer URI-Referenz mit einem regulären Ausdruck (Parsing a URI Reference with a Regular Expression)

Der folgende reguläre Ausdruck kann eine URI-Referenz in ihre Komponenten zerlegen:

^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?
12 3 4 5 6 7 8 9

Komponenten-Zuordnung:

  • $1 = scheme:
  • $2 = scheme
  • $3 = //authority
  • $4 = authority
  • $5 = path
  • $6 = ?query
  • $7 = query
  • $8 = #fragment
  • $9 = fragment

Beispiel: http://www.ics.uci.edu/pub/ietf/uri/#Related

  • scheme = http
  • authority = www.ics.uci.edu
  • path = /pub/ietf/uri/
  • query = (undefiniert)
  • fragment = Related