HTML转义字符:xss攻击与HTML字符的转义和反转义
Author:zhoulujun Date:
xss与转义符
xss简单来说:
XSS 攻击是页面被注入了恶意的代码
XSS 漏洞是 可以让攻击者注入恶意代码可执行的漏洞
具体参看之前写的:
web开发前端安全问题总结——web前端安全问题汇总 https://www.zhoulujun.cn/html/webfront/SGML/web/2017_0503_8004.html
前端安全配置xss预防针Content-Security-Policy(csp)配置详解 https://www.zhoulujun.cn/html/webfront/SGML/web/2017_0503_8004.html
script新属性integrity与web安全,再谈xss https://www.zhoulujun.cn/html/webfront/ECMAScript/js6/2018_0521_8115.html
为了xss,常见的转义符
字符 | 转义后的字符 |
---|---|
& | & |
< | < |
> | > |
" | " |
' | ' |
/ | / |
转义只是防止xss攻击的一种手段之一,更多请查看:《web开发前端安全问题总结——web前端安全问题汇总》
html转义与反转义方法
html转义
lodashjs
lodashjs作为常用,集成了escape 方法
https://www.lodashjs.com/docs/lodash.escape
DOM API
转义方法
let textNode = document.createTextNode(`<script src='https://www.zhoulujun.cn/xxs.js'></script>`); let div = document.createElement('div') div.append(textNode); console.log(div.innerHTML);
反转义方法
let str = `<script src='let doc = new DOMParser().parseFromString(str, 'text/html'); console.log(doc.documentElement.textContent);
字符串替换处理 转义与反转义
就是正则替换,这里想不讲了,能用库太多了,去看一下源码就好了
HTML常用转义字符对照表
最常用的字符实体 Character Entities
显示 | 说明 | 实体名称 | 实体编号 |
---|---|---|---|
半方大的空白 |   | ||
全方大的空白 |   | ||
不断行的空白格 | | ||
< | 小于 | < | < |
> | 大于 | > | > |
& | &符号 | & | & |
" | 双引号 | " | " |
© | 版权 | © | © |
® | 已注册商标 | ® | ® |
™ | 商标(美国) | ™ | ™ |
× | 乘号 | × | × |
÷ | 除号 | ÷ | ÷ |
ISO 8859-1 (Latin-1)字符集
HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。
备注:为了方便起见,以下表格中,“实体名称”简称为“名称”,“实体编号”简称为“编号”
显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ¡ | ¡ | ¡ | ¢ | ¢ | ¢ | £ | £ | £ | ¤ | ¤ | ¤ | ||
¥ | ¥ | ¥ | ¦ | ¦ | ¦ | § | § | § | ¨ | ¨ | ¨ | © | © | © |
ª | ª | ª | « | « | « | ¬ | ¬ | ¬ | ­ | ® | ® | ® | ||
¯ | ¯ | ¯ | ° | ° | ° | ± | ± | ± | ² | ² | ² | ³ | ³ | ³ |
´ | ´ | ´ | µ | µ | µ | ¶ | ¶ | ¶ | · | · | · | ¸ | ¸ | ¸ |
¹ | ¹ | ¹ | º | º | º | » | » | » | ¼ | ¼ | ¼ | ½ | ½ | ½ |
¾ | ¾ | ¾ | ¿ | ¿ | ¿ | À | À | À | Á | Á | Á | Â | Â | Â |
à | à | à | Ä | Ä | Ä | Å | Å | Å | Æ | Æ | Æ | Ç | Ç | Ç |
È | È | È | É | É | É | Ê | Ê | Ê | Ë | Ë | Ë | Ì | Ì | Ì |
Í | Í | Í | Î | Î | Î | Ï | Ï | Ï | Ð | Ð | Ð | Ñ | Ñ | Ñ |
Ò | Ò | Ò | Ó | Ó | Ó | Ô | Ô | Ô | Õ | Õ | Õ | Ö | Ö | Ö |
× | × | × | Ø | Ø | Ø | Ù | Ù | Ù | Ú | Ú | Ú | Û | Û | Û |
Ü | Ü | Ü | Ý | Ý | Ý | Þ | Þ | Þ | ß | ß | ß | à | à | à |
á | á | á | â | â | â | ã | ã | ã | ä | ä | ä | å | å | å |
æ | æ | æ | ç | ç | ç | è | è | è | é | é | é | ê | ê | ê |
ë | ë | ë | ì | ì | ì | í | í | í | î | î | î | ï | ï | ï |
ð | ð | ð | ñ | ñ | ñ | ò | ò | ò | ó | ó | ó | ô | ô | ô |
õ | õ | õ | ö | ö | ö | ÷ | ÷ | ÷ | ø | ø | ø | ù | ù | ù |
ú | ú | ú | û | û | û | ü | ü | ü | ý | ý | ý | þ | þ | þ |
ÿ | ÿ | ÿ |
数学和希腊字母标志
symbols, mathematical symbols, and Greek letters
显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ƒ | ƒ | ƒ | Α | Α | Α | Β | Β | Β | Γ | Γ | Γ | Δ | Δ | Δ |
Ε | Ε | Ε | Ζ | Ζ | Ζ | Η | Η | Η | Θ | Θ | Θ | Ι | Ι | Ι |
Κ | Κ | Κ | Λ | Λ | Λ | Μ | Μ | Μ | Ν | Ν | Ν | Ξ | Ξ | Ξ |
Ο | Ο | Ο | Π | Π | Π | Ρ | Ρ | Ρ | Σ | Σ | Σ | Τ | Τ | Τ |
Υ | Υ | Υ | Φ | Φ | Φ | Χ | Χ | Χ | Ψ | Ψ | Ψ | Ω | Ω | Ω |
α | α | α | β | β | β | γ | γ | γ | δ | δ | δ | ε | ε | ε |
ζ | ζ | ζ | η | η | η | θ | θ | θ | ι | ι | ι | κ | κ | κ |
λ | λ | λ | μ | μ | μ | ν | ν | ν | ξ | ξ | ξ | ο | ο | ο |
π | π | π | ρ | ρ | ρ | ς | ς | ς | σ | σ | σ | τ | τ | τ |
υ | υ | υ | φ | φ | φ | χ | χ | χ | ψ | ψ | ψ | ω | ω | ω |
? | ϑ | ϑ | ? | ϒ | ϒ | ? | ϖ | ϖ | • | • | • | … | … | … |
′ | ′ | ′ | ″ | ″ | ″ | ‾ | ‾ | ‾ | ⁄ | ⁄ | ⁄ | ℘ | ℘ | ℘ |
ℑ | ℑ | ℑ | ℜ | ℜ | ℜ | ™ | ™ | ™ | ℵ | ℵ | ℵ | ← | ← | ← |
↑ | ↑ | ↑ | → | → | → | ↓ | ↓ | ↓ | ↔ | ↔ | ↔ | ↵ | ↵ | ↵ |
⇐ | ⇐ | ⇐ | ⇑ | ⇑ | ⇑ | ⇒ | ⇒ | ⇒ | ⇓ | ⇓ | ⇓ | ⇔ | ⇔ | ⇔ |
∀ | ∀ | ∀ | ∂ | ∂ | ∂ | ∃ | ∃ | ∃ | ∅ | ∅ | ∅ | ∇ | ∇ | ∇ |
∈ | ∈ | ∈ | ∉ | ∉ | ∉ | ∋ | ∋ | ∋ | ∏ | ∏ | ∏ | ∑ | ∑ | ∑ |
− | − | − | ∗ | ∗ | ∗ | √ | √ | √ | ∝ | ∝ | ∝ | ∞ | ∞ | ∞ |
∠ | ∠ | ∠ | ∧ | ∧ | ∧ | ∨ | ∨ | ∨ | ∩ | ∩ | ∩ | ∪ | ∪ | ∪ |
∫ | ∫ | ∫ | ∴ | ∴ | ∴ | ∼ | ∼ | ∼ | ∝ | ≅ | ≅ | ≈ | ≈ | ≈ |
≠ | ≠ | ≠ | ≡ | ≡ | ≡ | ≤ | ≤ | ≤ | ≥ | ≥ | ≥ | ⊂ | ⊂ | ⊂ |
⊃ | ⊃ | ⊃ | ⊄ | ⊄ | ⊄ | ⊆ | ⊆ | ⊆ | ⊇ | ⊇ | ⊇ | ⊕ | ⊕ | ⊕ |
⊗ | ⊗ | ⊗ | ⊥ | ⊥ | ⊥ | ⋅ | ⋅ | ⋅ | ? | ⌈ | ⌈ | ? | ⌉ | ⌉ |
? | ⌊ | ⌊ | ? | ⌋ | ⌋ | ? | ⟨ | ⟨ | ? | ⟩ | ⟩ | ◊ | ◊ | ◊ |
♠ | ♠ | ♠ | ♣ | ♣ | ♣ | ♥ | ♥ | ♥ | ♦ | ♦ | ♦ |
重要的国际标记
markup-significant and internationalization characters
显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 | 显示 | 名称 | 编号 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
" | " | " | & | & | & | < | < | < | > | > | > | Œ | Œ | Œ |
œ | œ | œ | Š | Š | Š | š | š | š | Ÿ | Ÿ | Ÿ | ˆ | ˆ | ˆ |
˜ | ˜ | ˜ |   |   |   | | ‌ | | ||||||
| ‍ | | | ‎ | | | ‏ | | – | – | – | — | — | — |
‘ | ‘ | ‘ | ’ | ’ | ’ | ‚ | ‚ | ‚ | “ | “ | “ | ” | ” | ” |
„ | „ | „ | † | † | † | ‡ | ‡ | ‡ | ‰ | ‰ | ‰ | ‹ | ‹ | ‹ |
› | › | › | € | € | € |
JavaScript转义符
转义序列 | 字符 |
---|---|
\b | 退格 |
\f | 走纸换页 |
\n | 换行 |
\r | 回车 |
\t | 横向跳格 (Ctrl-I) |
\' | 单引号 |
\" | 双引号 |
\\ | 反斜杠 |
富文本通用转义字符
字符 | 十进制 | 转义字符 | 描述 |
---|---|---|---|
@ | @ | &commat | at 符号 |
© | © | © | 版权符号 |
! | ! | &excl | 感叹号 |
¡ | ¡ | ¡ | 倒置感叹号 |
: | : | &colon | 冒号 |
, | , | &comma | 逗号 |
· | · | · | 中间点 |
‘ | ' | &apos | 撇号 |
‘ | ‘ | &lsquo | 左单引号 |
“ | “ | &ldquo | 左双引号 |
( | ( | &lpar | 左括号 |
[ | [ | &lsqb | 左方括号 |
{ | { | &lcub | 左花括号 |
§ | § | § | 分节符号 |
_ | _ | &lowbar | 单下划线 |
| | | | &verbar | 竖线 |
‖ | ‖ | &Verbar | 双竖线 |
∠ | ∠ | &ang | 角 |
# | # | &num | 数字标志 |
$ | $ | &dollar | 美元符号 |
% | % | &percnt | 百分号 |
‰ | ‰ | &permil | 千分号 |
‱ | ‱ | pertenk | 万分号 |
* | * | &ast | 星号 |
/ | / | &sol | 斜线符号 |
+ | + | &add | 加号 |
× | × | × | 乘号 |
= | = | &equal | 等于号 |
≈ | ≈ | &asymp | 约等于 |
< | < | < | 小于号 |
≤ | ≤ | &le | 小于等于 |
¹ | ¹ | ¹ | 上标 1 |
² | ² | ² | 上标 2 |
³ | ³ | ³ | 上标 3 |
& | & | & | and 符号 |
® | ® | ® | 注册商标符 |
? | ? | &quest | 问号 |
¿ | ¿ | ¿ | 倒置问号 |
; | ; | &semi | 分号 |
. | . | &period | 句号 |
• | • | &bull | 加重号 |
“ | " | " | 引号 |
’ | ’ | &rsquo | 右单引号 |
” | ” | &rdquo | 右双引号 |
) | ) | &rpar | 右括号 |
] | ] | &rsqb | 右方括号 |
} | } | &rcub | 右花括号 |
¶ | ¶ | ¶ | 段落符号 |
__ | ̲ | &UnderBar | 双下划线 |
¦ | ¦ | ¦ | 间断竖线 |
… | … | &hellip | 三点省略号 |
^ | ^ | &Hat | hat符号 |
π | ρ | &pi | 圆周率 |
¥ | ¥ | ¥ | 元符号 |
° | ° | ° | 度符号 |
√ | √ | &radic | 平方根 |
∞ | ∞ | &infin | 正无穷 |
± | ± | ± | 加减符号 |
\ | &bsol | 反斜线符号 | |
– | – | &ndash | 减号 |
÷ | ÷ | ÷ | 除号 |
≠ | ≠ | &ne | 不等于 |
≡ | ≡ | &equiv | 相当于 |
> | > | > | 大于号 |
≥ | ≥ | &ge | 大于等于 |
¼ | ¼ | ¼ | 四分之一 |
½ | ½ | ½ | 二分之一 |
¾ | ¾ | ¾ | 四分之三 |
HTML特殊转义字符对照表
字符 | 十进制 | 转义字符 | 字符 | 十进制 | 转义字符 | 字符 | 十进制 | 转义字符 |
---|---|---|---|---|---|---|---|---|
? | ¡ | ¡ | Á | Á | Á | á | á | á |
¢ | ¢ | ¢ | Â | Â | ˆ | â | â | â |
£ | £ | £ | Ã | Ã | Ã | ã | ã | ã |
¤ | ¤ | ¤ | Ä | Ä | Ä | ä | ä | ä |
¥ | ¥ | ¥ | Å | Å | ˚ | å | å | å |
| | ¦ | ¦ | Æ | Æ | Æ | æ | æ | æ |
§ | § | § | Ç | Ç | Ç | ç | ç | ç |
¨ | ¨ | ¨ | È | È | È | è | è | è |
© | © | © | É | É | É | é | é | é |
a | ª | ª | Ê | Ê | Ê | ê | ê | ê |
? | « | « | Ë | Ë | Ë | ë | ë | ë |
? | ¬ | ¬ | Ì | Ì | Ì | ì | ì | ì |
/x7f | ­ | ­ | Í | Í | Í | í | í | í |
® | ® | ® | Î | Î | Î | î | î | î |
ˉ | ¯ | ¯ | Ï | Ï | Ï | ï | ï | ï |
° | ° | ° | Ð | Ð | Ð | ð | ð | &ieth; |
± | ± | ± | Ñ | Ñ | Ñ | ñ | ñ | ñ |
2 | ² | ² | Ò | Ò | Ò | ò | ò | ò |
3 | ³ | ³ | Ó | Ó | Ó | ó | ó | ó |
′ | ´ | ´ | Ô | Ô | Ô | ô | ô | ô |
μ | µ | µ | Õ | Õ | Õ | õ | õ | õ |
? | ¶ | ¶ | Ö | Ö | Ö | ö | ö | ö |
· | · | · | × | × | × | ÷ | ÷ | ÷ |
? | ¸ | ¸ | Ø | Ø | Ø | ø | ø | ø |
1 | ¹ | ¹ | Ù | Ù | Ù | ù | ù | ù |
o | º | º | Ú | Ú | Ú | ú | ú | ú |
? | » | » | Û | Û | Û | û | û | û |
? | ¼ | ¼ | Ü | Ü | Ü | ü | ü | ü |
? | ½ | ½ | Ý | Ý | Ý | ý | ý | ý |
? | ¾ | ¾ | Þ | Þ | Þ | þ | þ | þ |
? | ¿ | ¿ | ß | ß | ß | ÿ | ÿ | ÿ |
À | À | À | à | à | à |
参考文章:
巧用DOM API实现HTML字符的转义和反转义 https://www.zhangxinxu.com/wordpress/2021/01/dom-api-html-encode-decode/
java转换 HTML字符实体,java特殊字符转义字符串 https://blog.51cto.com/xionggeclub/3768494
转载本站文章《HTML转义字符:xss攻击与HTML字符的转义和反转义》,
请注明出处:https://www.zhoulujun.cn/html/webfront/SGML/htmlBase/2022_0617_8846.html