零宽字符:前端开发中不可忽视的隐形角色
一、零宽字符的基本概念与分类
- 零宽空格(ZWSP, U+200B):用于控制文本换行,例如在长单词或 URL 中插入该字符,可允许浏览器在此处自动换行。
- 零宽连接符(ZWJ, U+200D):强制两个字符连写,常用于复合表情符号或复杂排版语言。
- 零宽非连接符(ZWNJ, U+200C):阻止字符连写,保持独立形态,常见于阿拉伯文等连写文字。
- 字节顺序标记(BOM, U+FEFF):用于标识文本编码格式,如 UTF-8 文件开头的隐形标记。
二、前端开发中的应用场景
1. 文本排版与断行控制
<div>
https://example.com/this-is-a-very-long-url-that-needs-to-be-wrapped​in-the-middle
</div>2. 富文本编辑器中的光标定位
// 在内容末尾插入零宽空格以支持光标定位
function insertZeroWidthSpace(element) {
const range = document.createRange();
range.selectNodeContents(element);
range.collapse(false);
const textNode = document.createTextNode('\u200B');
range.insertNode(textNode);
}
3. 数据防爬与隐形水印
4. 复杂表情符号的合成
三、安全风险与应对策略
1. XSS 攻击与敏感词过滤
<script>alert('xss')</script> <!-- 正常攻击 -->
<scri\u200Bpt>alert('xss')</scri\u200Bpt> <!-- 插入零宽字符绕过过滤 -->使用正则表达式过滤所有零宽字符:
function sanitizeInput(str) {
return str.replace(/[\u200B-\u200D\uFEFF]/g, '');
}结合内容安全策略(CSP)进一步限制脚本执行。
2. 数据存储与搜索问题
在数据入库前清洗零宽字符:
// 后端Node.js示例
app.post('/submit', (req, res) => {
const cleanedText = req.body.text.replace(/[\u200B-\u200D\uFEFF]/g, '');
// 存储cleanedText到数据库
});前端表单输入时实时过滤:
// vue全局指令示例
Vue.directive('trim', {
inserted: (el) => {
el.addEventListener('input', (e) => {
e.target.value = e.target.value.replace(/[\u200B-\u200D\uFEFF]/g, '');
});
}
});3. 输入框长度限制问题
在输入事件中实时计算可见字符长度:
function calculateVisibleLength(str) {
return str.replace(/[\u200B-\u200D\uFEFF]/g, '').length;
}
input.addEventListener('input', () => {
const visibleLength = calculateVisibleLength(input.value);
if (visibleLength > 10) {
input.setCustomValidity('超过最大长度');
} else {
input.setCustomValidity('');
}
});本文内容仅供个人学习、研究或参考使用,不构成任何形式的决策建议、专业指导或法律依据。未经授权,禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载,请保留原文来源信息,不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持!