源自deepseek ai的回答
IETF 语言标签(BCP 47)详解与示例
IETF(Internet Engineering Task Force)语言标签(基于 BCP 47 标准)用于标识语言、地区、文字系统等,广泛应用于互联网、操作系统、软件开发(如 HTML、HTTP、本地化等)。
1. IETF 语言标签结构
标准格式:
语言代码[-文字][-地区][-扩展][-私有扩展]
- 语言代码(必填):ISO 639-1(2字母,如
zh)或 ISO 639-3(3字母,如 cmn)。
- 文字(可选):ISO 15924 代码(如
Hant 繁体、Latn 拉丁字母)。
- 地区(可选):ISO 3166-1 国家代码(如
CN 中国、TW 台湾)。
- 扩展(可选):如
u-(Unicode 扩展)、t-(翻译变体)。
2. 常见 IETF 语言标签示例
(1)基础语言 + 地区
en-US |
英语(美国) |
zh-CN |
中文(中国大陆,简体) |
zh-TW |
中文(台湾,繁体) |
es-ES |
西班牙语(西班牙) |
pt-BR |
葡萄牙语(巴西) |
fr-CA |
法语(加拿大) |
ja-JP |
日语(日本) |
de-DE |
德语(德国) |
(2)语言 + 文字
zh-Hans |
中文(简体) |
zh-Hant |
中文(繁体) |
sr-Latn |
塞尔维亚语(拉丁字母) |
uz-Cyrl |
乌兹别克语(西里尔字母) |
el-Latn |
希腊语(拉丁字母转写) |
(3)语言 + 地区 + 文字
zh-Hans-SG |
中文(新加坡,简体) |
zh-Hant-HK |
中文(香港,繁体) |
hy-Latn-IT |
亚美尼亚语(意大利,拉丁字母) |
pa-Arab-PK |
旁遮普语(巴基斯坦,阿拉伯文) |
(4)特殊扩展
en-US-u-co-emoji |
英语(美国,排序规则支持Emoji) |
de-DE-t-m0-dialect |
德语(德国,方言变体) |
zh-CN-u-nu-fullwide |
中文(中国大陆,全角数字) |
(5)无地区标签(仅语言)
en |
英语(通用) |
fr |
法语(通用) |
ja |
日语(通用) |
ru |
俄语(通用) |
3. 中文变体的 IETF 标签
zh-CN |
中国大陆(默认简体) |
zh-SG |
新加坡(简体) |
zh-TW |
台湾(繁体) |
zh-HK |
香港(繁体) |
zh-MO |
澳门(繁体) |
zh-Hans |
跨地区简体(如国际网站) |
zh-Hant |
跨地区繁体(如古籍内容) |
4. 使用场景
- HTML:
<html lang="zh-Hans">
- HTTP 头:
Accept-Language: zh-CN, en-US;q=0.9
- 操作系统(如 Windows、macOS 的语言设置)
- 软件开发(iOS/Android 多语言支持)
5. 注意事项
- 大小写不敏感,但惯例:
- 语言代码小写(
zh)
- 地区和文字首字母大写(
Hant、CN)
- 旧系统可能用
_ 替代 -(如 zh_CN)。
- 优先使用通用标签(如
zh-Hans 比 zh-CN 更广泛适用)。
如果需要验证标签,可查询:
希望这份总结对你有帮助!如果有特定语言或场景的需求,可以进一步探讨。