如何解决大多数浏览器会根据设置的语言自动替换某些字符?
在大多数浏览器(我检查过Chrome,Firefox和Opera)中,设置lang =“ ro”会自动将某些雪松字符替换为其他字符。
在这里检查:https://jsfiddle.net/dhtfb190/13
<!DOCTYPE html>
<html lang="ro">
<head>
<meta charset="utf-8">
</head>
<body>
<div style="font: 500% georgia;">şșşșŞȘŞŞȘ</div>
</body>
</html>
在Edge或IE中或者如果语言设置为“ en”或未设置,则不会发生这种情况。此外,并非所有字体都发生这种情况。例如,如果发生在佐治亚州,但不是发生在Arial。但是佐治亚州拥有所有这些字符,因为它们以lang =“ en”显示。
即使使用转义的实例化,它也一样。
此文件记录在哪里?我在互联网上搜索了很多,只发现了一些用中文代替某些符号的示例。如何查看替换的字符?为什么只对某些字体执行此操作?
解决方法
字形(“打印字符”)取决于语言。这是一个好的印刷规则,好的字体支持这种特性。
因此您获得了特定字符的“ ro”变体。
它是“有据可查的”。它在字体定义的一部分中(并且只有较新的字体格式支持它们),但是很难提取此类数据。 Python库很少。 [顺便说一句:在我的TODO列表中,还有一个显示字符变体的项目。]
也许,如果您查看字体的设计页面,可能会发现一些有关哪些语言具有变体的信息。
这在印度语中更为明显,其中连字取决于确切的语言和文本的时代。对于拉丁字符,主要是琐事问题。 Unicode标准引用了相同字体下法语和波兰语之间的重音斜度不同。
附录:
我能找到的最佳信息是在https://docs.microsoft.com/en-us/typography/opentype/spec/gsub中,例如在下面的引用中,但在文本上也重复:
,ScriptList标识使用字形替换的字体中的所有脚本和语言系统。
我的猜测是它可以检测语言并显示与字体不同的字符。
就像某些字体不支持äÄüÜöÖ一样,它将显示□□□□□□。 格鲁吉亚(以及其他字体)也支持俄语,并且会自动切换其字符。
您可以深入研究并检查文本编辑器(例如MS Word或InDesign),并发现单个字符的外观可能不同,也称为字形。
https://helpx.adobe.com/incopy/using/glyphs-special-characters.html您可以在此处查看,当您向下滚动一点时,当它们位于Glyph窗口中且下拉菜单处于打开状态时,会出现一个屏幕截图。您会看到西里尔字母有一个选项。因此,RO使用的字符集与EN不同。
您可以在佐治亚州查看此页面,并查看他们的语言标签为Cyrillic。 https://docs.microsoft.com/en-us/typography/font-list/georgia
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。