Paratext 的设计使其能够兼容世界上大多数的书写系统。为此,Paratext 提供了多种语言设置,包括 字母字符 对话。请参阅下面的英语示例:
小写和大写字母
在字母字符对话框中(项目菜单 > 项目设置 > 语言设置 > 字母字符选项卡),可以列出一种语言的所有大小写字母。此列表告知 Paratext 哪些字母属于该语言,并构成 Paratext 中字符检查的基础。
???? 注意: 标点符号和数字等附加字符必须手动添加到字符检查清单中(参见 项目菜单 > 工具 > 检查库存 > 角色库存 OR 标点符号清单),但 字母字符 对话会自动作为有效字符添加到库存中。
???? 注意: 字母字符列表应仅包含您特定书写系统中使用的字符或字母,以便字符检查能够在输入错误时标记不合适的字母。如果您不验证新项目实际使用的字符,将字符从一个项目复制到另一个项目很容易引入无效字符。
指定语言的字母顺序
字母字符对话框中字符的顺序决定了 Paratext 项目中单词的排序方式。Paratext 在许多地方需要使用您在此处定义的“字母”顺序,以排序列表的形式呈现信息。其中一些地方包括:
- 列表窗口中的搜索结果
- 单词表工具
- 词汇表(如果项目有的话)
???? 如果 Paratext 没有按照您期望的方式进行排序, 一种 原因可能是 字母字符 对话。
重音字符
语言中常见重音字符,例如 á ê ɨ ñ ò ü。这些字符应包含在项目的字母字符列表中。请考虑以下西班牙语示例中的元音:
请注意,每个重音字符的大小写都包含在内。另请注意,重音元音与非重音元音位于同一行。这不是必需的,但当您希望 Paratext 在排序时忽略重音时,可以使用此选项。如果您的语言包含诸如声调/重音标记之类的不会改变单词含义的符号,则此选项会很有帮助。
如果排序顺序像上面的例子一样配置,Paratext 将不会处理 e 和 é 排序时,字母会有所不同。例如,假设以下单词将按以下方式排序:
- pepa
- pépa
- pePAS
- péPAS
通过这种方式排序还可以防止词汇表中出现以不同重音字符开头的单词的单独部分。
独立于非重音字符对重音字符进行排序
如果您希望重音字符与非重音字符分开排序(例如:将它们视为不同的字母),则需要将重音字符放在单独的行上。请考虑以下修改后的西班牙语示例:
如果排序顺序配置得像上面的“修改后的西班牙语”示例,则以下假设的单词将按以下方式排序(因为 e 来之前 é):
- pepa
- pePAS
- pépa
- péPAS
更常见的做法是,将项目配置为重音元音和非重音元音一起排序,而将重音辅音和非重音辅音独立排序。请考虑以下西班牙语示例中的 ñ/Ñ 示例:
此配置将导致 Paratext 排序正常 n的 与...分开 ñ的 带有波浪号变音符号。以下假设的单词将按此方式排序,因为 n 来之前 ñ:
- sonir
- soñir
- sun中间
- suñ中间
它还将导致词汇表有两个单独的部分,分别针对以“N“和”Ñ“,如果您选择在项目中使用词汇表。
有向图
许多书写系统中都使用二合字母、三合字母和其他多合字母。您可以告诉 Paratext 如何对这些字母进行排序。有些语言社区非常关注多合字母,因为它们对其语言的拼写至关重要;而其他语言社区则希望 Paratext 忽略这些字母,仅根据单个字符进行排序。让我们考虑下面富尔德语示例中的一个中间情况,该示例包含四个二合字母(mb、nd、ng 和 nj):
在此示例中,Paratext 将区分以这些二合字母开头的单词和以单个字符开头的单词,并相应地对它们进行排序。例如:
- m阿伊
- mb阿吉伊
- n安妮
- nd阿拉尼
- ng阿里
可能需要特殊键盘的字符
您的项目可能需要许多字符,但如果不添加包含这些特殊字符的键盘解决方案,您的计算机就无法输入。这些字符的示例包括: ç /Ç、ɨ/Ɨ、Ŋ/ŋ、ɓ/Ɓ、ɔ/Ɔ 以及其他许多人。Fufulde 已经钩住了 b (ɓ) 和钩状 d (ɗ) 就是这方面的例子。您需要一种方法来键入这些字符,或者一种方法来将它们复制并粘贴到 字母字符 列表。输入特殊字符的一种方法是使用 自动更正 Paratext 中的功能。有关自动更正的更多详细信息,请参阅 本文:
第二种方法是找到或安装 Keyman 键盘如果您的项目需要大量特殊字符,或者您想在计算机上的其他程序中输入特殊字符,那么这是最佳解决方案。许多 Keyman 键盘还配备了用于在移动设备(例如:Android 或 iOS 手机)上打字的特殊键盘。
避免使用字母作为标点符号
将标点符号与构成单词的字母字符区分开非常重要。否则可能会导致各种问题。搜索和排序将无法正常工作;字符、标点和拼写检查可能无法找到所有错误;而且单词表工具可能会在意想不到的地方断词。
例如:一些拉丁语书写系统使用一个小勾号来表示喉塞音,人们经常会输入撇号 “ 或右单引号 ' 表示该刻度线。同样,一些正字法表示软腭音 n (ŋ) 与 ng' 一起使用撇号或右单引号。然而,这两个符号通常都不是构成单词的字符,计算机可能无法按照您预期的方式处理它们(也就是说,它会将它们视为标点符号而不是字母)。使用这些符号的一个限制是它们现在有大小写。建议使用 拉丁文小写字母 Saltilloꞌ (U+A78C)或 修饰字母撇号 ʼ (U+02BC),因为计算机会将它们识别为构成单词的字符,而不是标点符号。通常情况下,正字法不需要大写喉塞音,但如果需要,请使用拉丁小写字母 Saltillo ꞌ (U+A78C)和拉丁大写字母 Saltillo(U+A78B)。与其他特殊字符一样,您需要一种方式来输入您选择的喉塞音字符。
考虑下面的例子,使用 Saltillo 来表示声门塞音:
???? 请注意,像 Saltillo 这样的字符通常代表喉塞音,或者是三字母组合的一部分,例如 ngꞌ 在正字法中不需要大写形式。如果正字法要求 Saltillo 大写,则将拉丁大写字母 Saltillo (U+A78B) 放在正斜杠后,如下所示: ꞌ/Ꞌ。
缩写和连字符
许多语言都使用缩写。例如,英语中有“don't”、“doesn't”和“won't”这样的词。正字法中常用撇号来标记元音省略,例如“姆奇胡卢皮罗·姆瓦·赫里斯图·耶苏”(齐切瓦语/尼扬贾语)。因此,撇号虽然是拼写正确的必要符号,但它们不被视为字母或构成词的字符。连字符也是如此:有些正字法需要它们才能拼写正确,但它们不被视为构成词的字符。
在 Paratext 中处理缩写和连字符的方法是将它们指定为词中标点符号。 词中标点 设置位于 其他字符 选项卡下的“语言设置”下。请考虑如下所示的 Nyanja 的 Word-medial 标点设置:
在此处添加连字符和撇号会告知 Paratext 某些单词会包含连字符或撇号。这一点很重要,因为如果此处未列出连字符和撇号,Paratext 会将所有包含连字符或撇号的单词分成两部分。例如,尼扬贾语单词 姆奇库卢皮里罗 会被分成两个单词(奇库卢皮里罗) 撇号出现的地方。同样,富尔德语单词 阿多米 会被分成两个单词(阿多托米) 中出现连字符的位置。
结语
审核时,字母字符列表应包含您语言所需的所有构词字符。未使用的字符不应保留在那里。(这种情况通常发生在将字母字符列表从一个项目复制到另一个项目时。)标点符号永远不应作为字母表的一部分。如果需要,请在 Paratext 中找到另一个外观可接受的字符来表示该字母。您可能需要找到或创建一种方法来输入计算机键盘无法输入的特殊字符。 Paratext 中的自动更正功能 or 关键人物 是两个很好的可能解决方案。
在翻译项目开始时花些时间正确地整理项目中使用的字母,将使起草和检查译文的工作变得更加轻松。这也能减少文本输入的繁琐,并使 Paratext 的许多搜索、排序和检查功能能够正常工作。