为唐代琵琶谱制作字体

  1. 6月前

    如题所示。这里所说的“唐代琵琶谱”包括敦煌乐谱,以及流传在日本的:唐五弦琵琶谱、天平琵琶谱等其他乐谱。
    这些乐谱的特点是使用对应琵琶音位的谱字,以及少量辅助记号。四弦琵琶有20个谱字,五弦琵琶有25个,外加“口”,点儿,停(T)三个辅助记号,以及一些扫弦记号。因为数量少,所以可以采取字体编码的形式,整理进一个体系,以利网络传播。
    目前楼主已经整理出敦煌乐谱包含的20个谱字以及三个辅助记号,制作在了一个字体文件中。Untitled1.svg
    参考来源主要有陈应时老先生的论文,其中清楚的列出了四弦琵琶的20个谱字。但是本字体文件并没有经过与古籍本身的校对,可能会有古籍中的异体字形没有包括在内。此外,五弦琵琶多出来的谱字也不在其中。
    因此还需要进一步完善!

  2. 好歹命个名啊

  3. 关于「古琵琶记号」(old Chinese lute notation)的编码提案去年 9 月份已经由魏安和陈永聪提交给 WG2 了。参见附件。

    除了 20 个基本指法记号(Basic Tabalature Signs)之外,指法小字(Small-Sized Signs)、休止符(Pause Sign)、右加变音点(Diacritical Dot on the Right)、上加变音点(Diacritical Dot Above)、下加变音点(Diacritical Dot Below)、口形符(Square Mark)、和弦符(Chord Mark)也被收入。

  4. @guanjinyu001 好歹命个名啊

    临时搞这么一个,忘了。

    @Kushim Jiang 关于「古琵琶记号」(old Chinese lute notation)的编码提案去年 9 月份已经由魏安和陈永聪提交给 WG2 了。参见附件。

    真没想到有人这么快。。我翻看了一下他们的文档,人家准备的确实充分,真不知道他俩是干什么的。。。
    但是,他们的方案看起来也有问题:问题在于异体字只收录正字(正字还是别人的论文中考证出来的);还有就是五弦琵琶的第五弦谱字(子,四,中等)因为与汉字写法非常接近而不收录在此;在下对于他们几种点的符号不加区分也有异议。
    我认为:异体的琵琶谱字,必须全面收入编码体系。因为现有的异体字解释都是人们考证的,而不是古籍原本中明示的,如果只收录为学界公认的正字,那么相当于隐性地偏向了这一种观点;其次,参考汉字的编码,即使是很多异体类型,编码也保留了特殊的写法,按这个参考,有必要保留琵琶谱字中的异体;最后,琵琶谱字的编码常常用来在网络时代翻录古籍,它的大部分应用在于编码化古谱,因此就必须忠实于原文,否则在传播中就可能走样。
    第五弦谱字虽然同汉字写法接近,但是意义完全不同,应予收录在谱字表中,否则用汉字借代,搜索时就会出现很奇怪的结果。
    关于点的写法,敦煌乐谱中谱字侧面点的写法、唐五弦琵琶谱中谱字侧面点的写法,与伏见宫本琵琶谱中谱字上面点的写法有较大区别,从形式上不太一样,经过考证,它们的意义完全不同(前者是表征拍子,后者是演奏技法)。因此,从字形上考虑,应当区别形状,不能都画成圆形,前者应当画成粗的“、”形,后者为圆点。

  5. @丁香丛中的雪狼 临时搞这么一个,忘了。

    真没想到有人这么快。。我翻看了一下他们的文档,人家准备的确实充分,真不知道他俩是干什么的。。。
    但是,他们的方案看起来也有问题:问题在于异体字只收录正字(正字还是别人的论文中考证出来的);还有就是五弦琵琶的第五弦谱字(子,四,中等)因为与汉字写法非常接近而不收录在此;在下对于他们几种点的符号不加区分也有异议。
    我认为:异体的琵琶谱字,必须全面收入编码体系。因为现有的异体字解释都是人们考证的,而不是古籍原本中明示的,如果只收录为学界公认的正字,那么相当于隐性地偏向了这一种观点;其次,参考汉字的编码,即使是很多异体类型,编码也保留了特殊的写法,按这个参考,有必要保留琵琶谱字中的异体;最后,琵琶谱字的编码常常用来在网络时代翻录古籍,它的大部分应用在于编码化古谱,因此就必须忠实于原文,否则在传播中就可能走样。
    第五弦谱字虽然同汉字写法接近,但是意义完全不同,应予收录在谱字表中,否则用汉字借代,搜索时就会出现很奇怪的结果。
    关于点的写法,敦煌乐谱中谱字侧面点的写法、唐五弦琵琶谱中谱字侧面点的写法,与伏见宫本琵琶谱中谱字上面点的写法有较大区别,从形式上不太一样,经过考证,它们的意义完全不同(前者是表征拍子,后者是演奏技法)。因此,从字形上考虑,应当区别形状,不能都画成圆形,前者应当画成粗的“、”形,后者为圆点。

    刚刚和陈兄聊了一下,分点讲吧。

    首先是异体字的问题,分开收有几种方法都不太好。如果按顺序收,一个字一堆 variants 一个字一堆 variants 这样,在编码的计算上没办法连续化,没法利用编码本身的数值特征。如果用 standardized variation sequence(SVS),因为后面涉及到修饰符,修饰符的属性是带 combining 的,而 combining 和 variation selector 一样是作用在上一个字上的,不能放一起。也就是说底层编码上 variation seletor 不能隔空异体,combining 也不能隔空加修饰。

    所以我们的想法是从字体层面用 opentype 属性解决这个问题。当然如果你觉得正字不对可以交提案让魏安改没问题。

    然后是类汉字的编码。这个和先前的工尺谱是很类似的,如果给类汉字的做配套的字体,本身它的非汉字属性也是 Ideographic Rapporteur Group 各方承认的,从计算层面也只是前者的延续没有难度。所以我们认为是可以考虑加进来的。

    最后是点的问题。可能光靠文字我们很难理解,希望您能提供具体的图片信息以便让表述更显见。

  6. @Kushim Jiang 刚刚和陈兄聊了一下,分点讲吧。
    ……

    首先我说点的问题,请参看你们给的这份pdf当中所有的敦煌乐谱参考图片,其中点多为长形从左上往右下点出;唐五弦琵琶谱也有类似特征。但是伏见宫本琵琶谱都是圆点,不论谱字上方还是右侧方。因此从形状上说我觉得是有区别的。形状不一致,可能是书写者自身的字体不同,也可能是有特定的含义,因此我们也应当从使用的语境和意义上综合查考;但形状是个完全客观的指标,它应当决策的是根本。
    从意义上说,这个侧面的点【文档编码方案1D2AC】经过考证是用来表达节奏元素“掣拍子”的(陈应时、席臻贯等人);【注意:和文档中叙述意义“indicates that the string is to be plucked outwards”并不一致,但该文档并未参考这二人资料】。而谱字顶部的点(见于伏见宫本琵琶谱)是描述弹奏方法的【文档编码方案的1D2AD】。
    1D2AC点是用来干什么的这个至少应当存疑;我个人认同陈老教授的观点——这是掣拍子——因此我觉得文档中对意义的说明是不全面的。
    因此,我认为:如果大家能够达成一致的认识:即竖排版右侧面点是“掣拍子”,那么此字应当取我说的写法;如果大家不能达成一致共识,那么这个字应当收录异体字,至于谁是正体,要看现有文档中二者数量之比。
    100x.PNG
    120x.PNG


    编码问题我不是很了解。看来你们的编码是因为有其他规则限制导致不能从编码层面收录异体字?因此决定使用不同的字体来解决问题?
    还有类汉字,,,按你所言编码可以收录的对吗?那准备收录在何处?基本20个谱字之后还是在现有编码尾部添加?

  7. @丁香丛中的雪狼 首先我说点的问题,请参看你们给的这份pdf当中所有的敦煌乐谱参考图片,其中点多为长形从左上往右下点出;唐五弦琵琶谱也有类似特征。但是伏见宫本琵琶谱都是圆点,不论谱字上方还是右侧方。因此从形状上说我觉得是有区别的。形状不一致,可能是书写者自身的字体不同,也可能是有特定的含义,因此我们也应当从使用的语境和意义上综合查考;但形状是个完全客观的指标,它应当决策的是根本。
    从意义上说,这个侧面的点【文档编码方案1D2AC】经过考证是用来表达节奏元素“掣拍子”的(陈应时、席臻贯等人);【注意:和文档中叙述意义“indicates that the string is to be plucked outwards”并不一致,但该文档并未参考这二人资料】。而谱字顶部的点(见于伏见宫本琵琶谱)是描述弹奏方法的【文档编码方案的1D2AD】。
    1D2AC点是用来干什么的这个至少应当存疑;我个人认同陈老教授的观点——这是掣拍子——因此我觉得文档中对意义的说明是不全面的。
    因此,我认为:如果大家能够达成一致的认识:即竖排版右侧面点是“掣拍子”,那么此字应当取我说的写法;如果大家不能达成一致共识,那么这个字应当收录异体字,至于谁是正体,要看现有文档中二者数量之比。
    100x.PNG
    120x.PNG


    编码问题我不是很了解。看来你们的编码是因为有其他规则限制导致不能从编码层面收录异体字?因此决定使用不同的字体来解决问题?
    还有类汉字,,,按你所言编码可以收录的对吗?那准备收录在何处?基本20个谱字之后还是在现有编码尾部添加?

    单个 otf 字体就可以。opentype 属性支持 ss01 到 ss20 的样式集,在 word 中可以通过选择样式调用异体字形。

    按证据,要么都用「、」要么都用「・」的话是不存在最小对立的。如果存在最小对立,那分开是好的,如果他们从没同时出现过,opentype 是合理的。

    类汉字要放的话肯定放在基本字后面,保证连续性。

    释义问题的话,陈兄表示他再找找新书,随后修改。

  8. @Kushim Jiang 单个 otf 字体就可以。
    ……

    1. 看来这个opentype还是使用同一编码的不同字形(样式)的想法。
    但是我仍然认为应当编码收录异体字,其原因在于许多【经过考证】在不同谱例里字形不同但意义相同的谱字,其形状存在大的差别;如果有一天,万一学术研究被推翻了,那么后果将十分严重。文字的形式应当忠于原本,而不是论点,因此我还是很坚持这些字需要拥有一个独立的编码的。
    当然,看起来我这个想法存在着一定的技术困难。那么可不可以这个样子:在文字编码的某一段以后,预留这样一个一个区块,为以后解决异体的编码问题做准备。
    还有,我还是要请问一下做编码的技术原则,比方说你们数值的连续性是什么?以及standardized variation sequence是什么?是不是你们要做一种编码的方式,把异体字和正体联系起来?如果拘泥于联系异体与正体,我觉得大可不必,异体字就是单独一个字,不需要和所谓的正字有任何联系,联系是人为解读的;况且这个琵琶谱字也不会被用于搜索,不需要处理其中的语义问题。
    2. 两种竖排右侧面点确实基本上不会同时出现,这可能是抄写者的写法问题,也可能是意义的不同。但是我们很明显的知道,敦煌乐谱中的所有“、”点必然是一种意义;宫本琵琶谱中的点,必然也是一种意义;两种意义是否相同,我们只有学术上的论点参考。
    我觉得并行是一种解决方案;如果不并行,那么都画成一种形式,用的人去解释,也可以。这个问题我不做过多坚持,但是必须指明这个点的意义,是被不同解读了的。
    3. 编码的结构大概是:20个基本谱字+符号。我是要问类汉字究竟放在谱字与符号之间或者谱字与符号后面。

  9. 6月前Kushim Jiang 重新编辑

    @丁香丛中的雪狼
    1. 看来这个opentype还是使用同一编码的不同字形(样式)的想法。
    但是我仍然认为应当编码收录异体字,其原因在于许多【经过考证】在不同谱例里字形不同但意义相同的谱字,其形状存在大的差别;如果有一天,万一学术研究被推翻了,那么后果将十分严重。文字的形式应当忠于原本,而不是论点,因此我还是很坚持这些字需要拥有一个独立的编码的。
    当然,看起来我这个想法存在着一定的技术困难。那么可不可以这个样子:在文字编码的某一段以后,预留这样一个一个区块,为以后解决异体的编码问题做准备。
    还有,我还是要请问一下做编码的技术原则,比方说你们数值的连续性是什么?以及standardized variation sequence是什么?是不是你们要做一种编码的方式,把异体字和正体联系起来?如果拘泥于联系异体与正体,我觉得大可不必,异体字就是单独一个字,不需要和所谓的正字有任何联系,联系是人为解读的;况且这个琵琶谱字也不会被用于搜索,不需要处理其中的语义问题。
    2. 两种竖排右侧面点确实基本上不会同时出现,这可能是抄写者的写法问题,也可能是意义的不同。但是我们很明显的知道,敦煌乐谱中的所有“、”点必然是一种意义;宫本琵琶谱中的点,必然也是一种意义;两种意义是否相同,我们只有学术上的论点参考。
    我觉得并行是一种解决方案;如果不并行,那么都画成一种形式,用的人去解释,也可以。这个问题我不做过多坚持,但是必须指明这个点的意义,是被不同解读了的。
    3. 编码的结构大概是:20个基本谱字+符号。我是要问类汉字究竟放在谱字与符号之间或者谱字与符号后面。

    根据目前证据里提到的资料,所谓「形状存在大的差别」其实也不大,接触资料多了,这些小区别可以理解,异体关系也不会因为所谓的研究如何如何而产生改变,图片资料给出的异体关系其实挺强的,不是弱不禁风的论点。

    另外,在汉字编码上的经验告诉我们,异体字绝对不是单独一个字,必定需要和正字产生强关联。谱字本身没几个字,一个正字也只跟着三四个异体,劣势看不出来。到了汉字编码,一编几万个正字,有的正字几百个异体字,分开编码之后再人工建立异体字关联,当然不如在编码建立层面就直接确定异体字关联。国际标准的编码规范,首要目的有二,其一保证信息交换,其二把预见问题转换为编码问题。

    编码一定会涉及检索问题,「不会被你用于搜索」不代表「不会被别人用于搜索」。工尺专家这边的首要要求就是能检索,能交换,所以用户需求是远大于考虑的。如果像楼主这种不用于检索,其实用不用国际编码没多大区别,还不如用图片,或者爱放哪放哪,爱怎么放怎么放。

    然后解释 SVS,基本观点是异体字用两个字符编码。第一个字符是正字,第二个字符是异体字选择符。比如「ユ」是 U+2000 U+FE00,「工」是 U+2000 U+FE01,表示「ユ」是 U+2000 的第一个异体字,「工」是 U+2000 的第二个异体字……这里的 U+FE00、U+FE01 就是表示异体关系的 selectors。

    连续性就是 I–0 II-0 III-0 IV-0 I-1 II-1 ……到编码的连续映射。好处在于不容易出错,比如编码苏州码子 1~9,按现在的方案,数字所在码点就是自身数值 +12320。这种简洁的关系就是「连续性」的一种。

    如果收录全部字样分开编码,一个字一堆异体,比如 I-0 II-0 II-0 II-0 III–0 III–0 III–0 III–0 IV–0 IV–0 I–1 I–1 I–1 ……这样的,不存在与编码的连续关系,会在映射上增加计算难度,出错概率会被人为引入。所以异体字用字体解决是更提倡的。

    预留是必须的,要是有新发现,再开区也可以的。

    证据中没有看出点的形状引致的意义改变,需要更多证据支持。

    每一个字符的释义需要在标准文件里写明,不用担心。

    类汉字穿插于谱字之间。保证 I-0 II-0 III-0 IV-0 V-0 I-1 II-1 ……

  10. @Kushim Jiang 根据目前证据里提到的资料,所谓「形状存在大的差别」其实也不大,接触资料多了,这些小区别可以理解,异体关系也不会因为所谓的研究如何如何而产生改变,图片资料给出的异体关系其实挺强的,不是弱不禁风的论点。
    ……

    别的问题我要再思考下。但是我要问明白你们的预留区在哪里,多大?
    我觉得你们保证正字连续性的想法是对的,从应用角度这些是最常用的,要保证在复制黏贴中的偶然出错率最小。
    如果我知道了你们的预留区基本性质,我就可以将异体字嵌入进去,拟定一套异体字的方案。
    关于点这个问题,我截取的图片是说明形状不同的。意义问题,请参照陈应时先生的《论敦煌乐谱的记谱法》,可以看出他对这个点的说明是掣拍子,跟你们说是弹奏方法的叙述不一样。

  11. @丁香丛中的雪狼 别的问题我要再思考下。但是我要问明白你们的预留区在哪里,多大?
    我觉得你们保证正字连续性的想法是对的,从应用角度这些是最常用的,要保证在复制黏贴中的偶然出错率最小。
    如果我知道了你们的预留区基本性质,我就可以将异体字嵌入进去,拟定一套异体字的方案。
    关于点这个问题,我截取的图片是说明形状不同的。意义问题,请参照陈应时先生的《论敦煌乐谱的记谱法》,可以看出他对这个点的说明是掣拍子,跟你们说是弹奏方法的叙述不一样。

    点的形状的话推荐 opentype,意义的话再翻书改改。

    整个区块在方案里拟定的编码那里,一般往后留几行。
    当然不是用来放异形的,如果以后有别的谱号或者修饰符再放过来。
    如果实在用不惯 opentype 的话就想放哪放哪吧。

    当然方案还没定,真通过还早。

  12. 龙神

    12楼 2018年8月13日 化学版主, 茶馆馆长

    可以呀,字形可以参考古代雕版印刷古琴谱里的减字谱那种宋体字 /asnowwolf-laugh

  13. @Kushim Jiang 点的形状的话推荐 opentype,意义的话再翻书改改。

    整个区块在方案里拟定的编码那里,一般往后留几行。
    当然不是用来放异形的,如果以后有别的谱号或者修饰符再放过来。
    如果实在用不惯 opentype 的话就想放哪放哪吧。

    当然方案还没定,真通过还早。

    我知道了。查过unicode的规则,人家确实推荐如你们一般把异体字处理的。
    我肛不过unicode的原则,所以只有退而求其次。
    我准备做一套自己的标准,在每一个unicode规定的正字字符后面加一个unicode衬字来标注异体,也就是说用一个unicode标准的正字加上一个表达异体字序号的unicode字符来解决。
    但是这个很依赖于你们的正字顺序,希望你们能够给出一套好用的顺序来解决问题。我觉得这个顺序应该按照琵琶的物理顺序,最多5根弦,5个指位,再加五弦琵琶的“小”谱字,也就是说连续26个字符的位置就可以解决基本的谱字编码。就算预留给未发现的谱字,最多也就是32个字符位。还有辅助符号,这个你们说了预留位置的,我就不多说了。
    你说方案通过还早,那么想问这个什么时候会被拿出去审定?

  14. @龙神 可以呀,字形可以参考古代雕版印刷古琴谱里的减字谱那种宋体字 /asnowwolf-laugh

    为什么要是宋体字呢。。?配合现代字体的习惯吗?

  15. 龙神

    15楼 2018年8月18日 化学版主, 茶馆馆长

    @丁香丛中的雪狼 为什么要是宋体字呢。。?配合现代字体的习惯吗?

    也行,比如黑体,这种比较传统的东西用老一些的字体比较有感觉

  16. 6月前Kushim Jiang 重新编辑

    @丁香丛中的雪狼 我知道了。查过unicode的规则,人家确实推荐如你们一般把异体字处理的。
    我肛不过unicode的原则,所以只有退而求其次。
    我准备做一套自己的标准,在每一个unicode规定的正字字符后面加一个unicode衬字来标注异体,也就是说用一个unicode标准的正字加上一个表达异体字序号的unicode字符来解决。
    但是这个很依赖于你们的正字顺序,希望你们能够给出一套好用的顺序来解决问题。我觉得这个顺序应该按照琵琶的物理顺序,最多5根弦,5个指位,再加五弦琵琶的“小”谱字,也就是说连续26个字符的位置就可以解决基本的谱字编码。就算预留给未发现的谱字,最多也就是32个字符位。还有辅助符号,这个你们说了预留位置的,我就不多说了。
    你说方案通过还早,那么想问这个什么时候会被拿出去审定?

    不知道啥时候,得看魏安。

    既然是手写的谱子,做成行楷的挺好,也方便和汉字区分。

  17. @Kushim Jiang 不知道啥时候,得看魏安。

    既然是手写的谱子,做成行楷的挺好,也方便和汉字区分。

    哦对了,你们上面那一份儿标准,没有标明五弦琵琶特有谱字的位置。这个应该及早收进去。我需要一份你们暂行的包括所有26个谱字和辅助记号的编码方案,这样好编定我暂用的琵琶谱数字化录入方式,这样也便于将来(你们的方案通过的时候)把录入的东西转换【因为谱字顺序一致,所以只需要剪切除去多余信息,然后加上首偏移】。

  18. 4月前
    4月前丁香丛中的雪狼 重新编辑

    @Kushim Jiang

    @Kushim Jiang
    表示我在研究日本保存的《唐五弦谱》谱字时,因为缺少清晰的文档照片而遇到了一些麻烦。
    我看到你们的unicode标准文件中,引用了一张《唐五弦谱》第一首曲子《平调子》的清晰图片,想请问一下你们是在哪里找到的图片?有全文吗?我手中的是一份抄本的照片,已经很不清晰了。

 

后才能发言