2023年IOL个人赛第4题分析和解答

上次我们对第20届语言学奥林匹克竞赛(IOL)个人赛的第5题,也就是数字题进行了分析和解答【1】,今天来试一试第4题,这是一道文字题。

一般来说和数字题相比,文字题要更复杂一些,涉及语言学的要素也会更多一些。这道文字题的语言背景是平原克里语,这是个啥语言、什么人用的语言我们并不关心;我们关心的是如何利用示例来建立起逻辑自洽的语言结构。

题目中给出了21个示例,其中16个例子在汉语中都是“人称代词+动词+人称代词”的结构,另外给出了5个示例,分别对应于从句“当……时”和“如果……”。题目的任务是(a)将四个平原克里语短句翻译成汉语,和(b)将五个汉语短句翻译成平原克里语。

我们先粗略地对前16个示例的汉语翻译做一个统计,分别统计短句中的动词和人称代词。

动词方面,16个示例中一共出现了5个动词,这5个动词及其出现的示例数如下:

1. 挑战,出现3次。

2. 看到,出现4次。

3. 阻止,出现3次。

4. 问,出现3次。

5. 帮助,出现3次。

对于每个动词,在它的示例中找出“最大公约数”,即最大的相同部分。比如对比示例5,13和16,找出wīcih是这三个短句的最大的相同部分。

注意:这个部分不一定就和动词的原型一一对应——因为还可能有性、数、格的不同——但至少包含了动词的词根。

1. 挑战 = mawinēskom。

2. 看到 = wāpam。

3. 阻止 = nakin。

4. 问 = kakwēcim。

5. 帮助 = wīcih。

我们注意到后面5个动词的相同部分最后都以辅音结束,所以为了保持一致,我们省去第1个动词相同部分的最后一个元音字母i。

再来看看人称代词部分。从汉语翻译中,我们可知人称代词在这些示例中以主语或者宾语两个语法成分出现,再加上第一、第二和第三人称的单复数,组合起来一共有36种可能。

我们将这些可能用下表来表示,其中行标题表示主语,列标题表示宾语,表格中的数字是示例的编号:

主语\宾语我们你们他们
16217,1812
我们111164
835,20?
你们231715
1?1013
他们19914?

可见,示例并没有完全涵盖这36种可能,其中反身用法(如:“我……我们”,“你们……你”,“他……他”等)没有在示例中出现,也没有在任务(b)中出现,所以我们在以下的分析中忽略这12种可能。

注意到,这里有两个特殊的示例:3和11。对应的汉语翻译中,这两个短句可以翻译成“你”,也可以翻译成“你们”。但在另外一些示例,比如8和2,分别只能翻译成“你”或者“你们”。这是一个需要注意的点。

除去这些种可能,另外还有3种可能的组合没有在示例中出现,我们将它们用“?”表示。注意到,部分组合出现在任务(b)中,比如任务30就是“我……你们”的组合。不排除在任务(a)中也出现部分缺失的组合。

我们发现在示例中动词的相同部分相对统一和简单,所以将它们从短句里拆分出来,我们把分析的重点放在人称代词上。

下一步,我们把分析的重点放在人称代词上,这是因为我们发现动词在示例中出现的形式比较统一,相对简单。所以我们将动词相同的部分从短句中拆分出来:

1. ni – ik — 他挑战我

2. ki – ināwāw — 你们看到我

3. ki – inān — 你阻止我们,你们阻止我们

4. ni – ānānak — 我们问他们

5. ki – āw — 你帮助他

6. ni – ānān — 我们问他

7. ni – āw — 我看到他

8. ki – in — 你挑战我

9. ni – ikonānak — 他们挑战我们

10. ki – ik — 他问你

11. ki – itinān — 我们看到你,我们看到你们

12. ni – āwak — 我阻止他们

13. ki – ikowāw — 他帮助你们

14. ki – ikwak — 他们阻止你

15. ki – āwāwak — 你们看到他们

16. ki – itin — 我帮助你                

我们用同样的方式处理示例17 – 21:

17. ē- – āyēk — 当你们阻止他时

18. ē- – ak — 当我帮助他时

19.  – ikoyāhkwāwi — 如果他们挑战我们

20.  – aci — 如果你看到他

21.  – itako — 如果我帮助你们

把动词拆出来后,我们很容易发现:

1. 前16个短句要么以ni-开头,要么以ki-开头,而且两种类型似乎和第几人称无关,因为示例中包含了各种人称。

2. “当……时”的从句应该和ē- 相对应。

3. “如果……”的从句直接以动词开头。

个人感觉ni-和ki-的区别是解决本题的关键。

分析示例4,6,7和12,即人称代词表格中右上角的四个方格,它们表示主语为第一人称、宾语为第三人称的四种情况,我们发现在平原克里语中这四个示例全以ni-开头,所以初步猜测ni-和第二人称没有关系。

为了进一步确认这一猜想,我们再看看示例1和9,即人称代词表格中左下角的四个方格,它们表示主语为第三人称、宾语为第一人称的两种情况,这两个示例确实全以ni-开头。而以上这6个示例恰恰是16个示例中和第二人称无关的所有示例!

那么反过来,ki-开头的短句是否全部都与第二人称有关呢?我们查验以下另外10个以ki-开头的示例,确实都与第二人称有关!

因此,我们可以推断出:ni = 主语和宾语仅和第一人称、第三人称有关;而ki = 主语或宾语与第二人称有关

得到这个推断的同时,我们也意识到动词前面的ni-或者ki-并不代表某个特定的人称,这意味着不论是主语还是宾语,它们都位于动词后面。所以我们下面把重点放在动词后的那一堆字母之上。

回到表格的右上角,这4个示例是第一人称作为主语、第三人称作为宾语时的情况:

7. ni – āw — 我看到他  vs.  12. ni – āwak — 我阻止他们

6. ni – ānān — 我们问他  vs.   4. ni – ānānak — 我们问他们

比较这四个短句动词后的部分,从7和12,6和4可以推测出-ak后缀表示第三人称复数,从7和6可以推测出-nān后缀表示第一人称复数。其中示例6中表示第三人称单数-w可能因为缺少元音而被省去。

小结一下:

“我……他” = āw;“我……他们” = āw-ak;

“我们……他” = ā-nān;“我们……他们” = ā-nān-ak。

这个推测在示例18上可以得到验证。

再来看左下角的两个示例。

1. ni – ik — 他挑战我

9. ni – ikonānak — 他们挑战我们

对比一下,可以猜测-ik表示“他……我”,-iko表示主语的“他们”,而这里出现的-nān表示“我们”,-ak表示“他们”,符合我们上面的推测。

将示例9和示例4进行比较,可见iko的作用就是表示第三人称成为主语。

小结一下:

“他……我” = ik;“他们……我们” = iko-nān-ak。

不过,虽然示例19符合-iko的用法,但其它部分非常复杂,条件从句的情况我们留到后面再讨论。

再来看看和第二人称有关的ki-句式。

示例16和11表示第一人称主语、第二人称宾语的情况:

16. ki – itin — 我帮助你  vs.  11. ki – itinān — 我们看到你,我们看到你们

可知-itin表示“我……你”,-iti-nān表示“我们……你”,这里-nān的后缀用法也符合我们上面的推测。

示例21也是条件从句,留在后面讨论。

示例10,13和14表示第三人称主语、第二人称宾语的情况:

10. ki – ik — 他问你  vs.  13. ki – ikowāw — 他帮助你们

14. ki – ikwak — 他们阻止你

很有意思,这里表示“他……你”的也是-ik,和“他……我”一样。那么怎么区分宾语到底是“你”还是“我”?很简单,看句子是ni-还是ki-开头。

示例13中,-iko表示第三人称作主语,符合我们上面的推测,剩下的-wāw表示第二人称复数。

示例14中,-ak表示第三人称复数,ik和ak之间用w连接。

再来看看第二人称作主语的情况。

示例8,2和3表示第二人称主语、第一人称宾语的情况。

8. ki – in — 你挑战我

2. ki – ināwāw — 你们看到我  vs.  3. ki – inān — 你阻止我们,你们阻止我们

上面例子说明-in表示“你……我”,和表示“他……我”或者“我……他”的-ik同样简洁。

表示“你们……我”的-ināwāw中,-in表示第二人称作主语,-(ā)wāw表示第二人称复数。

表示“你……我们”的-inān类似于in-nān,符合我们上面的推测,两个连续的n可能被省去了一个。注意到,在有第一人称复数-nān的情况下,在平原克里语法上可能无法再加上-wāw表示第二人称复数,所以示例3和11中,对于第二人称都存在单数和复数两种不同的解读。

示例5和15表示第二人称主语、第三人称宾语的情况。

5. ki – āw — 你帮助他

15. ki – āwāwak — 你们看到他们

-(ā)wāw表示第二人称复数,-ak表示第三人称单数,再次验证了我们上面的判断!

示例17表示了“你们……他”的情况。

17. ē- – āyēk — 当你们阻止他时

这个不大好分析。因为缺少了ni-和ki-带来的额外信息,我们不知道哪个部分指定了第二人称,从示例1、5、7可以看出,第三人称单数作为宾语大致是默认的。所以可以猜也许整个-āyēk就是表示“你们”作主语。

最后看看3个和条件从句有关的示例19,20和21。我只能分析出部分的语法结构:

19.  – ikoyāhkwāwi — 如果他们挑战我们

这里-iko表示第三人称为主语,后面一堆yāhkwāwi不知道如何拆,只知道它表示“他们……我们”。

20.  – aci — 如果你看到他

这里-aci也没法拆,在以ki-开始的普通句式中,“你……他”用-āw来表示,但在这个条件从句中,看不出两者之间的联系。

21.  – itako — 如果我帮助你们

这里能看出来的只有-it,表示第一人称主语、第二人称宾语。那么-ako就和第二人称复数有关。在以ki-开始的普通句式中,第二人称复数用-(ā)wāw来表示,同样看不出两者之间的联系。

最后,让我们来尝试完成任务。

(a)

22. ē-wāpamikoyēk = ē-wāpam-iko-yēk。ē-表示“当……时”,wāpam表示动词“看到”,iko表示第三人称为主语,参考示例17,yēk应该表示的是“你们”,所以这个短句翻译为:当他看到你们时。

23. ninakinikonān = ni-nakin-iko-nān。ni表示与第二人称无关的内容,nakin表示动词“阻止”,iko表示第三人称为主语,nān表示第一人称复数,参考示例9,所以这个短句翻译为:他阻止我们。

24. kikakwēcimāwāw = ki-kakwēcim-āwāw。ki表示与第二人称有关的内容,kakwēcim表示动词“问”,-(ā)wāw表示第二人称复数,默认第三人称单数,参考示例15,所以这个短句翻译为:你们问他。

25. kiwīcihitināwāw = ki-wīcih-itin-āwāw。ki表示与第二人称有关的内容,wīcih表示动词“帮助”,itin表示“我……你”,-(ā)wāw表示第二人称复数,所以这个短句翻译为:我帮助你们。

(b)

26. 如果我们问他们。“如果……”是条件从句,动词“问”是kakwēcim,第一人称和第三人称都是复数,参考示例19,不过这里“我们”是主语,示例19中“我们”是宾语,因为iko表示第三人称作主语,将iko换成a表示第一人称作主语,所以这个短句翻译为:kakwēcim-a-yāhkwāwi。

27. 他们挑战你们。和第二人称有关用ki开头,动词“挑战”是mawinēskom,第三人称复数作主语用iko-…-ak,第二人称复数用-(ā)wāw,参考示例13和14,且示例中从未出现连续两个元音,所以这个短句翻译为:ki-mawinēskom-iko-wāw-ak。

28. 他们帮助我。和第二人称无关用ni开头,动词“帮助”是wīcih,“他们”作为主语是iko-…-ak,参考示例14,所以这个短句翻译为:ni-wīcih-ik-w-ak。

29. 你看到他们。和第二人称有关用ki开头,动词“看到”是wāpam,第三人称复数作宾语用āw-ak,参考示例5,所以这个短句翻译为:ki-wāpam-āw-ak。

30. 我阻止你们。和第二人称有关用ki开头,动词“阻止”是nakin,第一人称作主语、第二人称作宾语为itin,第二人称复数用-(ā)wāw,参考示例16和2,所以这个短句翻译为:ki-nakin-itin-āwāw。

参考出处:

  1. https://sqr5.wordpress.com/2023/08/05/2023%e5%b9%b4iol%e4%b8%aa%e4%ba%ba%e8%b5%9b%e7%ac%ac5%e9%a2%98%e5%88%86%e6%9e%90%e5%92%8c%e8%a7%a3%e7%ad%94/

2023年IOL个人赛第5题分析和解答

前几天在公众号上分享了今年在保加利亚举行的第20届语言学奥林匹克竞赛(IOL)的赛题。

有读者留言:题目看了,但该怎么做呢?

目前IOL官网上尚未公布标准答案,我在语奥方面经验和水平有限,下面仅以个人赛第5题为例,分享一下个人对这道题的分析和理解,以及我得到的答案,作为抛砖引玉吧。

个人赛第5题是一道数字题,也是题目篇幅最小的一道题。

题目中给出了5个数字及其在苏皮勒语中的写法。换句话说,这5个数字就是某种意义上的训练集,我们需要利用它们构建一个自洽的逻辑,用来解释苏皮勒语中的数字系统,然后在这个自洽逻辑的帮助下,写出两个苏皮勒词汇对应的阿拉伯数字(a),和五个阿拉伯数字对应的苏皮勒词汇(b)。

在进入对题目的分析之前,我们简单地了解一下我们的语言对数字的描述。

人类对数字的概念,产生于人类文明演化和发展之初。在原始部落的狩猎和采集活动中,人们的收获往往是不固定的:今天打了一只山鸡回来,收获了10几颗酸枣儿;明天可能就颗粒无收要饿肚子。久而久之,人们就渐渐有了“多”和“少”的概念,继而通过结绳、刻痕、收集筹码等方式开始尝试计数。

随着人类接触的物体的数量越来越多,一个一个地数显然过于费时费力,这个时候就慢慢产生了进制——人们用某一个特殊的记号或者筹码代表一个固定的较大的数字。因为人类双手有十根手指,所以很自然地,在包括古埃及、古印度和中国古代在内的几乎所有古代文明都采用了十进制,只有古巴比伦人使用了60进制,玛雅人使用了20进制。在很多都市传说中,阿努纳奇和伊萨姆纳都来自于外太空,不属于地球文明。这里不展开。

上图为《大不列颠百科全书》中介绍的古埃及的十进制计数,及258458的写法。我们可以发现,在每个数位上,埃及人通过使用重复的记号表示这个数位上的数字,比如个位数为8,需要重复写出8个“|”。

随着语言和文字的进一步发展,人们慢慢摒弃了这种冗长的计数方式,开始对十进制的基本数字1 – 9使用特殊的文字(数字0的概念出现得更晚一些),最终完成了对各自语言中十进制数字系统的构建。

比如862在中文中是“八百六十二”,在英语中是“eight hundred sixty-two”。这种方式如果用数学来表示,即:

862 = 8 × 100 + 6 × 10 + 2

我们只需使用5个语言符号即可以表达这个数字。这5个语言符号分别为8,100,6,10和2。在中文中,它们一一对应于5个汉字,在英语中,虽然6和10合成了一个词,但在音节上,sixty仍然可以看成six-ty,-ty表示整十。

如果我们观察罗马数字,就会发现它的基本数字有7个,分别为I(1)、V(5)、X(10)、L(50)、C(100)、D(500)和M(1000),它们可以看成是十进制和五进制的一个混合模式。这种模式的起源也和我们一只手有五根手指有关。和单纯的十进制不同,罗马数字有“右加左减”的规则,即在较大数字的右边写上较小数字,表示大数加小数;在较大数字的左边写上较小数字,则表示大数减小数。

罗马数字的计数方式。

人类文明演化至今,发展出来大约5000到7000种语言,尽管绝大多数语言中的数字系统仍然使用十进制,但它们在具体的表达方式上存在着较大的差异。

比如,法语对数字的表达就很令人崩溃,法语中的基本数字为1 – 20。21 – 60使用了一般性的十进制方式,例如quarante是40,cinq是5,45就是quarante-cinq。

61 – 79则是基于60和1 – 19两个数字的加法,例如soixante是60,seize是16,76就是soixante-seize。

80是quatre-vingts,意思是4个20。

81 – 99则是基于80和1 – 19两个数字的加法,例如dix是10,90就是quatre-vingt-dix,字面意义上就是4个20再加上10。

法语中对数字的表达说明了语言中数字系统的复杂性,苏皮勒语是个非常不起眼的小语种,它对数字的表达方式又是如何?

下面我们来看看IOL的这道题。需要提醒的是,语奥的目的不是让我们掌握一门语言,而是通过逻辑分析来构建一个自洽系统。

首先我们观察一下5个训练样本中重复出现的单词或者词根。

词频最高的单词是na。进一步发现,代表的数字越大,na在词汇中出现的次数就越多。那么na是不是表示十进制中数位的分隔符呢?

并没有这么简单。我们发现个位数7中没有出现,十位数21中出现了1次,百位数285中出现了2次,千位数1639中出现了3次,但同时,百位数626中也出现了3次。所以不能简单地认为na和十的幂次一一相关,但它肯定和此有关。

类似于前面对十进制数字系统的分析,我们可以将na看作是数字不同部分的一种连接,或者说一种加法

接下来,注意beɲjaaga这个单词在21和1639中都出现。

既然na表示加法,那么在21中,beɲjaaga和niŋkin加起来等于21。那么beɲjaaga和niŋkin哪一个更小?

在1639中,beɲjaaga位于词汇的中间部分,前面有一个na,后面有两个na,不论该语言中数位从左到右呈现降幂排列还是升幂排列,beɲjaaga都不应该很大(比如表示1000),也不应该太小(比如表示个位数)。

结合beɲjaaga和niŋkin加起来等于21,可以初步判断出beɲjaaga比niŋkin,所以在该语言中,数位从左到右呈降幂排列,即先表示高位,后表示低位

再仔细观察1639,beɲjaaga后面有两个na,分别连接了kɛ和baaricyɛɛre两个单词,从上面数位顺序的判断可知,beɲjaaga > kɛ > baaricyɛɛre。

又已知beɲjaaga < 21,所以这三个数字加起来不会超过63,因此可以推断出,

beɲjaaga + kɛ + baaricyɛɛre = 39

因此,beɲjaaga > 13

结合beɲjaaga + niŋkin = 21,可以推出最合理的一组对应关系:

beɲjaaga = 20,kɛ = 10,baaricyɛɛre = 9,niŋkin = 1

当然,有读者朋友可能会提出,以下这组对应关系也可以满足这两个方程:

beɲjaaga = 18,kɛ = 15,baaricyɛɛre = 6,niŋkin = 3

但是,和18/15这样的基本数字相比,20/10更加符合十进制的特征。

接下来,观察7 = baashuunni,其中shuunni这个词根在285和626中都出现了,说明baashuunni是个复合词,由baa和shuunni组成。

再观察626中的baani,根据数位顺序可知baani = 6。又已知baaricyɛɛre = 9。

这三个单词中都有baa这个前缀,对应的数字都大于5,所以可以猜测baa 作为前缀表示加5

这样ni就对应于1,我们已知niŋkin = 1,是不是矛盾?并不。在很多语言中,基本数字在不同的数字中都有可能出现变体,比如英语中基本数字3是three,在13和30中就变成了前缀thir-。

恰恰相反,正是因为niŋkin 中的前缀为ni,所以更加坚定了我们对baani = 5 + 1的判断。语奥的目标,是找到逻辑自洽的体系。

根据baa 表示加5的结论,我们得出,

shuunni对应于2,cyɛɛre对应于4

这里cyɛɛre的写法不确定,因为在1639中有sicyɛɛre和(baa) ricyɛɛre,它们中有一个是变体。

在1639中,除去后面的beɲjaaga + kɛ + baaricyɛɛre = 39,可知kampwɔhii sicyɛɛre表示1600。而sicyɛɛre表示4,所以这里使用的必定不是加法,而只可能是乘法!

可以推测出,kampwɔhii = 400

至此,对数字7,21,1639的解析完成,我们得出:

niŋkin = 1
shuunni = 2
sicyɛɛre = 4
baa作为前缀表示加上5
baani = 6
baashuunni = 7
baaricyɛɛre = 9
kɛ = 10
beɲjaaga = 20
kampwɔhii = 400

我们接下来观察626。

按照我们前面构建的规则,beetaanre na baani应该等于26;但我们已知beɲjaaga是20,beɲjaaga na baani表示的是26,这里似乎出现了矛盾?

在我们的规则中,na表示加和是个基础,所以这里可以理解为,

kampwoo na ŋkwuu shuunni na beetaanre表示的是620

注意到ŋkwuu和taanre在285中也出现了。默认最后一个单词kaŋkuro = 5,所以,

ŋkwuu taanre na beeshuunni表示的是280

如果我们用数学等式来表示这两个关系,就可以得到:

kampwoo + 2 × ŋkwuu  + bee-taanre = 620

taanre × ŋkwuu + bee-shuunni = 280

再根据kampwɔhii = 400,猜测kampwɔhii是kampwoo的某个变体,所以kampwoo很可能就是400,这样进一步简化得到:

2 × ŋkwuu  + bee-taanre = 220

taanre × ŋkwuu + bee-shuunni = 280

根据bee-taanre和bee-shuunni两个单词的构词法,可以初步推测出taanre和shuunni (2)的量级一样,都是个位数。从我们已经推测得到的单词表中发现,个位数中仅仅缺失了3,所以可以猜测taanre = 3

而根据数位顺序,因为后面的na跟着的是个位数,所以bee-taanre和bee-shuunni表示的是某个十位数的整数倍。

将bee-taanre看作3 × bee-,bee-shuunni看作2 × bee-,原来的两个关系式变成了一个二元一次方程组,解得:

ŋkwuu = 80bee- = 20

这里的bee-和beɲjaaga不矛盾,bee-表示的是前缀20,beɲjaaga表示的是基本数字20。好比,baa-表示的是前缀5,kaŋkuro表示的是基本数字5。

至此,我们的数字体系已经完备:

1. 从左到右,表示数位从高到低的数字,两个数字之间的na表示加和,两个数字之间没有na的话表示乘积。

2. 基本数字:niŋkin = 1,shuunni = 2,taanre = 3,sicyɛɛre = 4,kaŋkuro = 5。kɛ = 10,beɲjaaga = 20,ŋkwuu  = 80,kampwoo = 400。

3. baa-作为前缀表示加上5,bee-作为前缀表示乘以20。

4. kampwoo用在乘法时的变体为kampwɔhii;sicyɛɛre用在加法时的变体为ricyɛɛre。

最后来完成答题。

(a) kampwɔhii shuunni na kɛ表示400 × 2 + 10 = 810;

ŋkuu na baataanre表示80 + (5 + 3) = 88。

(b) 15 = 10 + 5 = kɛ na kaŋkuro;

109 = 80 + 20 + (5 + 4) = ŋkwuu na beɲjaaga na baaricyɛɛre;

152 = 80 + 3 × 20 + 10 + 2 = ŋkwuu na beetaanre na kɛ na shuunni;

403 = 400 + 3 = kampwoo na taanre;

1534 = 400 × 3 + 80 × 4 + 10 + 4 = kampwɔhii taanre na ŋkwuu sicyɛɛre na kɛ na sicyɛɛre。

答题结束。