2023年IOL个人赛第4题分析和解答

上次我们对第20届语言学奥林匹克竞赛(IOL)个人赛的第5题,也就是数字题进行了分析和解答【1】,今天来试一试第4题,这是一道文字题。

一般来说和数字题相比,文字题要更复杂一些,涉及语言学的要素也会更多一些。这道文字题的语言背景是平原克里语,这是个啥语言、什么人用的语言我们并不关心;我们关心的是如何利用示例来建立起逻辑自洽的语言结构。

题目中给出了21个示例,其中16个例子在汉语中都是“人称代词+动词+人称代词”的结构,另外给出了5个示例,分别对应于从句“当……时”和“如果……”。题目的任务是(a)将四个平原克里语短句翻译成汉语,和(b)将五个汉语短句翻译成平原克里语。

我们先粗略地对前16个示例的汉语翻译做一个统计,分别统计短句中的动词和人称代词。

动词方面,16个示例中一共出现了5个动词,这5个动词及其出现的示例数如下:

1. 挑战,出现3次。

2. 看到,出现4次。

3. 阻止,出现3次。

4. 问,出现3次。

5. 帮助,出现3次。

对于每个动词,在它的示例中找出“最大公约数”,即最大的相同部分。比如对比示例5,13和16,找出wīcih是这三个短句的最大的相同部分。

注意:这个部分不一定就和动词的原型一一对应——因为还可能有性、数、格的不同——但至少包含了动词的词根。

1. 挑战 = mawinēskom。

2. 看到 = wāpam。

3. 阻止 = nakin。

4. 问 = kakwēcim。

5. 帮助 = wīcih。

我们注意到后面5个动词的相同部分最后都以辅音结束,所以为了保持一致,我们省去第1个动词相同部分的最后一个元音字母i。

再来看看人称代词部分。从汉语翻译中,我们可知人称代词在这些示例中以主语或者宾语两个语法成分出现,再加上第一、第二和第三人称的单复数,组合起来一共有36种可能。

我们将这些可能用下表来表示,其中行标题表示主语,列标题表示宾语,表格中的数字是示例的编号:

主语\宾语我们你们他们
16217,1812
我们111164
835,20?
你们231715
1?1013
他们19914?

可见,示例并没有完全涵盖这36种可能,其中反身用法(如:“我……我们”,“你们……你”,“他……他”等)没有在示例中出现,也没有在任务(b)中出现,所以我们在以下的分析中忽略这12种可能。

注意到,这里有两个特殊的示例:3和11。对应的汉语翻译中,这两个短句可以翻译成“你”,也可以翻译成“你们”。但在另外一些示例,比如8和2,分别只能翻译成“你”或者“你们”。这是一个需要注意的点。

除去这些种可能,另外还有3种可能的组合没有在示例中出现,我们将它们用“?”表示。注意到,部分组合出现在任务(b)中,比如任务30就是“我……你们”的组合。不排除在任务(a)中也出现部分缺失的组合。

我们发现在示例中动词的相同部分相对统一和简单,所以将它们从短句里拆分出来,我们把分析的重点放在人称代词上。

下一步,我们把分析的重点放在人称代词上,这是因为我们发现动词在示例中出现的形式比较统一,相对简单。所以我们将动词相同的部分从短句中拆分出来:

1. ni – ik — 他挑战我

2. ki – ināwāw — 你们看到我

3. ki – inān — 你阻止我们,你们阻止我们

4. ni – ānānak — 我们问他们

5. ki – āw — 你帮助他

6. ni – ānān — 我们问他

7. ni – āw — 我看到他

8. ki – in — 你挑战我

9. ni – ikonānak — 他们挑战我们

10. ki – ik — 他问你

11. ki – itinān — 我们看到你,我们看到你们

12. ni – āwak — 我阻止他们

13. ki – ikowāw — 他帮助你们

14. ki – ikwak — 他们阻止你

15. ki – āwāwak — 你们看到他们

16. ki – itin — 我帮助你                

我们用同样的方式处理示例17 – 21:

17. ē- – āyēk — 当你们阻止他时

18. ē- – ak — 当我帮助他时

19.  – ikoyāhkwāwi — 如果他们挑战我们

20.  – aci — 如果你看到他

21.  – itako — 如果我帮助你们

把动词拆出来后,我们很容易发现:

1. 前16个短句要么以ni-开头,要么以ki-开头,而且两种类型似乎和第几人称无关,因为示例中包含了各种人称。

2. “当……时”的从句应该和ē- 相对应。

3. “如果……”的从句直接以动词开头。

个人感觉ni-和ki-的区别是解决本题的关键。

分析示例4,6,7和12,即人称代词表格中右上角的四个方格,它们表示主语为第一人称、宾语为第三人称的四种情况,我们发现在平原克里语中这四个示例全以ni-开头,所以初步猜测ni-和第二人称没有关系。

为了进一步确认这一猜想,我们再看看示例1和9,即人称代词表格中左下角的四个方格,它们表示主语为第三人称、宾语为第一人称的两种情况,这两个示例确实全以ni-开头。而以上这6个示例恰恰是16个示例中和第二人称无关的所有示例!

那么反过来,ki-开头的短句是否全部都与第二人称有关呢?我们查验以下另外10个以ki-开头的示例,确实都与第二人称有关!

因此,我们可以推断出:ni = 主语和宾语仅和第一人称、第三人称有关;而ki = 主语或宾语与第二人称有关

得到这个推断的同时,我们也意识到动词前面的ni-或者ki-并不代表某个特定的人称,这意味着不论是主语还是宾语,它们都位于动词后面。所以我们下面把重点放在动词后的那一堆字母之上。

回到表格的右上角,这4个示例是第一人称作为主语、第三人称作为宾语时的情况:

7. ni – āw — 我看到他  vs.  12. ni – āwak — 我阻止他们

6. ni – ānān — 我们问他  vs.   4. ni – ānānak — 我们问他们

比较这四个短句动词后的部分,从7和12,6和4可以推测出-ak后缀表示第三人称复数,从7和6可以推测出-nān后缀表示第一人称复数。其中示例6中表示第三人称单数-w可能因为缺少元音而被省去。

小结一下:

“我……他” = āw;“我……他们” = āw-ak;

“我们……他” = ā-nān;“我们……他们” = ā-nān-ak。

这个推测在示例18上可以得到验证。

再来看左下角的两个示例。

1. ni – ik — 他挑战我

9. ni – ikonānak — 他们挑战我们

对比一下,可以猜测-ik表示“他……我”,-iko表示主语的“他们”,而这里出现的-nān表示“我们”,-ak表示“他们”,符合我们上面的推测。

将示例9和示例4进行比较,可见iko的作用就是表示第三人称成为主语。

小结一下:

“他……我” = ik;“他们……我们” = iko-nān-ak。

不过,虽然示例19符合-iko的用法,但其它部分非常复杂,条件从句的情况我们留到后面再讨论。

再来看看和第二人称有关的ki-句式。

示例16和11表示第一人称主语、第二人称宾语的情况:

16. ki – itin — 我帮助你  vs.  11. ki – itinān — 我们看到你,我们看到你们

可知-itin表示“我……你”,-iti-nān表示“我们……你”,这里-nān的后缀用法也符合我们上面的推测。

示例21也是条件从句,留在后面讨论。

示例10,13和14表示第三人称主语、第二人称宾语的情况:

10. ki – ik — 他问你  vs.  13. ki – ikowāw — 他帮助你们

14. ki – ikwak — 他们阻止你

很有意思,这里表示“他……你”的也是-ik,和“他……我”一样。那么怎么区分宾语到底是“你”还是“我”?很简单,看句子是ni-还是ki-开头。

示例13中,-iko表示第三人称作主语,符合我们上面的推测,剩下的-wāw表示第二人称复数。

示例14中,-ak表示第三人称复数,ik和ak之间用w连接。

再来看看第二人称作主语的情况。

示例8,2和3表示第二人称主语、第一人称宾语的情况。

8. ki – in — 你挑战我

2. ki – ināwāw — 你们看到我  vs.  3. ki – inān — 你阻止我们,你们阻止我们

上面例子说明-in表示“你……我”,和表示“他……我”或者“我……他”的-ik同样简洁。

表示“你们……我”的-ināwāw中,-in表示第二人称作主语,-(ā)wāw表示第二人称复数。

表示“你……我们”的-inān类似于in-nān,符合我们上面的推测,两个连续的n可能被省去了一个。注意到,在有第一人称复数-nān的情况下,在平原克里语法上可能无法再加上-wāw表示第二人称复数,所以示例3和11中,对于第二人称都存在单数和复数两种不同的解读。

示例5和15表示第二人称主语、第三人称宾语的情况。

5. ki – āw — 你帮助他

15. ki – āwāwak — 你们看到他们

-(ā)wāw表示第二人称复数,-ak表示第三人称单数,再次验证了我们上面的判断!

示例17表示了“你们……他”的情况。

17. ē- – āyēk — 当你们阻止他时

这个不大好分析。因为缺少了ni-和ki-带来的额外信息,我们不知道哪个部分指定了第二人称,从示例1、5、7可以看出,第三人称单数作为宾语大致是默认的。所以可以猜也许整个-āyēk就是表示“你们”作主语。

最后看看3个和条件从句有关的示例19,20和21。我只能分析出部分的语法结构:

19.  – ikoyāhkwāwi — 如果他们挑战我们

这里-iko表示第三人称为主语,后面一堆yāhkwāwi不知道如何拆,只知道它表示“他们……我们”。

20.  – aci — 如果你看到他

这里-aci也没法拆,在以ki-开始的普通句式中,“你……他”用-āw来表示,但在这个条件从句中,看不出两者之间的联系。

21.  – itako — 如果我帮助你们

这里能看出来的只有-it,表示第一人称主语、第二人称宾语。那么-ako就和第二人称复数有关。在以ki-开始的普通句式中,第二人称复数用-(ā)wāw来表示,同样看不出两者之间的联系。

最后,让我们来尝试完成任务。

(a)

22. ē-wāpamikoyēk = ē-wāpam-iko-yēk。ē-表示“当……时”,wāpam表示动词“看到”,iko表示第三人称为主语,参考示例17,yēk应该表示的是“你们”,所以这个短句翻译为:当他看到你们时。

23. ninakinikonān = ni-nakin-iko-nān。ni表示与第二人称无关的内容,nakin表示动词“阻止”,iko表示第三人称为主语,nān表示第一人称复数,参考示例9,所以这个短句翻译为:他阻止我们。

24. kikakwēcimāwāw = ki-kakwēcim-āwāw。ki表示与第二人称有关的内容,kakwēcim表示动词“问”,-(ā)wāw表示第二人称复数,默认第三人称单数,参考示例15,所以这个短句翻译为:你们问他。

25. kiwīcihitināwāw = ki-wīcih-itin-āwāw。ki表示与第二人称有关的内容,wīcih表示动词“帮助”,itin表示“我……你”,-(ā)wāw表示第二人称复数,所以这个短句翻译为:我帮助你们。

(b)

26. 如果我们问他们。“如果……”是条件从句,动词“问”是kakwēcim,第一人称和第三人称都是复数,参考示例19,不过这里“我们”是主语,示例19中“我们”是宾语,因为iko表示第三人称作主语,将iko换成a表示第一人称作主语,所以这个短句翻译为:kakwēcim-a-yāhkwāwi。

27. 他们挑战你们。和第二人称有关用ki开头,动词“挑战”是mawinēskom,第三人称复数作主语用iko-…-ak,第二人称复数用-(ā)wāw,参考示例13和14,且示例中从未出现连续两个元音,所以这个短句翻译为:ki-mawinēskom-iko-wāw-ak。

28. 他们帮助我。和第二人称无关用ni开头,动词“帮助”是wīcih,“他们”作为主语是iko-…-ak,参考示例14,所以这个短句翻译为:ni-wīcih-ik-w-ak。

29. 你看到他们。和第二人称有关用ki开头,动词“看到”是wāpam,第三人称复数作宾语用āw-ak,参考示例5,所以这个短句翻译为:ki-wāpam-āw-ak。

30. 我阻止你们。和第二人称有关用ki开头,动词“阻止”是nakin,第一人称作主语、第二人称作宾语为itin,第二人称复数用-(ā)wāw,参考示例16和2,所以这个短句翻译为:ki-nakin-itin-āwāw。

参考出处:

  1. https://sqr5.wordpress.com/2023/08/05/2023%e5%b9%b4iol%e4%b8%aa%e4%ba%ba%e8%b5%9b%e7%ac%ac5%e9%a2%98%e5%88%86%e6%9e%90%e5%92%8c%e8%a7%a3%e7%ad%94/

2023年IOL个人赛第5题分析和解答

前几天在公众号上分享了今年在保加利亚举行的第20届语言学奥林匹克竞赛(IOL)的赛题。

有读者留言:题目看了,但该怎么做呢?

目前IOL官网上尚未公布标准答案,我在语奥方面经验和水平有限,下面仅以个人赛第5题为例,分享一下个人对这道题的分析和理解,以及我得到的答案,作为抛砖引玉吧。

个人赛第5题是一道数字题,也是题目篇幅最小的一道题。

题目中给出了5个数字及其在苏皮勒语中的写法。换句话说,这5个数字就是某种意义上的训练集,我们需要利用它们构建一个自洽的逻辑,用来解释苏皮勒语中的数字系统,然后在这个自洽逻辑的帮助下,写出两个苏皮勒词汇对应的阿拉伯数字(a),和五个阿拉伯数字对应的苏皮勒词汇(b)。

在进入对题目的分析之前,我们简单地了解一下我们的语言对数字的描述。

人类对数字的概念,产生于人类文明演化和发展之初。在原始部落的狩猎和采集活动中,人们的收获往往是不固定的:今天打了一只山鸡回来,收获了10几颗酸枣儿;明天可能就颗粒无收要饿肚子。久而久之,人们就渐渐有了“多”和“少”的概念,继而通过结绳、刻痕、收集筹码等方式开始尝试计数。

随着人类接触的物体的数量越来越多,一个一个地数显然过于费时费力,这个时候就慢慢产生了进制——人们用某一个特殊的记号或者筹码代表一个固定的较大的数字。因为人类双手有十根手指,所以很自然地,在包括古埃及、古印度和中国古代在内的几乎所有古代文明都采用了十进制,只有古巴比伦人使用了60进制,玛雅人使用了20进制。在很多都市传说中,阿努纳奇和伊萨姆纳都来自于外太空,不属于地球文明。这里不展开。

上图为《大不列颠百科全书》中介绍的古埃及的十进制计数,及258458的写法。我们可以发现,在每个数位上,埃及人通过使用重复的记号表示这个数位上的数字,比如个位数为8,需要重复写出8个“|”。

随着语言和文字的进一步发展,人们慢慢摒弃了这种冗长的计数方式,开始对十进制的基本数字1 – 9使用特殊的文字(数字0的概念出现得更晚一些),最终完成了对各自语言中十进制数字系统的构建。

比如862在中文中是“八百六十二”,在英语中是“eight hundred sixty-two”。这种方式如果用数学来表示,即:

862 = 8 × 100 + 6 × 10 + 2

我们只需使用5个语言符号即可以表达这个数字。这5个语言符号分别为8,100,6,10和2。在中文中,它们一一对应于5个汉字,在英语中,虽然6和10合成了一个词,但在音节上,sixty仍然可以看成six-ty,-ty表示整十。

如果我们观察罗马数字,就会发现它的基本数字有7个,分别为I(1)、V(5)、X(10)、L(50)、C(100)、D(500)和M(1000),它们可以看成是十进制和五进制的一个混合模式。这种模式的起源也和我们一只手有五根手指有关。和单纯的十进制不同,罗马数字有“右加左减”的规则,即在较大数字的右边写上较小数字,表示大数加小数;在较大数字的左边写上较小数字,则表示大数减小数。

罗马数字的计数方式。

人类文明演化至今,发展出来大约5000到7000种语言,尽管绝大多数语言中的数字系统仍然使用十进制,但它们在具体的表达方式上存在着较大的差异。

比如,法语对数字的表达就很令人崩溃,法语中的基本数字为1 – 20。21 – 60使用了一般性的十进制方式,例如quarante是40,cinq是5,45就是quarante-cinq。

61 – 79则是基于60和1 – 19两个数字的加法,例如soixante是60,seize是16,76就是soixante-seize。

80是quatre-vingts,意思是4个20。

81 – 99则是基于80和1 – 19两个数字的加法,例如dix是10,90就是quatre-vingt-dix,字面意义上就是4个20再加上10。

法语中对数字的表达说明了语言中数字系统的复杂性,苏皮勒语是个非常不起眼的小语种,它对数字的表达方式又是如何?

下面我们来看看IOL的这道题。需要提醒的是,语奥的目的不是让我们掌握一门语言,而是通过逻辑分析来构建一个自洽系统。

首先我们观察一下5个训练样本中重复出现的单词或者词根。

词频最高的单词是na。进一步发现,代表的数字越大,na在词汇中出现的次数就越多。那么na是不是表示十进制中数位的分隔符呢?

并没有这么简单。我们发现个位数7中没有出现,十位数21中出现了1次,百位数285中出现了2次,千位数1639中出现了3次,但同时,百位数626中也出现了3次。所以不能简单地认为na和十的幂次一一相关,但它肯定和此有关。

类似于前面对十进制数字系统的分析,我们可以将na看作是数字不同部分的一种连接,或者说一种加法

接下来,注意beɲjaaga这个单词在21和1639中都出现。

既然na表示加法,那么在21中,beɲjaaga和niŋkin加起来等于21。那么beɲjaaga和niŋkin哪一个更小?

在1639中,beɲjaaga位于词汇的中间部分,前面有一个na,后面有两个na,不论该语言中数位从左到右呈现降幂排列还是升幂排列,beɲjaaga都不应该很大(比如表示1000),也不应该太小(比如表示个位数)。

结合beɲjaaga和niŋkin加起来等于21,可以初步判断出beɲjaaga比niŋkin,所以在该语言中,数位从左到右呈降幂排列,即先表示高位,后表示低位

再仔细观察1639,beɲjaaga后面有两个na,分别连接了kɛ和baaricyɛɛre两个单词,从上面数位顺序的判断可知,beɲjaaga > kɛ > baaricyɛɛre。

又已知beɲjaaga < 21,所以这三个数字加起来不会超过63,因此可以推断出,

beɲjaaga + kɛ + baaricyɛɛre = 39

因此,beɲjaaga > 13

结合beɲjaaga + niŋkin = 21,可以推出最合理的一组对应关系:

beɲjaaga = 20,kɛ = 10,baaricyɛɛre = 9,niŋkin = 1

当然,有读者朋友可能会提出,以下这组对应关系也可以满足这两个方程:

beɲjaaga = 18,kɛ = 15,baaricyɛɛre = 6,niŋkin = 3

但是,和18/15这样的基本数字相比,20/10更加符合十进制的特征。

接下来,观察7 = baashuunni,其中shuunni这个词根在285和626中都出现了,说明baashuunni是个复合词,由baa和shuunni组成。

再观察626中的baani,根据数位顺序可知baani = 6。又已知baaricyɛɛre = 9。

这三个单词中都有baa这个前缀,对应的数字都大于5,所以可以猜测baa 作为前缀表示加5

这样ni就对应于1,我们已知niŋkin = 1,是不是矛盾?并不。在很多语言中,基本数字在不同的数字中都有可能出现变体,比如英语中基本数字3是three,在13和30中就变成了前缀thir-。

恰恰相反,正是因为niŋkin 中的前缀为ni,所以更加坚定了我们对baani = 5 + 1的判断。语奥的目标,是找到逻辑自洽的体系。

根据baa 表示加5的结论,我们得出,

shuunni对应于2,cyɛɛre对应于4

这里cyɛɛre的写法不确定,因为在1639中有sicyɛɛre和(baa) ricyɛɛre,它们中有一个是变体。

在1639中,除去后面的beɲjaaga + kɛ + baaricyɛɛre = 39,可知kampwɔhii sicyɛɛre表示1600。而sicyɛɛre表示4,所以这里使用的必定不是加法,而只可能是乘法!

可以推测出,kampwɔhii = 400

至此,对数字7,21,1639的解析完成,我们得出:

niŋkin = 1
shuunni = 2
sicyɛɛre = 4
baa作为前缀表示加上5
baani = 6
baashuunni = 7
baaricyɛɛre = 9
kɛ = 10
beɲjaaga = 20
kampwɔhii = 400

我们接下来观察626。

按照我们前面构建的规则,beetaanre na baani应该等于26;但我们已知beɲjaaga是20,beɲjaaga na baani表示的是26,这里似乎出现了矛盾?

在我们的规则中,na表示加和是个基础,所以这里可以理解为,

kampwoo na ŋkwuu shuunni na beetaanre表示的是620

注意到ŋkwuu和taanre在285中也出现了。默认最后一个单词kaŋkuro = 5,所以,

ŋkwuu taanre na beeshuunni表示的是280

如果我们用数学等式来表示这两个关系,就可以得到:

kampwoo + 2 × ŋkwuu  + bee-taanre = 620

taanre × ŋkwuu + bee-shuunni = 280

再根据kampwɔhii = 400,猜测kampwɔhii是kampwoo的某个变体,所以kampwoo很可能就是400,这样进一步简化得到:

2 × ŋkwuu  + bee-taanre = 220

taanre × ŋkwuu + bee-shuunni = 280

根据bee-taanre和bee-shuunni两个单词的构词法,可以初步推测出taanre和shuunni (2)的量级一样,都是个位数。从我们已经推测得到的单词表中发现,个位数中仅仅缺失了3,所以可以猜测taanre = 3

而根据数位顺序,因为后面的na跟着的是个位数,所以bee-taanre和bee-shuunni表示的是某个十位数的整数倍。

将bee-taanre看作3 × bee-,bee-shuunni看作2 × bee-,原来的两个关系式变成了一个二元一次方程组,解得:

ŋkwuu = 80bee- = 20

这里的bee-和beɲjaaga不矛盾,bee-表示的是前缀20,beɲjaaga表示的是基本数字20。好比,baa-表示的是前缀5,kaŋkuro表示的是基本数字5。

至此,我们的数字体系已经完备:

1. 从左到右,表示数位从高到低的数字,两个数字之间的na表示加和,两个数字之间没有na的话表示乘积。

2. 基本数字:niŋkin = 1,shuunni = 2,taanre = 3,sicyɛɛre = 4,kaŋkuro = 5。kɛ = 10,beɲjaaga = 20,ŋkwuu  = 80,kampwoo = 400。

3. baa-作为前缀表示加上5,bee-作为前缀表示乘以20。

4. kampwoo用在乘法时的变体为kampwɔhii;sicyɛɛre用在加法时的变体为ricyɛɛre。

最后来完成答题。

(a) kampwɔhii shuunni na kɛ表示400 × 2 + 10 = 810;

ŋkuu na baataanre表示80 + (5 + 3) = 88。

(b) 15 = 10 + 5 = kɛ na kaŋkuro;

109 = 80 + 20 + (5 + 4) = ŋkwuu na beɲjaaga na baaricyɛɛre;

152 = 80 + 3 × 20 + 10 + 2 = ŋkwuu na beetaanre na kɛ na shuunni;

403 = 400 + 3 = kampwoo na taanre;

1534 = 400 × 3 + 80 × 4 + 10 + 4 = kampwɔhii taanre na ŋkwuu sicyɛɛre na kɛ na sicyɛɛre。

答题结束。

丹麦语的数字表达,你能破解它吗?

亚历克斯∙贝洛斯(Alexander Bellos)是一位英国作家,同时也是一位数学科普者。贝洛斯从牛津大学数学系毕业后,进入新闻行业工作,不久后即加入卫报,成为卫报驻南美的记者。在此期间,贝洛斯写作了《足球:巴西人的生活方式》和《贝利:自传》等畅销书。

结束驻外生活回到英国后,贝洛斯开始撰写数学科普方面的文章,并在每日电讯报上开设了专栏。2010年,贝洛斯的新书《亚历克斯在数字王国的冒险》出版,在英国畅销书排行榜上停留了四个月的时间,该书的意大利语版本曾获得伽利略科学书籍奖和皮亚诺数学书籍奖。同时,贝洛斯还是BBC的特邀主持人,常常在节目中谈论数学问题,他在Radio 4上的纪录片《数字涅槃》入围了2014年英国科学作家协会奖最佳广播节目。

下面这道语言趣题来自于贝洛斯2020年出版的书籍《语言爱好者的谜题》(The Language Lover’s Puzzle Book: Lexical perplexities and cracking conundrums from across the globe)。在这本书中,贝洛斯收集和介绍了100多个填字游戏、语言游戏和谜题,展示了这个世界上文字和语言的多样性以及它们和数学的有趣的联接。

这道语言趣题和丹麦语中的数字表达有关。大家都知道法语表达数字的方法比较“拧巴”,其实不仅仅是法语,在欧洲,有不少语言的数字表达方式都比较复杂,比如在德语和荷兰语中就存在十位数和个位数的倒置表达方式等。在欧洲这些语言中,丹麦语对数字的表达应该算是比较独特的。

题目中给出了一些数字在丹麦语中的写法:

fire = 4

nioghalvfjerds = 79

toogtyve = 22

seksogtres = 66

ni = 9

syvoghalvtreds = 57

enogfirs = 81

tre = 3

fem = 5

问,以下丹麦语表示的数字分别是多少?

seks,nioghalvtreds,treogtyve,femoghalvfems,toogtres,halvfjerds

以及,如何用丹麦语表示以下数字?

7,54,21,85和99

我们从题目示例中的个位数入手,因为个位数最简单,一般不涉及语法结构。示例一共有9条,其中4条是个位数,它们分别是:fire = 4,ni = 9,tre = 3和fem = 5。

未知的个位数字有1,2,6,7和8。

示例中还剩下5个两位数,它们分别是:nioghalvfjerds = 79,toogtyve = 22,seksogtres = 66,syvoghalvtreds = 57和enogfirs = 81。

仔细观察一下,这5个词语中都有A-og-B这样的结构,很明显og这个结构和两位数有关。

再观察一下5个两位数中的79,它的分结构为ni-og-halvfjerds;而我们正好已知9的个位数表示为ni,因此可以推断在丹麦语中,两位数中个位数字和十位数字以og连接,且同样存在倒置的表达方式,即个位数字在前,十位数字在后。

根据这个推断,我们从余下的4个两位数中得到其它4个个位数的表达:

to-og-tyve = 22 → to = 2;

seks-og-tres = 66 → seks = 6;

syv-og-halvtreds = 57 → syv = 7;

en-og-firs = 81 → en = 1。

现在9个个位数里只差8了。

再来看看两位数中的十位数字的表示。

和个位数的表示相对比,可以找到两个相对简单的例子:

seks-og-tres = 66,其中tre = 3,tres在这里则表示60;

en-og-firs = 81,其中fire = 4,firs在这里则表示80。

这使得我们可以猜测:是不是(og)-tres表示20 × 3,而(og)-firs表示20 × 4?

如果是这样,那么20为什么不是(og)-ens?这里先放下。

另外还有两个十位数字为奇数的例子:ni-og-halvfjerds = 79和syv-og-halvtreds = 57。这两个数字中都带有halv-的结构,是不是和奇数有关?比如halv-treds是不是表示20 × 3 – 10?如果是这样的话,那么为什么70不是halv-fireds而是halvfjerds。这里也先放下。

来看看需要完成的丹麦语到数字的翻译。

seks = 6,这个我们已经推断出来了;

nioghalvtreds,十位数字halvtreds = 50例子里有,所以这个数字是59;

treogtyve,同样十位数字tyve = 20例子里有,所以这个数字是23;

femoghalvfems,这个十位数字例子里没有,但根据上面的推断,我们可以猜测halv-fems = 20 × 5 – 10 = 90,所以这个数字是95;

toogtres,这个简单,是62;

halvfjerds,这个翻译问题的出现验证了-og-本身只是一个连接词,它不表示十位数;而-og-后面接的部分才表示“几十”,所以这个数字是70。

再来看看从数字到丹麦语的翻译。

7 = syv,这个很简单;

54 =  fireoghalvtreds,照搬例子中的50即可;

21 = enogtyve,同样是照搬;

85 = femogfirs,还是照搬;

99 = nioghalvfems,这里用到了前面丹麦语到数字翻译题目中的halvfems。

好了,题目做完了,再来看看丹麦语中的数字表达体系。

丹麦语对大于50的十位数字的表达,是基于20进制的,并使用halv表示20的一半,即10。具体来说,

halftreds从字面上来说就是“第3个(20)再减去一半”,即20 × 3 – 10 = 50。

tres就是“第3个(20)”,即20 × 3 = 60。

halvfjerds就是“第4个(20)再减去一半”,即20 × 4 – 10 = 70。

firs就是“第4个(20)”,即20 × 4 = 80。

halvfems就是“第5个(20)再减去一半”,即20 × 5 – 10 = 90。

这样的表达方式非常复杂,尤其对于不懂丹麦语的游客来说,他们很难理解为什么“50”里找不到和“5”有关的单词,而只能找到表示“一半”和“3”的单词。

上世纪50年代,为了简化丹麦语的表达方式,丹麦政府曾经推行过数字的简化表达方式,用类似于英语的单词femti,seksti,syvti,otti和niti分别表示50,60,70,80和90,并将简化后的“50”femti印在了1957年发行的50克朗纸钞上。在此后1972年和1997年两次的新钞发行中,femti都被用来表示“50”。

不过,很可惜,这种语言的简化没有被民众们所接受,他们虽然不反对使用印有femti的50克朗,但从不愿意在语言中使用femti这个词。最终,这个语言简化方案宣告失败,丹麦国家银行逐步回收印有femti的钞票,并在2009年重新发行了印有halvtreds的50克朗新钞。

夏洛克的语奥题

柯南·道尔所著的神探福尔摩斯系列小说《福尔摩斯归来记》中有一个短篇故事,叫做《小舞人探案》(The Adventure of the Dancing Men)。在这个故事中,夏洛克·福尔摩斯运用语言学的知识破解了凶杀案中最关键的线索——一个个画着火柴人不同舞姿的图案,最后成功地找出了凶手。可以说,这个关键线索是不同形态火柴人的故事,使得福尔摩斯系列小说中第一次出现了类似于语言奥林匹克竞赛的情景。

1984年根据柯南·道尔小说改编的电视剧《跳舞的人》(The Dancing Men)剧照。

美国伊利诺斯州班尼迪克大学(Benedictine University)的数学系教授Manmohan Kaur将这个探案故事改编成了一个课堂活动,并发表在2021年7月份的《人文数学杂志》(Journal of Humanistic Mathematics)上。Kaur教授想通过这个课堂活动让学生们明白,数学思维很有趣,也很有用,福尔摩斯用了几天破解了密码,而学生们用50分钟同样可以破解密码。神探能做到的,他们也能做到。

在对故事内容进行精简和优化之后,这个语奥课堂活动的表述如下:

课堂活动文本和材料

英国Elriges小镇的Hilton Cubitt先生拜访了你,给了你一张纸条。这张纸条是在他家花园里的日晷上发现的,纸条上画了一排神秘的火柴人。

消息1:

Cubitt解释说,他最近和一名叫做Elsie Patrick、来自芝加哥的美国女人结了婚。在婚礼前,这个女人曾经要求他不要过问她的过去,因为尽管她个人并没有做过什么可耻的事情,但是她在生活中确实有过一些“非常不愉快的经历”。婚后的他们一直很幸福,直到这些小纸条开始出现在他们的生活中,一开始有人将它们从芝加哥匿名寄过来,现在它们又出现在家中的花园里。

这些纸条让Elsie感到非常害怕,但她没有解释自己害怕的原因;Cubitt则坚守着他的诺言,没有追问Elsie过去在芝加哥的生活。如果仔细观察这些火柴人,并试图去理解它们的含义,你会注意到有些小人举着旗子,这些旗子可能意味着什么?也许标识着单词的结束?

第二天早上,Cubitt先生在花园工具房的黑色木门上又发现了一组新的、用粉笔画上去的火柴人。

消息2:

两天后的早晨,又出现了第3条消息。

消息3:

三天后,有人把一组火柴人画在纸上,再把这张纸用一块鹅卵石压在日晷上。

消息4:

Cubitt把这些纸条和消息原样描了下来,交给了你,你的任务是帮助他搞清楚到底发生了什么。你给你在芝加哥警察局的朋友打了电话,请她调查和搜集关于Elsie Patrick的背景资料。

很快,你了解到Elsie是芝加哥一个黑帮老大的女儿,并曾经与她父亲手下一个叫Abe Slaney的人订婚,但她最终得以逃离之前的这段生活,来到英国。

你仔细检查了不同形状火柴人出现的情况。你发现消息4的笔迹不大一样,所以你猜测它可能来自于另一个人,也许就是Elsie本人;而其它三条消息来自于未知的那个人(很可能就是罪犯)。在接下来的两天中,你试图对这些火柴人进行一些推理,找出它们代表的含义。你现在可以肯定,一些图案上的旗子表示单词的结束;你还知道,每一个特定的英文字母被替换成了一个特定形状的火柴人,消息通过这种方式被加密;而字频分析就是找出这个替换规则的最好办法。

因此,你可以逐步回答以下问题。

1. 英语中最常见的字母是什么?这个字母应该是“E”。

2. 这个最常见的字母在最后一条消息(消息4)中出现了2次,这条消息可能是什么意思?

3. 这个最常见的字母在消息3中出现了3次,第一个词中出现了1次,第二个词中出现了2次。第一个词是_ _ _ E,第二个词是E _ _ _ E。这条消息是罪犯发给Elsie的,它可能是什么意思?

4. 消息2也来自于罪犯,它由两个单词组成,第一个单词只有两个字母。消息2可能是什么意思?

5. 利用你现在已经知道的信息,消息1可能是什么意思?

三天后,又有一条消息出现。

消息5:

6. 看到这条消息,你感到危险正在逼近Cubitt夫妇。你马上赶到Elriges,但还是来迟了一步,你发现Cubitt先生心脏中枪而死,而他的妻子则头部中枪受了重伤。消息5可能是什么意思?

7. 诺福克郡警察局的Martin探长认为这是一起谋杀和自杀组成的案件,因为现场找到的手枪属于Cubbit先生,所以Elsie很可能是杀害Cubbit先生的主要嫌疑人,她杀死丈夫后选择了自杀。虽然你同意Elsie是自杀的判断,但在发现了探长判断中的一些矛盾之处之后,你认为此案中还存在第三个人。你将如何向Martin探长证明有第三个人的参与?

8. 如何抓到真正的罪犯?

关键提示和问题答案:

1. 最常见的火柴人是。所以它应该代表着字母“E”。

2. 与其它的可能“LEVER”、“SEVER”、“FEVER”相比,消息4应该是“NEVER”。

3. 消息3应该是“COME ELSIE”。第一个词的可能有:“LOVE”、“DOVE”、“SAME”、“COME”、“LIKE”等等;第二个词的可能有“ELOPE”、“ELATE”、“ELSIE”等等。

4. 根据已知的信息,消息2是“_ _ ELRI _ ES”。两个字母组成的单词可能是“IS”、“AN”、“AT”、“AM”、“ON”、“OF”、“GO”、“IN”等等;第二个词比较简单,应该是“ELRIGES”。所以消息2的答案是“AT ELRIGES”。

5. 根据已知的信息,消息1是“A _  _ ERE A _ E SLANE _”。联系到Elsie前未婚夫的名字,这条消息应该是“AM HERE ABE SLANEY”。

6. 现在来看消息5:“ELSIE _RE _ ARE TO MEET TH _  GO _”。这句话应该是“ELSIE PREPARE TO MEET THY GOD”。

7. 根据上面解密的消息,罪犯应该是Abe Slaney。

8. 第8个问题并没有一个标准答案。一个可能的答案是,你可以模仿Elsie的笔迹用加密后的火柴人形状写下“COME HERE AT ONCE”,并放在日晷上。Abe Slaney不知道Elsie自杀,所以会匆匆赶来,从而被警察抓住。

一个可能的案件还原是:Abe Slaney从芝加哥来到英国,目的是找回Elsie。Elsie表示不愿意再和他见面,但Abe Slaney仍然跑到Elsie家纠缠。正在两人争吵之际,Cubitt带着枪出现了。激烈搏斗后,Abe Slaney夺过枪打死了Cubbit,然后逃走;Elsie见丈夫因为自己丧命,负疚开枪自杀。

以上即Kaur教授课堂活动的文本材料和提示。

柯南·道尔原著中的推理过程相当精彩,完全可以作为一个语奥爱好者的练习材料,只不过文字内容较多,无法在一节课中完成,所以Kaur教授的改编也非常精彩,改编中给出了提示可以帮助学生更快地找到思路,从而在50分钟内完成所有消息的破解工作。

对于感兴趣读者朋友,我推荐大家可以去看看原著,或者看看下面这个单行本。

一道简单的语奥题

自从被吴老师种草语言学奥林匹克,我一直没有真正完整地做过一道题。下图是网传的一道简单的语奥问题,前两天正好有时间,我体会了一把语奥的乐趣。

以下是我的解答思路,不一定符合语奥的规范,如果其中存在逻辑不完备甚至错误,还望有心人帮我指出。

按照我粗浅的理解,语奥问题的核心在于从给出的对象语言和参考语言一一对应的例子出发,建立起自洽的对象语言的词法或者语法规则。这些“建立”起来的规则不一定符合现实中对象语言真正的词法和语法,但至少应该可以“自圆其说”地解释题目中给出的例子。

在上面这道题中,对象语言是我们不懂的桑塔利语,参考语言我们都懂的中文,题目中给出了9个中文和桑塔利语一一对应的例句。为了便于后面的说明,我给每个例句都加上了编号。

看到例句中的桑塔利语,第一感觉是它在句子的书写上并不存在明显的单词分隔,这一点和中文相似,而和英语等西方语言不同,这给我们的理解带来了难度。我感觉这道题的关键在于如何将桑塔利语的句子正确地划分成单词和相应的句子成分,即语义识别中常说的“分词”。

我从例句的中文解释出发,发现这些例句基本上涉及到两类单词:代词和动词。代词包括“我”、“你”、“他”以及他们的复数形式,动词包括“看”、“打”,注意到这两个动词都是及物动词,例句中还包括了不同的时态和否定形式,所以综合起来需要注意的一共有6个单词或语法形态:

  1. 人称代词“我”、“你”、“他”
  2. 人称代词的复数形式“我们”、“你们”、“他们”
  3. 人称代词及其复数形式的主格和宾格形式
  4. 动词原形“看”、“打”
  5. 动词的完成时“看过”、“打过”
  6. 动词的肯定和否定形式及句子的语序

回到例句中的桑塔利语部分。可以发现,并不是每个例句都没有任何分隔,例句(6)-(8)中都存在一个空格,再看看对应的中文意思,可以发现这4个例句都是否定句式,而不存在空格的5个例句(1)-(5)都是肯定句式。

因此我得到了第一个自洽的规则:

规则F. 否定句中存在一个空格。

同时,我还观察到这4个否定形式的例句都以ba开头,以a结尾,这是不是也可以成为某条规则,因为还涉及到单词的划分,所以暂时不能确定。另外,否定句的语序显然和肯定句不同,但具体的各个语法成分的顺序暂时也不能确定。

再看看两个动词“看”和“打”。和“看”有关的是例句(1)、(3)、(5)、(6)和(9),和“打”有关的是(2)、(4)、(7)和(8),先忽略完成时和否定形式,取以上例句的“最大公约数”,可以发现“看”的词根应该是nεl,“打”的词根应该是dal。其中n表示例句(1)中的第一个桑塔利语字母,因为打不出来,用n来代替。

规则D. 动词“看”的原形词根是nεl,动词“打”的原形词根是dal。

有了动词词根了,再看看表示完成态的例句(2)、(5)、(6)和(8),不难发现和其它例句相比,它们在词根后面多了一个k。

例句(2) 、(5)和(8)的词根后都出现了ke,但例句(6)的词根后面是ki,所以基于规则的完备性,这条规则应该为:

规则E. 动词的完成时态即将原形词根加上k,即“看过” = nεlk,“打过” = dalk。

和动词有关的3条规则基本成型。下面来看看代词部分。

代词部分的规律没有动词部分那么显著,尤其对于复数形式,似乎找不到明显的后缀表示复数。

为了找到突破口,我把目光集中在主宾格上代词相同的例句(5)。这里主语和宾语都是“他们”,根据动词规则,已知nεlk = “看过”,因此剩下的部分et’koako应该表示主语和宾语的“他们”。进一步寻找“同类项”,可以猜测ko和“他们”有关,et’意思不明,两个ko之间的a可能是有语法意义的小词。

再看看和“他们”有关的例句(7)和(8),恰好在(7)中“他们”作宾语,而在(8)中“他们”作主语。在(7)中同样存在et’,而在(8)中只有ko。因此,结合例句(5),我推断“他们”的主格是ko,宾格是et’ko。

这是我获得的一个很大的突破!

因为接下来,我似乎可以确定肯定句和否定句的词序。对于肯定句(5),

nεl | k | et’ko | a | ko = 看 | 过 | 他们(宾) | a | 他们 (主)

对于否定句(8),

ba | ko | (空格) | dal | k | et’pε | a = ba | 他们(主) | (表否定的空格) | 打 | 过 | 你们(宾) | a

因此,完整的词序规则就是

规则F. 肯定句式:谓语(动词原形) + (完成态k)+ 宾语 + a + 主语

规则F. 否定句式:ba + 主语 + 空格 + 谓语(动词原形) + (完成态k)+ 宾语 + a

否定句和肯定句相比,相当于将句末的主语提前到句首,然后在主语前加上ba,主语后加上空格。

有了确定的词序规则F,就可以通过例句对号入座,一一确定各个代词、代词的复数、以及它们的主格和宾格了。我将规则C总结如下:

我,n(主格),idin(宾格)

我们,lε(主格)

你,m(主格),et’me(宾格)

你们,pε(主格),et’pε(宾格)

他,e(主格),ede(宾格)

他们,ko(主格),et’ko(宾格)

现在还余下一个问题:“我们”的宾格没有在例句中出现过,却出现在题目的任务二中。如何确定这个宾格呢?

在上面总结的规则C中,主格到宾格的变化并没有什么显著的规律。不过如果只观察复数形式,“你们”的主格pε前面加上et’后得到宾格et’pε,“他们”的主格ko前面加上et’后得到宾格et’ko。所以我大胆推测“我们”的宾格也是主格lε前面加上et’,即et’lε。

至此,我们就可以完成题目中的两个任务了。

一、翻译成汉语。

bae nεlkedea = 他没有看过他

nεledeam = 你看他

dalkidinako = 他们打过我

dalet’koalε = 我们打他们

二、翻译成桑塔利语。

他打过他 = dalkedeae

他们没有看我 = bako nεlidina

你们没有看我们 = bapε nεlet’lεa

我没有打过你 = ban dalket’mea