2023年IOL个人赛第4题分析和解答

上次我们对第20届语言学奥林匹克竞赛(IOL)个人赛的第5题,也就是数字题进行了分析和解答【1】,今天来试一试第4题,这是一道文字题。

一般来说和数字题相比,文字题要更复杂一些,涉及语言学的要素也会更多一些。这道文字题的语言背景是平原克里语,这是个啥语言、什么人用的语言我们并不关心;我们关心的是如何利用示例来建立起逻辑自洽的语言结构。

题目中给出了21个示例,其中16个例子在汉语中都是“人称代词+动词+人称代词”的结构,另外给出了5个示例,分别对应于从句“当……时”和“如果……”。题目的任务是(a)将四个平原克里语短句翻译成汉语,和(b)将五个汉语短句翻译成平原克里语。

我们先粗略地对前16个示例的汉语翻译做一个统计,分别统计短句中的动词和人称代词。

动词方面,16个示例中一共出现了5个动词,这5个动词及其出现的示例数如下:

1. 挑战,出现3次。

2. 看到,出现4次。

3. 阻止,出现3次。

4. 问,出现3次。

5. 帮助,出现3次。

对于每个动词,在它的示例中找出“最大公约数”,即最大的相同部分。比如对比示例5,13和16,找出wīcih是这三个短句的最大的相同部分。

注意:这个部分不一定就和动词的原型一一对应——因为还可能有性、数、格的不同——但至少包含了动词的词根。

1. 挑战 = mawinēskom。

2. 看到 = wāpam。

3. 阻止 = nakin。

4. 问 = kakwēcim。

5. 帮助 = wīcih。

我们注意到后面5个动词的相同部分最后都以辅音结束,所以为了保持一致,我们省去第1个动词相同部分的最后一个元音字母i。

再来看看人称代词部分。从汉语翻译中,我们可知人称代词在这些示例中以主语或者宾语两个语法成分出现,再加上第一、第二和第三人称的单复数,组合起来一共有36种可能。

我们将这些可能用下表来表示,其中行标题表示主语,列标题表示宾语,表格中的数字是示例的编号:

主语\宾语我们你们他们
16217,1812
我们111164
835,20?
你们231715
1?1013
他们19914?

可见,示例并没有完全涵盖这36种可能,其中反身用法(如:“我……我们”,“你们……你”,“他……他”等)没有在示例中出现,也没有在任务(b)中出现,所以我们在以下的分析中忽略这12种可能。

注意到,这里有两个特殊的示例:3和11。对应的汉语翻译中,这两个短句可以翻译成“你”,也可以翻译成“你们”。但在另外一些示例,比如8和2,分别只能翻译成“你”或者“你们”。这是一个需要注意的点。

除去这些种可能,另外还有3种可能的组合没有在示例中出现,我们将它们用“?”表示。注意到,部分组合出现在任务(b)中,比如任务30就是“我……你们”的组合。不排除在任务(a)中也出现部分缺失的组合。

我们发现在示例中动词的相同部分相对统一和简单,所以将它们从短句里拆分出来,我们把分析的重点放在人称代词上。

下一步,我们把分析的重点放在人称代词上,这是因为我们发现动词在示例中出现的形式比较统一,相对简单。所以我们将动词相同的部分从短句中拆分出来:

1. ni – ik — 他挑战我

2. ki – ināwāw — 你们看到我

3. ki – inān — 你阻止我们,你们阻止我们

4. ni – ānānak — 我们问他们

5. ki – āw — 你帮助他

6. ni – ānān — 我们问他

7. ni – āw — 我看到他

8. ki – in — 你挑战我

9. ni – ikonānak — 他们挑战我们

10. ki – ik — 他问你

11. ki – itinān — 我们看到你,我们看到你们

12. ni – āwak — 我阻止他们

13. ki – ikowāw — 他帮助你们

14. ki – ikwak — 他们阻止你

15. ki – āwāwak — 你们看到他们

16. ki – itin — 我帮助你                

我们用同样的方式处理示例17 – 21:

17. ē- – āyēk — 当你们阻止他时

18. ē- – ak — 当我帮助他时

19.  – ikoyāhkwāwi — 如果他们挑战我们

20.  – aci — 如果你看到他

21.  – itako — 如果我帮助你们

把动词拆出来后,我们很容易发现:

1. 前16个短句要么以ni-开头,要么以ki-开头,而且两种类型似乎和第几人称无关,因为示例中包含了各种人称。

2. “当……时”的从句应该和ē- 相对应。

3. “如果……”的从句直接以动词开头。

个人感觉ni-和ki-的区别是解决本题的关键。

分析示例4,6,7和12,即人称代词表格中右上角的四个方格,它们表示主语为第一人称、宾语为第三人称的四种情况,我们发现在平原克里语中这四个示例全以ni-开头,所以初步猜测ni-和第二人称没有关系。

为了进一步确认这一猜想,我们再看看示例1和9,即人称代词表格中左下角的四个方格,它们表示主语为第三人称、宾语为第一人称的两种情况,这两个示例确实全以ni-开头。而以上这6个示例恰恰是16个示例中和第二人称无关的所有示例!

那么反过来,ki-开头的短句是否全部都与第二人称有关呢?我们查验以下另外10个以ki-开头的示例,确实都与第二人称有关!

因此,我们可以推断出:ni = 主语和宾语仅和第一人称、第三人称有关;而ki = 主语或宾语与第二人称有关

得到这个推断的同时,我们也意识到动词前面的ni-或者ki-并不代表某个特定的人称,这意味着不论是主语还是宾语,它们都位于动词后面。所以我们下面把重点放在动词后的那一堆字母之上。

回到表格的右上角,这4个示例是第一人称作为主语、第三人称作为宾语时的情况:

7. ni – āw — 我看到他  vs.  12. ni – āwak — 我阻止他们

6. ni – ānān — 我们问他  vs.   4. ni – ānānak — 我们问他们

比较这四个短句动词后的部分,从7和12,6和4可以推测出-ak后缀表示第三人称复数,从7和6可以推测出-nān后缀表示第一人称复数。其中示例6中表示第三人称单数-w可能因为缺少元音而被省去。

小结一下:

“我……他” = āw;“我……他们” = āw-ak;

“我们……他” = ā-nān;“我们……他们” = ā-nān-ak。

这个推测在示例18上可以得到验证。

再来看左下角的两个示例。

1. ni – ik — 他挑战我

9. ni – ikonānak — 他们挑战我们

对比一下,可以猜测-ik表示“他……我”,-iko表示主语的“他们”,而这里出现的-nān表示“我们”,-ak表示“他们”,符合我们上面的推测。

将示例9和示例4进行比较,可见iko的作用就是表示第三人称成为主语。

小结一下:

“他……我” = ik;“他们……我们” = iko-nān-ak。

不过,虽然示例19符合-iko的用法,但其它部分非常复杂,条件从句的情况我们留到后面再讨论。

再来看看和第二人称有关的ki-句式。

示例16和11表示第一人称主语、第二人称宾语的情况:

16. ki – itin — 我帮助你  vs.  11. ki – itinān — 我们看到你,我们看到你们

可知-itin表示“我……你”,-iti-nān表示“我们……你”,这里-nān的后缀用法也符合我们上面的推测。

示例21也是条件从句,留在后面讨论。

示例10,13和14表示第三人称主语、第二人称宾语的情况:

10. ki – ik — 他问你  vs.  13. ki – ikowāw — 他帮助你们

14. ki – ikwak — 他们阻止你

很有意思,这里表示“他……你”的也是-ik,和“他……我”一样。那么怎么区分宾语到底是“你”还是“我”?很简单,看句子是ni-还是ki-开头。

示例13中,-iko表示第三人称作主语,符合我们上面的推测,剩下的-wāw表示第二人称复数。

示例14中,-ak表示第三人称复数,ik和ak之间用w连接。

再来看看第二人称作主语的情况。

示例8,2和3表示第二人称主语、第一人称宾语的情况。

8. ki – in — 你挑战我

2. ki – ināwāw — 你们看到我  vs.  3. ki – inān — 你阻止我们,你们阻止我们

上面例子说明-in表示“你……我”,和表示“他……我”或者“我……他”的-ik同样简洁。

表示“你们……我”的-ināwāw中,-in表示第二人称作主语,-(ā)wāw表示第二人称复数。

表示“你……我们”的-inān类似于in-nān,符合我们上面的推测,两个连续的n可能被省去了一个。注意到,在有第一人称复数-nān的情况下,在平原克里语法上可能无法再加上-wāw表示第二人称复数,所以示例3和11中,对于第二人称都存在单数和复数两种不同的解读。

示例5和15表示第二人称主语、第三人称宾语的情况。

5. ki – āw — 你帮助他

15. ki – āwāwak — 你们看到他们

-(ā)wāw表示第二人称复数,-ak表示第三人称单数,再次验证了我们上面的判断!

示例17表示了“你们……他”的情况。

17. ē- – āyēk — 当你们阻止他时

这个不大好分析。因为缺少了ni-和ki-带来的额外信息,我们不知道哪个部分指定了第二人称,从示例1、5、7可以看出,第三人称单数作为宾语大致是默认的。所以可以猜也许整个-āyēk就是表示“你们”作主语。

最后看看3个和条件从句有关的示例19,20和21。我只能分析出部分的语法结构:

19.  – ikoyāhkwāwi — 如果他们挑战我们

这里-iko表示第三人称为主语,后面一堆yāhkwāwi不知道如何拆,只知道它表示“他们……我们”。

20.  – aci — 如果你看到他

这里-aci也没法拆,在以ki-开始的普通句式中,“你……他”用-āw来表示,但在这个条件从句中,看不出两者之间的联系。

21.  – itako — 如果我帮助你们

这里能看出来的只有-it,表示第一人称主语、第二人称宾语。那么-ako就和第二人称复数有关。在以ki-开始的普通句式中,第二人称复数用-(ā)wāw来表示,同样看不出两者之间的联系。

最后,让我们来尝试完成任务。

(a)

22. ē-wāpamikoyēk = ē-wāpam-iko-yēk。ē-表示“当……时”,wāpam表示动词“看到”,iko表示第三人称为主语,参考示例17,yēk应该表示的是“你们”,所以这个短句翻译为:当他看到你们时。

23. ninakinikonān = ni-nakin-iko-nān。ni表示与第二人称无关的内容,nakin表示动词“阻止”,iko表示第三人称为主语,nān表示第一人称复数,参考示例9,所以这个短句翻译为:他阻止我们。

24. kikakwēcimāwāw = ki-kakwēcim-āwāw。ki表示与第二人称有关的内容,kakwēcim表示动词“问”,-(ā)wāw表示第二人称复数,默认第三人称单数,参考示例15,所以这个短句翻译为:你们问他。

25. kiwīcihitināwāw = ki-wīcih-itin-āwāw。ki表示与第二人称有关的内容,wīcih表示动词“帮助”,itin表示“我……你”,-(ā)wāw表示第二人称复数,所以这个短句翻译为:我帮助你们。

(b)

26. 如果我们问他们。“如果……”是条件从句,动词“问”是kakwēcim,第一人称和第三人称都是复数,参考示例19,不过这里“我们”是主语,示例19中“我们”是宾语,因为iko表示第三人称作主语,将iko换成a表示第一人称作主语,所以这个短句翻译为:kakwēcim-a-yāhkwāwi。

27. 他们挑战你们。和第二人称有关用ki开头,动词“挑战”是mawinēskom,第三人称复数作主语用iko-…-ak,第二人称复数用-(ā)wāw,参考示例13和14,且示例中从未出现连续两个元音,所以这个短句翻译为:ki-mawinēskom-iko-wāw-ak。

28. 他们帮助我。和第二人称无关用ni开头,动词“帮助”是wīcih,“他们”作为主语是iko-…-ak,参考示例14,所以这个短句翻译为:ni-wīcih-ik-w-ak。

29. 你看到他们。和第二人称有关用ki开头,动词“看到”是wāpam,第三人称复数作宾语用āw-ak,参考示例5,所以这个短句翻译为:ki-wāpam-āw-ak。

30. 我阻止你们。和第二人称有关用ki开头,动词“阻止”是nakin,第一人称作主语、第二人称作宾语为itin,第二人称复数用-(ā)wāw,参考示例16和2,所以这个短句翻译为:ki-nakin-itin-āwāw。

参考出处:

  1. https://sqr5.wordpress.com/2023/08/05/2023%e5%b9%b4iol%e4%b8%aa%e4%ba%ba%e8%b5%9b%e7%ac%ac5%e9%a2%98%e5%88%86%e6%9e%90%e5%92%8c%e8%a7%a3%e7%ad%94/

2023年IOL个人赛第5题分析和解答

前几天在公众号上分享了今年在保加利亚举行的第20届语言学奥林匹克竞赛(IOL)的赛题。

有读者留言:题目看了,但该怎么做呢?

目前IOL官网上尚未公布标准答案,我在语奥方面经验和水平有限,下面仅以个人赛第5题为例,分享一下个人对这道题的分析和理解,以及我得到的答案,作为抛砖引玉吧。

个人赛第5题是一道数字题,也是题目篇幅最小的一道题。

题目中给出了5个数字及其在苏皮勒语中的写法。换句话说,这5个数字就是某种意义上的训练集,我们需要利用它们构建一个自洽的逻辑,用来解释苏皮勒语中的数字系统,然后在这个自洽逻辑的帮助下,写出两个苏皮勒词汇对应的阿拉伯数字(a),和五个阿拉伯数字对应的苏皮勒词汇(b)。

在进入对题目的分析之前,我们简单地了解一下我们的语言对数字的描述。

人类对数字的概念,产生于人类文明演化和发展之初。在原始部落的狩猎和采集活动中,人们的收获往往是不固定的:今天打了一只山鸡回来,收获了10几颗酸枣儿;明天可能就颗粒无收要饿肚子。久而久之,人们就渐渐有了“多”和“少”的概念,继而通过结绳、刻痕、收集筹码等方式开始尝试计数。

随着人类接触的物体的数量越来越多,一个一个地数显然过于费时费力,这个时候就慢慢产生了进制——人们用某一个特殊的记号或者筹码代表一个固定的较大的数字。因为人类双手有十根手指,所以很自然地,在包括古埃及、古印度和中国古代在内的几乎所有古代文明都采用了十进制,只有古巴比伦人使用了60进制,玛雅人使用了20进制。在很多都市传说中,阿努纳奇和伊萨姆纳都来自于外太空,不属于地球文明。这里不展开。

上图为《大不列颠百科全书》中介绍的古埃及的十进制计数,及258458的写法。我们可以发现,在每个数位上,埃及人通过使用重复的记号表示这个数位上的数字,比如个位数为8,需要重复写出8个“|”。

随着语言和文字的进一步发展,人们慢慢摒弃了这种冗长的计数方式,开始对十进制的基本数字1 – 9使用特殊的文字(数字0的概念出现得更晚一些),最终完成了对各自语言中十进制数字系统的构建。

比如862在中文中是“八百六十二”,在英语中是“eight hundred sixty-two”。这种方式如果用数学来表示,即:

862 = 8 × 100 + 6 × 10 + 2

我们只需使用5个语言符号即可以表达这个数字。这5个语言符号分别为8,100,6,10和2。在中文中,它们一一对应于5个汉字,在英语中,虽然6和10合成了一个词,但在音节上,sixty仍然可以看成six-ty,-ty表示整十。

如果我们观察罗马数字,就会发现它的基本数字有7个,分别为I(1)、V(5)、X(10)、L(50)、C(100)、D(500)和M(1000),它们可以看成是十进制和五进制的一个混合模式。这种模式的起源也和我们一只手有五根手指有关。和单纯的十进制不同,罗马数字有“右加左减”的规则,即在较大数字的右边写上较小数字,表示大数加小数;在较大数字的左边写上较小数字,则表示大数减小数。

罗马数字的计数方式。

人类文明演化至今,发展出来大约5000到7000种语言,尽管绝大多数语言中的数字系统仍然使用十进制,但它们在具体的表达方式上存在着较大的差异。

比如,法语对数字的表达就很令人崩溃,法语中的基本数字为1 – 20。21 – 60使用了一般性的十进制方式,例如quarante是40,cinq是5,45就是quarante-cinq。

61 – 79则是基于60和1 – 19两个数字的加法,例如soixante是60,seize是16,76就是soixante-seize。

80是quatre-vingts,意思是4个20。

81 – 99则是基于80和1 – 19两个数字的加法,例如dix是10,90就是quatre-vingt-dix,字面意义上就是4个20再加上10。

法语中对数字的表达说明了语言中数字系统的复杂性,苏皮勒语是个非常不起眼的小语种,它对数字的表达方式又是如何?

下面我们来看看IOL的这道题。需要提醒的是,语奥的目的不是让我们掌握一门语言,而是通过逻辑分析来构建一个自洽系统。

首先我们观察一下5个训练样本中重复出现的单词或者词根。

词频最高的单词是na。进一步发现,代表的数字越大,na在词汇中出现的次数就越多。那么na是不是表示十进制中数位的分隔符呢?

并没有这么简单。我们发现个位数7中没有出现,十位数21中出现了1次,百位数285中出现了2次,千位数1639中出现了3次,但同时,百位数626中也出现了3次。所以不能简单地认为na和十的幂次一一相关,但它肯定和此有关。

类似于前面对十进制数字系统的分析,我们可以将na看作是数字不同部分的一种连接,或者说一种加法

接下来,注意beɲjaaga这个单词在21和1639中都出现。

既然na表示加法,那么在21中,beɲjaaga和niŋkin加起来等于21。那么beɲjaaga和niŋkin哪一个更小?

在1639中,beɲjaaga位于词汇的中间部分,前面有一个na,后面有两个na,不论该语言中数位从左到右呈现降幂排列还是升幂排列,beɲjaaga都不应该很大(比如表示1000),也不应该太小(比如表示个位数)。

结合beɲjaaga和niŋkin加起来等于21,可以初步判断出beɲjaaga比niŋkin,所以在该语言中,数位从左到右呈降幂排列,即先表示高位,后表示低位

再仔细观察1639,beɲjaaga后面有两个na,分别连接了kɛ和baaricyɛɛre两个单词,从上面数位顺序的判断可知,beɲjaaga > kɛ > baaricyɛɛre。

又已知beɲjaaga < 21,所以这三个数字加起来不会超过63,因此可以推断出,

beɲjaaga + kɛ + baaricyɛɛre = 39

因此,beɲjaaga > 13

结合beɲjaaga + niŋkin = 21,可以推出最合理的一组对应关系:

beɲjaaga = 20,kɛ = 10,baaricyɛɛre = 9,niŋkin = 1

当然,有读者朋友可能会提出,以下这组对应关系也可以满足这两个方程:

beɲjaaga = 18,kɛ = 15,baaricyɛɛre = 6,niŋkin = 3

但是,和18/15这样的基本数字相比,20/10更加符合十进制的特征。

接下来,观察7 = baashuunni,其中shuunni这个词根在285和626中都出现了,说明baashuunni是个复合词,由baa和shuunni组成。

再观察626中的baani,根据数位顺序可知baani = 6。又已知baaricyɛɛre = 9。

这三个单词中都有baa这个前缀,对应的数字都大于5,所以可以猜测baa 作为前缀表示加5

这样ni就对应于1,我们已知niŋkin = 1,是不是矛盾?并不。在很多语言中,基本数字在不同的数字中都有可能出现变体,比如英语中基本数字3是three,在13和30中就变成了前缀thir-。

恰恰相反,正是因为niŋkin 中的前缀为ni,所以更加坚定了我们对baani = 5 + 1的判断。语奥的目标,是找到逻辑自洽的体系。

根据baa 表示加5的结论,我们得出,

shuunni对应于2,cyɛɛre对应于4

这里cyɛɛre的写法不确定,因为在1639中有sicyɛɛre和(baa) ricyɛɛre,它们中有一个是变体。

在1639中,除去后面的beɲjaaga + kɛ + baaricyɛɛre = 39,可知kampwɔhii sicyɛɛre表示1600。而sicyɛɛre表示4,所以这里使用的必定不是加法,而只可能是乘法!

可以推测出,kampwɔhii = 400

至此,对数字7,21,1639的解析完成,我们得出:

niŋkin = 1
shuunni = 2
sicyɛɛre = 4
baa作为前缀表示加上5
baani = 6
baashuunni = 7
baaricyɛɛre = 9
kɛ = 10
beɲjaaga = 20
kampwɔhii = 400

我们接下来观察626。

按照我们前面构建的规则,beetaanre na baani应该等于26;但我们已知beɲjaaga是20,beɲjaaga na baani表示的是26,这里似乎出现了矛盾?

在我们的规则中,na表示加和是个基础,所以这里可以理解为,

kampwoo na ŋkwuu shuunni na beetaanre表示的是620

注意到ŋkwuu和taanre在285中也出现了。默认最后一个单词kaŋkuro = 5,所以,

ŋkwuu taanre na beeshuunni表示的是280

如果我们用数学等式来表示这两个关系,就可以得到:

kampwoo + 2 × ŋkwuu  + bee-taanre = 620

taanre × ŋkwuu + bee-shuunni = 280

再根据kampwɔhii = 400,猜测kampwɔhii是kampwoo的某个变体,所以kampwoo很可能就是400,这样进一步简化得到:

2 × ŋkwuu  + bee-taanre = 220

taanre × ŋkwuu + bee-shuunni = 280

根据bee-taanre和bee-shuunni两个单词的构词法,可以初步推测出taanre和shuunni (2)的量级一样,都是个位数。从我们已经推测得到的单词表中发现,个位数中仅仅缺失了3,所以可以猜测taanre = 3

而根据数位顺序,因为后面的na跟着的是个位数,所以bee-taanre和bee-shuunni表示的是某个十位数的整数倍。

将bee-taanre看作3 × bee-,bee-shuunni看作2 × bee-,原来的两个关系式变成了一个二元一次方程组,解得:

ŋkwuu = 80bee- = 20

这里的bee-和beɲjaaga不矛盾,bee-表示的是前缀20,beɲjaaga表示的是基本数字20。好比,baa-表示的是前缀5,kaŋkuro表示的是基本数字5。

至此,我们的数字体系已经完备:

1. 从左到右,表示数位从高到低的数字,两个数字之间的na表示加和,两个数字之间没有na的话表示乘积。

2. 基本数字:niŋkin = 1,shuunni = 2,taanre = 3,sicyɛɛre = 4,kaŋkuro = 5。kɛ = 10,beɲjaaga = 20,ŋkwuu  = 80,kampwoo = 400。

3. baa-作为前缀表示加上5,bee-作为前缀表示乘以20。

4. kampwoo用在乘法时的变体为kampwɔhii;sicyɛɛre用在加法时的变体为ricyɛɛre。

最后来完成答题。

(a) kampwɔhii shuunni na kɛ表示400 × 2 + 10 = 810;

ŋkuu na baataanre表示80 + (5 + 3) = 88。

(b) 15 = 10 + 5 = kɛ na kaŋkuro;

109 = 80 + 20 + (5 + 4) = ŋkwuu na beɲjaaga na baaricyɛɛre;

152 = 80 + 3 × 20 + 10 + 2 = ŋkwuu na beetaanre na kɛ na shuunni;

403 = 400 + 3 = kampwoo na taanre;

1534 = 400 × 3 + 80 × 4 + 10 + 4 = kampwɔhii taanre na ŋkwuu sicyɛɛre na kɛ na sicyɛɛre。

答题结束。

奥数题最后成了语文题

1月18日是比利时中学生数学奥林匹克竞赛初赛的日子。

在这一天下午,比利时荷语区和法语区分别举行多个级别的初赛,其中荷语区的JWO面对中学三、四年级的学生,VWO面对中学五、六年级的学生;法语区的OMB分为Mini、Midi和Max三个级别,分别面对中学一、二年级,三、四年级和五、六年级的学生。关于这些竞赛的具体介绍,可以参考我之前的介绍文章1 – 3

比赛当天的晚上,Discord上的某个群就热闹了起来。一般来说,孩子们赛后对对答案、分享一下感受是完全正常的。不过,这一次有不少关于VWO初赛第30题的讨论,有一些孩子认为这道题语义不清晰,存在多个答案,组委会应该在阅卷中取消这道题。

其中有个叫Nichola的学生还专门写了一封email给比赛的组织者,组织者的回信倒也中规中矩,表示会将这个反馈转交给评委们讨论。

那么,引起轩然大波的这道竞赛题到底出了什么问题呢?下面是这道题的原文:

翻译成中文,即:

Octavia水族馆中生活着长有8个爪子的八爪鱼和长有7个爪子的七爪鱼。有人发现,虽然知道了这家水族馆中动物的爪子的总数,但仍无法确定水族馆中动物的总数。那么,这家水族馆至少有多少个动物?

(A) 8      (B) 9       (C) 10    (D) 11    (E) 12

应该说,这道题的表述还是比较清楚的。水族馆中有若干八爪鱼和七爪鱼,现在知道爪子的总数,不知道头的总数。类似于“鸡兔同笼”,这是一个线性不定方程组的问题。

直觉上,因为8和7是互质的,所以对于任何爪子总数少于56的情况都可以找到确定答案:解要么唯一存在,要么不存在。

用数学的语言来表述,假设已知爪子总数为s,按照题意,头的总数不确定,即存在两组(o1, h1)和(o2, h2),使得以下方程组成立:

o1 + h1o2 +  h2,即表示动物总数不确定。

其中,o1o2表示八爪鱼的个数,h1h2表示七爪鱼的个数。

将两个式子相减,得到8(o1o2) + 7(h1h2) = 0。

易知,o1o2h2h1。不妨设o1 > o2,得到8(o1o2) = 7(h2h1)。

因为8和7互质,所以8|(h2h1),且7|(o1o2)。

已知o1o2 ≠ 0且h1h2 ≠ 0,o1 + h1o2 +  h2取得最小值时,有

o1o2 = 7,且h2h1 = 8。

现在关键的问题来了:题目的表述是否意味着该水族馆至少有1只八爪鱼,且至少有1只七爪鱼。换句话说,每种动物的个数是否至少有1只?

如果该水族馆可以只有八爪鱼或者只有七爪鱼,即只有一个品种,那么o1, o2, h1, h2 ≥ 0,从上式中可以得到两组解为(7, 0)和(0, 8),对应于爪子一共56只的情况,它们或许来自于7只八爪鱼,或许来自于8只七爪鱼。这种情况下答案应该为7,但7并不是题目选项。

如果该水族馆至少有1只八爪鱼,且至少有1只七爪鱼,那么o1, o2, h1, h2 > 0,从上式中可以得到两组解为(8, 1)和(1, 9),对应于爪子一共71只的情况,它们或许来自于8只八爪鱼和1只七爪鱼,或许来自于1只八爪鱼和9只七爪鱼。这样,答案应该是(B) 9,这也是官方给出的答案。

因此,Discord上持不同意见的孩子们实际上是对题目的理解产生了偏差,除了动物的个数是否可以为0这个不同意见,还有人表示octopussen和heptapussen在荷兰语中都是复数,那么是否应该理解成这两种动物都至少有2只?如果这样的话,o1, o2, h1, h2 > 1,得到的两组解为(9, 2)和(2, 10),这样动物总数的最小值为11,答案应该选(D)。

由此看来,该题目的数学水平本来不难,难在了语文水平。

数学本身是很严谨,但在很多时候,如果对数学术语的定义不够准确,那么就容易引起误解。

比如“正数”这个概念,在国内指的是任何大于0的实数,而在比利时或者其他西方国家的中小学,“正数”(positive)意味着大于等于0,即我们概念中的“非负数”。国内概念中的“正数”,在这边被称为“严格正数”(strict positive)。

又比如“自然数”这个概念,在我接受的教育中,“自然数”指的是“正整数”,即1, 2, 3, … 自然数中不包括0;而在2000年之后国内出现的新版中小学教材中,0被列入了自然数。因此每当我看到现行教材中自然数的解可以为0时,就好比念了一句“一qí红尘妃子笑”无可奈何,反正我已经“乡音无改鬓毛shuāi”,是无法被新教学大纲给shuō服了。

所以,一道好的数学题,必须是一道表述严谨的数学题。为了避免类似的误读,数学题中一定要加上额外的条件说明,比如:“对于任意正整数n > 0”,“存在严格正数x”等等。

参考出处:

  1. https://sqr5.wordpress.com/2016/05/24/%E5%A5%A5%E6%95%B0%EF%BC%9F%E6%AF%94%E5%88%A9%E6%97%B6%E4%B9%9F%E6%9C%89%EF%BC%81/
  2. https://sqr5.wordpress.com/2018/03/05/%e4%b8%80%e7%82%b9%e5%b0%8f%e7%bb%9f%e8%ae%a1/
  3. https://sqr5.wordpress.com/2018/03/06/%E5%8F%88%E4%B8%80%E7%82%B9%E5%B0%8F%E7%BB%9F%E8%AE%A1/

丹麦语的数字表达,你能破解它吗?

亚历克斯∙贝洛斯(Alexander Bellos)是一位英国作家,同时也是一位数学科普者。贝洛斯从牛津大学数学系毕业后,进入新闻行业工作,不久后即加入卫报,成为卫报驻南美的记者。在此期间,贝洛斯写作了《足球:巴西人的生活方式》和《贝利:自传》等畅销书。

结束驻外生活回到英国后,贝洛斯开始撰写数学科普方面的文章,并在每日电讯报上开设了专栏。2010年,贝洛斯的新书《亚历克斯在数字王国的冒险》出版,在英国畅销书排行榜上停留了四个月的时间,该书的意大利语版本曾获得伽利略科学书籍奖和皮亚诺数学书籍奖。同时,贝洛斯还是BBC的特邀主持人,常常在节目中谈论数学问题,他在Radio 4上的纪录片《数字涅槃》入围了2014年英国科学作家协会奖最佳广播节目。

下面这道语言趣题来自于贝洛斯2020年出版的书籍《语言爱好者的谜题》(The Language Lover’s Puzzle Book: Lexical perplexities and cracking conundrums from across the globe)。在这本书中,贝洛斯收集和介绍了100多个填字游戏、语言游戏和谜题,展示了这个世界上文字和语言的多样性以及它们和数学的有趣的联接。

这道语言趣题和丹麦语中的数字表达有关。大家都知道法语表达数字的方法比较“拧巴”,其实不仅仅是法语,在欧洲,有不少语言的数字表达方式都比较复杂,比如在德语和荷兰语中就存在十位数和个位数的倒置表达方式等。在欧洲这些语言中,丹麦语对数字的表达应该算是比较独特的。

题目中给出了一些数字在丹麦语中的写法:

fire = 4

nioghalvfjerds = 79

toogtyve = 22

seksogtres = 66

ni = 9

syvoghalvtreds = 57

enogfirs = 81

tre = 3

fem = 5

问,以下丹麦语表示的数字分别是多少?

seks,nioghalvtreds,treogtyve,femoghalvfems,toogtres,halvfjerds

以及,如何用丹麦语表示以下数字?

7,54,21,85和99

我们从题目示例中的个位数入手,因为个位数最简单,一般不涉及语法结构。示例一共有9条,其中4条是个位数,它们分别是:fire = 4,ni = 9,tre = 3和fem = 5。

未知的个位数字有1,2,6,7和8。

示例中还剩下5个两位数,它们分别是:nioghalvfjerds = 79,toogtyve = 22,seksogtres = 66,syvoghalvtreds = 57和enogfirs = 81。

仔细观察一下,这5个词语中都有A-og-B这样的结构,很明显og这个结构和两位数有关。

再观察一下5个两位数中的79,它的分结构为ni-og-halvfjerds;而我们正好已知9的个位数表示为ni,因此可以推断在丹麦语中,两位数中个位数字和十位数字以og连接,且同样存在倒置的表达方式,即个位数字在前,十位数字在后。

根据这个推断,我们从余下的4个两位数中得到其它4个个位数的表达:

to-og-tyve = 22 → to = 2;

seks-og-tres = 66 → seks = 6;

syv-og-halvtreds = 57 → syv = 7;

en-og-firs = 81 → en = 1。

现在9个个位数里只差8了。

再来看看两位数中的十位数字的表示。

和个位数的表示相对比,可以找到两个相对简单的例子:

seks-og-tres = 66,其中tre = 3,tres在这里则表示60;

en-og-firs = 81,其中fire = 4,firs在这里则表示80。

这使得我们可以猜测:是不是(og)-tres表示20 × 3,而(og)-firs表示20 × 4?

如果是这样,那么20为什么不是(og)-ens?这里先放下。

另外还有两个十位数字为奇数的例子:ni-og-halvfjerds = 79和syv-og-halvtreds = 57。这两个数字中都带有halv-的结构,是不是和奇数有关?比如halv-treds是不是表示20 × 3 – 10?如果是这样的话,那么为什么70不是halv-fireds而是halvfjerds。这里也先放下。

来看看需要完成的丹麦语到数字的翻译。

seks = 6,这个我们已经推断出来了;

nioghalvtreds,十位数字halvtreds = 50例子里有,所以这个数字是59;

treogtyve,同样十位数字tyve = 20例子里有,所以这个数字是23;

femoghalvfems,这个十位数字例子里没有,但根据上面的推断,我们可以猜测halv-fems = 20 × 5 – 10 = 90,所以这个数字是95;

toogtres,这个简单,是62;

halvfjerds,这个翻译问题的出现验证了-og-本身只是一个连接词,它不表示十位数;而-og-后面接的部分才表示“几十”,所以这个数字是70。

再来看看从数字到丹麦语的翻译。

7 = syv,这个很简单;

54 =  fireoghalvtreds,照搬例子中的50即可;

21 = enogtyve,同样是照搬;

85 = femogfirs,还是照搬;

99 = nioghalvfems,这里用到了前面丹麦语到数字翻译题目中的halvfems。

好了,题目做完了,再来看看丹麦语中的数字表达体系。

丹麦语对大于50的十位数字的表达,是基于20进制的,并使用halv表示20的一半,即10。具体来说,

halftreds从字面上来说就是“第3个(20)再减去一半”,即20 × 3 – 10 = 50。

tres就是“第3个(20)”,即20 × 3 = 60。

halvfjerds就是“第4个(20)再减去一半”,即20 × 4 – 10 = 70。

firs就是“第4个(20)”,即20 × 4 = 80。

halvfems就是“第5个(20)再减去一半”,即20 × 5 – 10 = 90。

这样的表达方式非常复杂,尤其对于不懂丹麦语的游客来说,他们很难理解为什么“50”里找不到和“5”有关的单词,而只能找到表示“一半”和“3”的单词。

上世纪50年代,为了简化丹麦语的表达方式,丹麦政府曾经推行过数字的简化表达方式,用类似于英语的单词femti,seksti,syvti,otti和niti分别表示50,60,70,80和90,并将简化后的“50”femti印在了1957年发行的50克朗纸钞上。在此后1972年和1997年两次的新钞发行中,femti都被用来表示“50”。

不过,很可惜,这种语言的简化没有被民众们所接受,他们虽然不反对使用印有femti的50克朗,但从不愿意在语言中使用femti这个词。最终,这个语言简化方案宣告失败,丹麦国家银行逐步回收印有femti的钞票,并在2009年重新发行了印有halvtreds的50克朗新钞。

年度词汇今又来

荷兰出版社Van Dale在日前又开启了一年一度的荷兰语年度词汇评选,今年年度词汇的网络投票截止日期为12月20日17点,评选结果将于12月21日5点在Van Dale的网站上公布。

按照惯例,每年年度词汇的候选词都必须为当年在荷兰或者比利时弗兰德斯流行的词汇,或者为当年在荷兰语中出现的新词。今年一共有15个候选词汇入围,它们分别是:

boosterprik:加强针。booster和英语中一样,是“推动”和“增强”的意思;prik是“刺”和“打针”的意思。因为新冠疫情的反复,第三针或者加强针成为了一个流行词汇。

deltavariant:德尔塔变体。delta来自于希腊字母δ,被用来表示去年在印度首次发现的新冠病毒变体。虽然今年11月份,新的变体奥密克戎ο在南非被确认,但德尔塔变体仍然被认为是当前对人类威胁最大的新冠病毒变体。

doopgids:洗礼指南。doop的本意是天主教中的洗礼仪式;gids是“指南”和“手册”的意思。这里的“洗礼”,特指大学的学生社团在接纳新成员加入时举行的仪式,长期以来这些仪式中掺杂着诸如酗酒、羞辱和暴力等内容。去年,荷语天主教鲁汶大学的一名20岁的学生Sanda Dia在参加大学的某个俱乐部时被戏弄、整蛊,直至中毒身亡。该事件在社会上引发了大范围的讨论,因此,安特卫普大学的学生们开始制订“洗礼指南”,希望在一个相互尊重的框架内将大学生的洗礼活动规范化,避免类似悲剧的再次发生。

doorbraakinfectie:突破性感染。指新冠病毒突破疫苗的保护屏障,仍然造成了感染。目前荷兰和比利时的新冠疫苗接种率并不低,但在今年下半年,仍然出现了日均新增五位数确诊的新一波疫情,其中相当一部分被感染者之前已经完成了完全的疫苗接种,这种感染即突破性感染。

friemelhaat:对别人的小动作过度敏感。friemel有些“坐立不安”或者“躁动”的意思;haat意思是“仇恨”。有些人在等待或者发呆中会做一些细小的、重复的动作或者发出一些声音,比如摆弄笔、玩发梢、晃腿,又比如咳嗽、砸吧嘴等,另一些人对这些动作和声音会非常敏感、表现出烦躁和憎恶的情绪来。

grotsyndroom:隔离综合症。grot是“洞穴”的意思,在这里指疫情下的隔离。syndroom是“综合症”的意思。隔离综合症指隔离生活给人们在心理上带来的不良影响,由于空间狭小、生活单调、缺乏与外界接触,大多数被隔离者可以表现出焦虑、不安和抑郁情绪,睡眠出现问题,家庭关系紧张等等。

knaldrang:强烈的发疯似的冲动。knal的意思是“撞击”或者“爆炸”;drang的意思是“需求”和“欲望”,连起来就是“要爆了、憋不住了的感觉”。特指在疫情防控措施变得宽松后,人们对外出、聚会、就餐等活动的强烈需求,是一种被疫情防控措施抑制久了的情绪释放。

koalatest:考拉测试。这里专指比利时弗兰德斯大区幼儿园的孩子们进入小学一年级的测试。该测试由荷语天主教鲁汶大学的研究人员设计,主要测试学龄前儿童的语言能力,以决定他们是否可以进入小学一年级学习。因为在荷兰语中,学前教育的缩写为KO,测试的吉祥物又是一只考拉,所以这个测试也被称为考拉测试。

paaspauze:复活节假期。pauze是“休息”和“打断”的意思。今年3月底,因为疫情严重,比利时政府决定将中小学的复活节假期延长至四周,而在往常,复活节假期一般为两周。

pasjesmaatschappij:通行证社会。pasjes是复数,意思是“大大小小的通行证”。通行证社会特指在新冠疫情下,人们必须出示通行证或者安全票才能参加各种社会活动,这样的社会被戏称为“通行证社会”。

strooistep:散落的滑板车。strooi是“洒”、“泼”的意思;step指的是滑板车。散落的滑板车指的是在布鲁塞尔街头被随意扔放的共享滑板车,它们本应该被停放在规定的区域,但越来越多的共享滑板车散落在街头,给城市交通和行人安全带来了很多不便和隐患。

tegelwippen:将地砖换成绿地。tegel意思是“地砖”、“瓷砖”。wippen是动词,意思是“撬动”和“翻开”。在过去的几年中,几乎每一个夏天比利时都遭遇到了干旱的情况,地下水位远远低于正常水平。造成干旱的一个原因是地表硬化的程度过高,绿地和植被面积过小,使得雨水很快地从地表流走,进入河道中,地面下土壤的蓄水量过低。因此,气候和生态专家们号召大家减少硬化地面,将铺好了地砖的地面还给绿色植物,使得更多的雨水可以储存在土壤之中,从而调节和应对极端的气候条件。

tweedehandslucht:二手空气。在一些通风状况差的室内,人们吸入的是他人呼出的空气,被戏称为“二手空气”,这种状况在新冠疫情中尤其显得危险。

verkeersvlecht:交通辫子。vlecht意思是“由几股头发交织的麻花辫”。交通辫子指的是一种交通枢纽的道路设计方案,允许去往不同方向的车流如同辫子一样短暂地交叉,但去往每一个方向的车流只会碰到一个红绿灯,使得高速公路和辅路之间的交通更为顺畅,从而解决高速公路上的堵车问题。比利时弗兰德斯大区的第一个“交通辫子”工程今年1月在Waregem建成。

vriendenerfenis:朋友的遗产。erfenis是“遗产”的意思。朋友的遗产是弗莱芒政府实行的一种新的遗产税率,立遗嘱人可以将部分遗产(不高于1万5000欧)留给一位或者多位朋友,其优惠的遗产继承税率为3%,远低于正常的遗产继承税25%;超过1万5000欧的部分将仍然适用正常税率。

由上可见,15个候选词中几乎有一半的词汇都和新冠疫情有关。去年得票数前三位的词汇分别为knuffelcontact、covidioot和hoestschaamte,今年虽然不大可能再次看到这种包揽情况,但最终的年度词汇仍然很可能会是一个与疫情相关的词。

翻译两则

一、

前两天在群里聊上海的老房子,学到了一个新的知识点:原来陕西南路的老石库门社区“步高里”还有一个很洋气的名字,叫做Cité Bourgogne,在法语中,是“勃艮第之城”的意思。

第一次知道步高里,是在潘虹主演的电影《股疯》之中。主角莉莉一家三口生活在这个老式弄堂里,虽空间逼仄、生活忙碌却也其乐融融,后来港商阿伦来上海炒股,看中了这个毗邻交易所的石库门房子,莉莉和阿伦的这次投资合作给这个三口之家乃至弄堂邻里带来了翻天覆地的变化。

之所以对这部电影印象深刻,是因为故事的背景在90年代初的上海,片中不少场景和物件都是我所熟识的,比如十字路口的过街天桥、竹躺椅乘凉、收音机、大哥大等等。三十年过去了,这些中的大多数现在已经成为了历史,被收纳到了记忆之中。

现实中留下来的东西不多,其中就包括步高里这个石库门社区。

大约在1912年,几个活跃在上海的法国金融经纪人R.Fano、J. Beudin、信孚洋行的H. Madier和华商章鸿笙、叶琢堂一起,在当时的法租界注册了一家名为万国储蓄会(International Saving Society)的金融机构。最开始,万国储蓄会的主要业务是有奖储蓄,约定储户连续定投20年年即可收回本金、利息和红利,同时,储蓄会承诺每个月从当月储蓄款中拿出四分之一用于面向储户的抽奖,以这种庞氏骗局的方式万国储蓄会吸引了大批幻想着天降横财的中下层市民参储,业务发展十分迅速,很快在北京、天津、汉口、沈阳乃至内蒙古都开设了分会,募集和骗取了大批民间资金。

资金到手后,万国储蓄会将其大部分投入到房地产中,除了购买和倒手公寓、大楼、里弄房屋以外,万国储蓄会还于1920年左右成立了一家中国建业地产公司,购置地产,并且建造住宅。在1924年到1936年间,中国建业地产公司先后修建了建业里、步高里、衡山宾馆、淮海公寓、武康大楼等多处石库门住宅群和公寓。这些建筑的外墙上,都留下了万国储蓄会(ISS)的标志。

2017年,由建业里部分建筑改建而成的上海嘉佩乐建业里酒店开业,其马头山墙上仍然保留了ISS标志。

因为万国储蓄会是一家法商机构,所以这些房地产最初多以法国地名命名,除了步高里的法语名字是勃艮第之城以外,衡山宾馆原称毕卡第公寓(I.S.S. Picardie Apartments),淮海公寓原称盖司康公寓(Gascogne Apartments),而如今的网红打卡圣地武康大楼原称诺曼底公寓(I.S.S Normandie Apartment)。这几个法语名字分别来自于历史上法国的几个著名区域。

建国之后,上海绝大多数道路得以重新命名,带有殖民地色彩的路名被全国省市地名所取代,原来中国建业地产公司修建的这些房产也有了新的名字,比如衡山宾馆、淮海公寓和武康大楼。只有步高里例外,因为这个石库门住宅群建成之时就有了步高里这个名字,这个中文名字非但在发音上和法语中的Bourgogne非常相近,而且寓意着步步高升,取意祥瑞。

也许正是因为这个中法皆宜、音意俱佳的翻译,在近百年的历史中,步高里没有被改名为陕西南路xx弄或者建国西路xx号,刻有Cité Bourgogne的石匾也得以保留在步高里的牌楼之上。

二、

同样在上海,另一个和翻译有关的故事似乎早已被大家所接受,那就是同济大学的校名“同济”两个字来源于德语中的Deutsch,意思是“德语”或者“德国的”。这个符合大众对“信达雅”期望的翻译广为流传,从今天中文维基的同济大学词条,回溯到当年入学时的校史教育,无一不把这两个中文和德语名词联系在了一起。

同济大学源自德国医生埃里希·宝隆(Erich Paulun)所创建的上海德文医学堂,这所大学从创立之初的全德文授课,到改开之后恢复对德联系,再到90年代德国中心、德研所、中德学院的成立,与德国的渊源和合作一直延续到今天。从根源上来说,同济大学和德国的关系是密不可分的,所以,同济两字来自于德语中的Deutsch,这个说法从感情上很容易接受。

根据中文维基百科中“同济大学”词条:

……当时德国驻上海总领事克纳佩(W. Knappe)派领事馆参赞费舍尔(P. D. Fischer)与上海的中国官员上海道扎饬善堂协商,上海道决定把座落在张家浜新马路(今凤阳路)旁的一块地,用于筹办医院。1900年前后,由埃里希·宝隆创办的“同济医院”正式挂牌。

……埃里希·宝隆医生看到医院里的医疗力量不足,计划在院内设立一所德文医学堂,招收中国学生,以培养施诊医生。……1907年10月1日德文医学堂举行了开学典礼。

1908年,“德文医学堂”改名为“同济德文医学堂”。“同济”当时寓意德国人与中国人同舟共济,“同济”二字从德语“Deutsch”(意为“德意志、德语”)在上海话的谐音而来,意蕴合作共济。

同一词条的德语版本:

Die Vorläuferin der Tongji-Universität war die „Deutsche Medizinschule für Chinesen in Shanghai“. Sie wurde 1907 von der deutschen Regierung als erstes großes Projekt auswärtiger Kulturpolitik gegründet. Dafür engagierten sich insbesondere der deutsche Generalkonsul in Shanghai, Wilhelm Knappe, und der Ministerialdirektor im preußischen Kultusministerium, Friedrich Althoff. Sie arbeiteten dabei mit den deutschen Ärzten Erich Paulun, Oscar von Schab und Paul Krieg zusammen, die in Shanghai ein auf Initiative Pauluns errichtetes Krankenhaus für Chinesen, das Tung-Chee Hospital (Tongji-Hospital), betrieben. Dieses diente ab Oktober 1909 als Lehrkrankenhaus, wurde jedoch unabhängig von der Medizinschule geführt.

以上,中文词条对同济大学的创建过程介绍得比较详细,基本上是这么一个顺序:同济医院 -> 德文医学堂 -> 同济德文医学堂。并且明确指出,同济两字来源于Deutsch的上海话谐音。

德语词条的介绍比较简单,只提到了两个实体:Tung-Chee 医院 (Tongji 医院) 和Deutsche Medizinschule für Chinesen in Shanghai,即中文词条里的(上海)德文医学堂。

从这两条维基百科的介绍中,可以发现三个值得讨论的点。

第一,时间上医院在前,学校在后,这个是各方都没有疑议的。宝隆医生最先创立的医院叫做同济医院,或者音译的Tung-Chee / Tongji 医院,这说明医院名字一开始就是中文语境中的“同济”,和表示“德语”或者“德国的”Deutsch无关。同时,同济两字最开始是医院的名字,而不是学校的名字——这一点也是继承了医院和医学院、后来被合并到华中科技大学的同济医科大学就“同济”两字和继承了学校主体的同济大学争夺了这么多年的基本论据之一,本是院系调整之殇,却演化成了同根相争之利。

第二,1908年德文医学堂改名为同济德文医学堂,如果同济是Deutsch的音意双译,那么在“德文医学堂”的前面加上同样表示“德语”和“德国的”的“同济”,语义上岂不是画蛇添足?反之,如果同济和Deutsch没有关系,那么同济德文医学堂Tongji Deutsche Medizinschule在语义上就通顺了。

第三,在上海话中“同”字发不送气音d,这个确实和Deu-相符合;但是,上海话中“济”字同样是不送气音、而且发音相对短促,和德语中的长送气音tsch(音类似“尺”)在发音上有较大的差距。因此同济两字源于Deutsch的上海话谐音,这一点上是缺少说服力的。

因为以上这三点,我觉得“同济”源于Deutsch音译的传说大概率来自于建校之初某个无意中的附会,这个附会在同济大学与德国之间深厚的渊源关系中没有显现出多少违和感,所以得以流传开来,到今天成为了大家广为接受的真理。

抱抱接触者

新冠元年,各种语言中都出现了很多新的词汇。荷兰语也不例外,在今年的荷兰语年度词汇评选中,knuffelcontact(抱抱接触者)成为了比利时弗莱芒人评选出的年度词汇。

从2007年开始,在每年的12月,荷兰著名的出版社Van Dale都会举行荷语年度词汇评选。评选面对荷兰人和比利时的弗莱芒人,通过线下和线上的方式征集候选词汇以及进行投票,最终根据得票数的多少对候选词进行排列,分别评选出当年的荷兰人荷语年度词汇和比利时弗莱芒人荷语年度词汇。

在今年比利时弗莱芒区的评选中,knuffelcontact的得票率高达52.8%,毫无疑问地成为了弗莱芒人心目中本年度最热门的词汇。排在第二到第五位的词汇分别为covidioot(新冠白痴),hoestschaamte(咳嗽羞耻感),lockdownfeestje(封城派对)和anderhalvemetersamenleving(一米半社会),得票率从8.6%到5.1%不等,远远低于排名第一的knuffelcontact。

Knuffelcontact是一个组合词,knuffel是“拥抱”的意思,contact表示“接触者”。比利时现任联邦卫生部长Frank Vandenbroucke最开始使用了这个词,当时他想用这个词来表示新冠患者的密切接触者。但随着这个词被引入比利时新政府的各种抗疫政策和措施,knuffelcontact逐渐有了一个明确的、不同的定义。

按照现行的措施,每个成年人被允许拥有(指定)一名knuffelcontact,这个接触者和该成年人的居住地址不同,但两人之间保持着密切接触。圣诞和元旦假期期间,每个家庭每次可以邀请其成员的某一个knuffelcontact来做客;对于独居的人,除了这个knuffelcontact,他还可以同时邀请另一位随行人。

根据Van Dale电子词典的定义,knuffelcontact指的是“在新冠疫情之下,除家庭成员以外,你被允许有着密切(身体)接触的人”。我把knuffelcontact 翻译为“抱抱接触者”,是因为“拥抱”这个词很好地表示了这种接触的亲密程度:对于独居的老人,这个抱抱接触者可以是自己的某个成年子女;反过来,对于年轻的单身汉,这个抱抱接触者可以是自己父母中的一人。对于一般家庭的成员,这个抱抱接触者可以是自己的某个朋友、邻居或者关系很好的同事。当然,对于某些人,抱抱接触者还可以是关系非常亲密、但不便公开的接触者。

谁是你的抱抱接触者?尽管抱抱接触者的定义十分明确,但在实际生活中,很少会有人仔细考虑过这个问题。或许人们会在邀请客人来访前把客人定义为自己的抱抱接触者,或许根本不会,因为如果没有警察来敲门,这个定义本身没有任何实际意义。从更长的时间线上来说,尽管根据政策每个人的抱抱接触者应该是固定一人,但今天邀请A来做客,明天邀请B来吃饭,后天抱抱接触者又换成C,在实践中是完全可行的,因为没有警察会对此深究,除非他们对每次聚会都进行了详细的记录。

然而,这在比利时是不可能出现的。

抱抱接触者,势必和之前抗疫措施中的“四人泡泡”,“花园会客”,“一人使用室内厕所”等规定一样,成为看似道理十足、实际上毫无约束力、意义仅仅停留在纸面上的措施之一。

当然和上述这些相比,至少在语言上,抱抱接触者还是具有一定意义的——毕竟它是2020年度弗莱芒人评选出来的荷语年度词汇,将永远存在于Van Dale的荷语词典之中。

一道简单的语奥题

自从被吴老师种草语言学奥林匹克,我一直没有真正完整地做过一道题。下图是网传的一道简单的语奥问题,前两天正好有时间,我体会了一把语奥的乐趣。

以下是我的解答思路,不一定符合语奥的规范,如果其中存在逻辑不完备甚至错误,还望有心人帮我指出。

按照我粗浅的理解,语奥问题的核心在于从给出的对象语言和参考语言一一对应的例子出发,建立起自洽的对象语言的词法或者语法规则。这些“建立”起来的规则不一定符合现实中对象语言真正的词法和语法,但至少应该可以“自圆其说”地解释题目中给出的例子。

在上面这道题中,对象语言是我们不懂的桑塔利语,参考语言我们都懂的中文,题目中给出了9个中文和桑塔利语一一对应的例句。为了便于后面的说明,我给每个例句都加上了编号。

看到例句中的桑塔利语,第一感觉是它在句子的书写上并不存在明显的单词分隔,这一点和中文相似,而和英语等西方语言不同,这给我们的理解带来了难度。我感觉这道题的关键在于如何将桑塔利语的句子正确地划分成单词和相应的句子成分,即语义识别中常说的“分词”。

我从例句的中文解释出发,发现这些例句基本上涉及到两类单词:代词和动词。代词包括“我”、“你”、“他”以及他们的复数形式,动词包括“看”、“打”,注意到这两个动词都是及物动词,例句中还包括了不同的时态和否定形式,所以综合起来需要注意的一共有6个单词或语法形态:

  1. 人称代词“我”、“你”、“他”
  2. 人称代词的复数形式“我们”、“你们”、“他们”
  3. 人称代词及其复数形式的主格和宾格形式
  4. 动词原形“看”、“打”
  5. 动词的完成时“看过”、“打过”
  6. 动词的肯定和否定形式及句子的语序

回到例句中的桑塔利语部分。可以发现,并不是每个例句都没有任何分隔,例句(6)-(8)中都存在一个空格,再看看对应的中文意思,可以发现这4个例句都是否定句式,而不存在空格的5个例句(1)-(5)都是肯定句式。

因此我得到了第一个自洽的规则:

规则F. 否定句中存在一个空格。

同时,我还观察到这4个否定形式的例句都以ba开头,以a结尾,这是不是也可以成为某条规则,因为还涉及到单词的划分,所以暂时不能确定。另外,否定句的语序显然和肯定句不同,但具体的各个语法成分的顺序暂时也不能确定。

再看看两个动词“看”和“打”。和“看”有关的是例句(1)、(3)、(5)、(6)和(9),和“打”有关的是(2)、(4)、(7)和(8),先忽略完成时和否定形式,取以上例句的“最大公约数”,可以发现“看”的词根应该是nεl,“打”的词根应该是dal。其中n表示例句(1)中的第一个桑塔利语字母,因为打不出来,用n来代替。

规则D. 动词“看”的原形词根是nεl,动词“打”的原形词根是dal。

有了动词词根了,再看看表示完成态的例句(2)、(5)、(6)和(8),不难发现和其它例句相比,它们在词根后面多了一个k。

例句(2) 、(5)和(8)的词根后都出现了ke,但例句(6)的词根后面是ki,所以基于规则的完备性,这条规则应该为:

规则E. 动词的完成时态即将原形词根加上k,即“看过” = nεlk,“打过” = dalk。

和动词有关的3条规则基本成型。下面来看看代词部分。

代词部分的规律没有动词部分那么显著,尤其对于复数形式,似乎找不到明显的后缀表示复数。

为了找到突破口,我把目光集中在主宾格上代词相同的例句(5)。这里主语和宾语都是“他们”,根据动词规则,已知nεlk = “看过”,因此剩下的部分et’koako应该表示主语和宾语的“他们”。进一步寻找“同类项”,可以猜测ko和“他们”有关,et’意思不明,两个ko之间的a可能是有语法意义的小词。

再看看和“他们”有关的例句(7)和(8),恰好在(7)中“他们”作宾语,而在(8)中“他们”作主语。在(7)中同样存在et’,而在(8)中只有ko。因此,结合例句(5),我推断“他们”的主格是ko,宾格是et’ko。

这是我获得的一个很大的突破!

因为接下来,我似乎可以确定肯定句和否定句的词序。对于肯定句(5),

nεl | k | et’ko | a | ko = 看 | 过 | 他们(宾) | a | 他们 (主)

对于否定句(8),

ba | ko | (空格) | dal | k | et’pε | a = ba | 他们(主) | (表否定的空格) | 打 | 过 | 你们(宾) | a

因此,完整的词序规则就是

规则F. 肯定句式:谓语(动词原形) + (完成态k)+ 宾语 + a + 主语

规则F. 否定句式:ba + 主语 + 空格 + 谓语(动词原形) + (完成态k)+ 宾语 + a

否定句和肯定句相比,相当于将句末的主语提前到句首,然后在主语前加上ba,主语后加上空格。

有了确定的词序规则F,就可以通过例句对号入座,一一确定各个代词、代词的复数、以及它们的主格和宾格了。我将规则C总结如下:

我,n(主格),idin(宾格)

我们,lε(主格)

你,m(主格),et’me(宾格)

你们,pε(主格),et’pε(宾格)

他,e(主格),ede(宾格)

他们,ko(主格),et’ko(宾格)

现在还余下一个问题:“我们”的宾格没有在例句中出现过,却出现在题目的任务二中。如何确定这个宾格呢?

在上面总结的规则C中,主格到宾格的变化并没有什么显著的规律。不过如果只观察复数形式,“你们”的主格pε前面加上et’后得到宾格et’pε,“他们”的主格ko前面加上et’后得到宾格et’ko。所以我大胆推测“我们”的宾格也是主格lε前面加上et’,即et’lε。

至此,我们就可以完成题目中的两个任务了。

一、翻译成汉语。

bae nεlkedea = 他没有看过他

nεledeam = 你看他

dalkidinako = 他们打过我

dalet’koalε = 我们打他们

二、翻译成桑塔利语。

他打过他 = dalkedeae

他们没有看我 = bako nεlidina

你们没有看我们 = bapε nεlet’lεa

我没有打过你 = ban dalket’mea

荷比之间的时差

荷兰和比利时,是两个南北相邻的国家,同属东一区,怎么会有时差呢?现实中,如果一个荷兰人和一个比利时的弗莱芒人没有具体约定在哪个钟点碰头,而只是笼统地说“上午”或者“下午”,那么他们往往会相互错过。因为他们虽然同说荷兰语,但“早上”、“中午”和“下午”这些表示时间的词汇在他们各自的理解中有着不同的具体范围。

语言学家Miet Ooms对此进行了研究和总结,她发现荷兰人把一天分为早上(ochtend)、中午(middag)和晚上(avond),而比利时的弗莱芒人则把一天分为5个时间段:早上(ochtend)、上午(voormiddag)、中午(middag)、下午(namiddag)和晚上(avond)。荷兰人也有“上午”和“下午”的概念,但在他们的理解中,“上午”和“下午”属于“中午”的一部分。

用一张图来解释,两个国家对时间的划分就比较清楚了。

从上图可以看到,“晚上”的概念在荷兰和比利时人心目中是相同的,不会因此引起任何误会。但如果约会在白天,那么两个国家的人就可能对相同的说法有着不同的理解。

比如,voormiddag(上午)。在比利时,这个词表示中午前的一段时间,大概是早上10点到中午12点。有些人也认为voormiddag是ochtend的一部分,另一些人则认为voormiddag是紧接着ochtend的时间段。在荷兰,很少有人会用voormiddag这个词;如果有人说起voormiddag,那么他指的一定是中午开始后的一段时间,大约是中午12点到下午2点之间的样子,即通常的午餐休息时间。

又比如,middag(中午)。在比利时,这个词表示正午前后的一段较短的时间,差不多中午12点到下午2点,或者到下午1点的样子。在荷兰,middag表示的时间段要长得多,可以从中午一直到晚上,对于大多数人来说,middag即从中午12点到下午6点。

再比如,namiddag。在比利时,这个词表示中午之后的一段时间,一般从下午1点或者2点开始,直到下午6点,与晚上相衔接。在荷兰,namiddag是middag的后半部分,大约是下午4点到6点这个时间段。就像ochtend一样,虽然荷兰人和弗莱芒人在namiddag这个概念上也有重合,但它们具体所指的时间段仍然不同。

要避免因为上述差异带来的尴尬,在约会时,双方最好具体到某个钟点,比如约在下午3点,虽然荷兰人心里会认为3点不是下午而是中午,但比利时人至少不会因为这样的误会而干等对方一个小时。

说起middag,voormiddag和namiddag,突然想起之前在根特大学的一个博士生,他的英语说得很溜,但总是随口把“上午”说成beforenoon。我们对他的造词能力哭笑不得,不过人家在逻辑上确实没有毛病,和noon、afternoon完美自洽。

是IOL,不是IOI,也不是LOL

正文之前,先来个脑筋急转弯:请问,什么情况下XL码比L码小,L码比M码小?

今天在微信上结交了一位有趣的新朋友,这位吴老师自称“无业的数学教师与语奥教练”。我知道这是自谦的说法,但“语奥”是个什么含义,我还真没有接触过。为了更好地说明什么是“语奥”,吴老师发给了我一个名为iol-2012-team-prob.en.pdf的文件。乍一看文件名,我还以为是国际信息学奥林匹克竞赛(IOI),再一看,人家是IOL,是International Olympiad in Linguistics、国际语言学奥林匹克竞赛的缩写。

我是头一次听到这个小众的比赛,等我打开文件仔细一看,就觉得更有意思了。文件是2012年第10届IOL的团体考题:

题目给出了57个国家的老挝语写法,要求选手们通过对可能的词法、音系和语义特点的分析,判断出这57个国家到底是哪57个国家,并且猜出这些国家在老挝语中的发音。

我的第一感觉,这应该是丹·布朗笔下Robert Langdon的专业领域,符号学嘛。不过,这些文字来自于现实中的语言,带有自然语言的所有特征,所以它们不仅仅是简单的符号,而是一些通过语言特征相互强关联的符号。

从朴素的想法出发,如果我来做这道题,可能首先会猜测哪些位于词尾的符号代表“-stan”或者“-ia”,因为这两个词尾是国家名中最常见的词尾;然后会考虑这57个老挝语国家名中各个符号出现的频率,虽然57个国家并不多,但全世界也就200个国家左右,这些样本占所有国家1/4之多,所以它们在老挝语中所有符号出现的频率应该和所有国家名在英语中所有字母出现的频率存在一定的相关性。通过频率分析,应该可以在一定程度上找到老挝语符号和英语字母的对应关系。

所以,这个工作完全可以交给计算机来做嘛!不过在IOL中,所有的考题都必须手工完成。

以下关于IOL的介绍来自于维基百科:

国际语言学奥林匹克竞赛分为个人赛和团体赛。个人赛包含5道题,涉及语言学理论、数学语言和包括语音学、音系学、词法学和语义学在内的应用语言学,须在六小时内完成。每道题目都是以全世界范围内业已研究过的特殊语言现象为材料,为参赛者展示不同语言的差异,并给出足量的已知信息,要求参赛者据此探求背后的规则。参赛者不需通晓多种语言,所有问题都能在考题范围内找得到答案。团体赛的每个团体一般有四名学生。从第二届奥语竞赛开始,每次团体赛的题目是一个超级难题,给出三至四小时来解答。

第一届国际奥林匹克语言学比赛于2003年于保加利亚山区度假胜地波罗维兹举行,由莫斯科国立大学的亚历山大·基布里克担任主席。保加利亚、捷克、爱沙尼亚、拉脱维亚、荷兰和俄罗斯等六国参赛。在2012年的斯洛文尼亚卢布尔雅那,参赛者已有26个国家的34支队伍,中国、日本、匈牙利和以色列于这一年首次参赛。这项比赛的金银铜奖得主多来自东欧国家和美国。

在对着57个国家名琢磨了半个小时后,我放弃了这道难度较大的团体赛题,转而在IOL官网1上找到了一个类似的、但要简单很多的例题:

因为南美洲总共只有12个国家,所以这道题要简单多了(大不了暴力求解嘛!)。

首先,在已知三个国家的英文名中字母“u”出现了4次,所以很容易就可以找到它对应的格鲁吉亚语字母(红色下划线);然后是字母“r”,在三个国家名中都出现过,所以找出来也很顺利(蓝色下划线);再下来是是字母“a”,格鲁吉亚语中乌拉圭的倒数第二个字母以及巴西的第三个字母相同(绿色下划线),看起来很快就能得到答案了!

因此,问题中的第一个国家应该为:ar——a,答案显然是Argentina,阿根廷。将第一题阿根廷的格鲁吉亚语和英语写法相对比,还可以发现形似“开口向下马蹄铁”的格鲁吉亚语字母为英语字母“i”,结合前面的分析,第二个国家应该为:—u–ia,稍微暴力搜索一下,不难发现答案是Columbia,哥伦比亚。

题目虽然做出来了,但我漏掉了一些有趣的点。比如,已知的三个国家中,秘鲁和乌拉圭在格鲁吉亚语和在英语中的字母数目相同,分别为4个和7个,可以一一对应;但巴西在格鲁吉亚语中有8个字母,在英语中只有6个字母,这是为什么?又比如,字母“u”对应的格鲁吉亚字母应该在乌拉圭国名中出现3次,分别位于第1、3和5位,为什么实际中只看到2个,第5位形似阿拉伯数字“3”的字母和这2个不一样?

官网上的标准答案打消了我的这些疑问,整个解题过程还是非常严谨的:

  1. 注意到秘鲁和乌拉圭在格鲁吉亚语和英语中字母数,可以发现两者数目相同,一一对应。
  2. 根据字母“u”在乌拉圭中的位置,可以判断格鲁吉亚语也是从左到右书写的。
  3. 巴西在格鲁吉亚语中的写法比在英语中更长,但我们已经确定了字母“i”和“a”,所以格鲁吉亚语中的巴西写法为-ra-i-ia,即Brasilia或者Brazilia。

标准答案并没有回答我的第二个问题,所以我又谷歌了一下,得知格鲁吉亚语中的乌拉圭按照英语字母来书写的话,应该为:Urugwai,这样,少一个“u”的疑问解决了,词尾的“i”也对应上了!

当然,IOL涉及的问题远远不止找到两种语言字母之间的对应关系,比如下题考查的是语音学方面的内容,没有语音学基础知识,光靠逻辑和推理似乎没法得到答案。

下题则和语义学有关,需要了解句子中不同成分的功能和位置,以及时态和被动态。

非常有意思!如果哪天国际飞行得以恢复,我想我会带上几道IOL的题目来打发时间。

最后,公布一下那道脑筋急转弯的答案,虽然它们也是一种符号,但和语言学没有半点关系:在罗马数字中,XL = 40,L = 50,而M = 1000。

参考出处:

  1. https://www.ioling.org/