世界的语言

Languages of the World

Posted by Tori on June 10, 2019

Lecture 1: 总论

语言:人思考的工具,最重要的沟通工具,文字的产生

最早的沟通方式:身体动作

世界上的语言普遍都有语调,可能与灵长类呼叫系统相对应。沟通的需要提高之后,语调的声音调节不能提供足够的变化,因而产生了音段(辅音和元音)。辅音和元音可构成简单音节,音节可以串联,使得信号越来越复杂,最终导致语言诞生。

原始的语言?圣经第一卷创世纪描述了亚当使用的语言,十八世纪以前许多人认为是希伯来语,文艺复兴时期”亚当语”被当成建立民族自豪感的手段(语言民族主义),现在认为在地球上目前没有相似的语言。

18-19世纪出现历史语言学,将世界上的众语言安置在谱系树上,反映各语言长达数千年的演变及分化过程,可以对5k-7k年前的语言做出有效推断,对1w年前的推断结果相对不够可靠,但人类存在的时间约有5w-10w年。

现代科学研究:古生物学(语言历史)、心理学(婴儿语言习得)、灵长类动物学(人猿对语言的掌握程度上限)、解剖学(发声基础为下降的喉头,在婴儿站立时开始下降,代价为不能直接吞食物lol)

近几百年的新语言:洋泾浜的产生,一种成人用的婴儿话,大杂烩的词汇配以简陋的语法,如上海人造的以上海话为基础的散装英语。儿童若以洋泾浜为母语会转变发展为克里奥语,不同地区的克利奥语语法非常相似(人是否有特定的说话模式?)

参考教材:Lyovin et al. (2017). An Introduction to the Languages of the World, Second Edition. Oxford University Press.

Lecture 2: 世界语言的分类

语言与方言

  • 基本的语言学定义:如果两种话之间不能通话,则它们是两种不同的语言;如果两种话彼此可以通话,或者虽然一开始不能,但是在自然状态下经过一段时间后能够彼此通话,那么它们是同一种语言的两种方言。
  • 这种“区分两种话是两种语言还是同一语言不同方言”的判断方式称为__相互可理解性mutual intelligibility__,例如湖南话和闽南话之间很难相互学习,在这个定义下被认为是两种语言。
  • 方言连续体dialect continuum:分布在同一地理区域的同一语言的不同方言,可能会出现相邻的两种方言差异不大,但随着距离的增加,相隔较远的两种方言完全不能互相理解的情形。
  • 从语言学的角度来说,没有任何方言在本质上先天优于其他方言。
  • 主观定义:语言被认为是标准,是官方的正式的语言;方言则带有地域色彩,随地域的不同有着不同变化。
  • 一个语言的地位可以由个人或者政权任意界定,例如南非政府主张祖鲁语和科萨语是不同的语言,尽管本质上区别不大;科隆德语和巴伐利亚德语无法相互通话,却被视为同一语言。
  • A language is a dialect with an army and a navy. (Max Weinreich). 政治经常会决定称什么为语言称什么为方言,有权力或有历史地位的族群拥有语言,而比他们弱小的则拥有方言。
  • 世界的语言有几种?《民族语(Ethnologue)》__根据相互可理解性的定义,估计现在__世界上有七千种左右的语言,包括口语和手语等。

语言的分类

  • 两种常用的语言分类方式:谱系分类、类型学分类
  • 谱系分类genetic classification:从历史的角度,按照语言的血缘关系分类,如果两种语言有共同的祖先,那么它们就被归为一类
  • 类型学分类typological classification:从语言形式的角度,将结构上相似的语言分为一类,这里的”结构”包括音系、形态、句法等方面的特征

谱系关系的鉴别

  • 两种语言是否有谱系关系,需要看:是否有同源词、是否有规律的语音对应
  • 历史比较法comparative method:历史比较语言学的一种研究方法,通过同源词的比较来证明两种或多种语言拥有共同的祖先,归纳语言间同源词的语音对应规则,推演用以重构祖先语言的语音演变规律
  • 同源词的查找
    • 步骤1:排除借词(例:エキスポート expert,beef英boef法、pork英porc法),尤其是文化、宗教、政治、经济等方面的词
    • 步骤2:排除拟声词(例:婴儿哭、动物叫声、感叹词等)
    • 步骤3:比较基本词汇(斯瓦迪士Swadesh100词表)
  • 有规律的语音对应:语音的规律变化会在基本词汇中出现很多次
  • 如果在排除了借词、拟声词后,还能在本土词汇中发现两种或多种语言之间呈现规律的语音对应,那么就可以基本确定这些语言具有谱系关系。

类型学分类

  • 句法分类:S、O、V的排列组合关系(SOV和SVO最为常见)
  • 音系分类:复辅音、喷音ejective(分布于美洲/非洲/高加索)、搭嘴音click(分布于非洲)

类型学分类:形态分类

  • 语素morpheme:表达语义的最小形式单位(例:cats含两个语素,hijab在英语中只有一个语素)
  • 语素的表达意义:表达词汇意义的(cat)、表达语法意义的(-s)
  • 分类基础:语言的词语能包含多少语素,以及一个语素如果表达语法意义,是否同时表达多种范畴的语法意义
  • 分析型analytic:每一个词就是一个单一语素,极端类型为孤立语isolating(词和语素比例几乎达到1:1)
  • 综合型synthetic:表达语法的语素会接在其他语素上,所以一个词有可能由多个有意义的成分组成,根据各种语素是如何被结合的,可继续分为
    • 黏着型agglutinating:构成一个词的多个语素结合得比较宽松,比较容易按照功能和形式确定语素的界限
    • 溶合型fusional:多个语义单元溶合进一个语素形式(例如一个语素可同时体现人称和时间)
    • 多式综合polysynthetic:一个词由许多语素组成,其中可以有多个表达词汇意义的语素,通常由动词形式将名词揉进其结构中形成

Lecture 3: 世界语言的文字

文字的定义

  • 文字的发明是人类最重要的文化成就之一,它使人类的信息传递得以突破时间和空间的限制。文字能弥补人类记忆上的不足。文字切合了我们日益复杂的社会需要。
  • 文字是表达话语的图像符号,但不等于语言(如希伯来文不标记语言中的元音)
  • 文字的系统性:它和语言的对应是系统化的,它本身的内部组织是成系统的

文字的分类

  • 文字可按写的方向、符号形状、来源和发展等方式进行分类,以下按__符号和语言的关系__分类:
  • 图画文字pictographic / 表意文字ideographic
    • 严格来说不算文字,是正式文字系统的前身。它能表达意义,但无法找到和语言系统的对应。
    • 例:夏安族的图画文字。埃及文和中文的象形文字常常被误解为图画文字/表意文字。图画文字只能被解释,而没法读出来。
  • 词素文字logographic systems
    • 一个字符表达一个词或一个语素(而非语音成分)
    • 例:中文的汉字、埃及古文字(结合了词素文字、音节文字和辅音音素文字)
    • 词素文字可以发音,且语音信息蕴含在字符里。根据字符所带的语音信息,词素文字可分为
      • 基于辅音的词素文字:字符除了词素,还标示辅音,如埃及古文字
      • 基于音节的词素文字:字符除了词素,还标示音节(一个或多个),如中文汉字、日文汉字
  • 音节文字syllabic systems: syllabaries
    • 一个字符代表一个音节(V, CV, CVC, CVN,大部分为CV),而非词或语素
    • 即使只有一个音段不同,字符也可能完全不同,如日本假名、切罗基文(ha-ma-me完全不同)
    • 注意和基于音节的词素文字的区别:字符是否表达一个语素
  • 音段文字segmental systems
    • 一个或多个字符代表一个音段(元音或辅音)。多个字符的例:英语中ng可对应[ŋ]。
    • 根据字符所表达的音段性质,音段文字可分为
      • 真字母系统/全音素文字true alphabet:一个字符对应一个音段,如西班牙文
      • 辅音音素文字abjad:字符只表达辅音,元音则是选择性表示,如阿拉伯文、希伯来文
      • 元音附标文字abugida:一个字符代表一个辅音带某个潜藏的元音(大部分是a)构成的音节,其他元音用特别的元音标记表示,如藏文(基本形不变)、埃塞俄比亚文(基本形会变)

文字的历史与发展

  • 文字的兴起
    • 第一次(5k年前):苏美尔图画文字,后演变为楔形文字(美索不达米亚,即两河流域)
    • 第二次(3k5年前):甲骨文(中国)
    • 第三次(2k年前):玛雅文(美洲)
  • 文字简史
    • 文字的发明很罕见,更常见的是借用和影响
    • 苏美尔图画文字 -> 闪语系文字(埃及文字 -> 迦南字母 -> 腓尼基字母)-> 希腊字母 和 阿拉米字母 -> 拉丁/西里尔字母 和 阿拉伯/希伯来/婆罗米字母
    • 中文 -> 中国周边文字
    • 几乎今日所有的文字系统都可以追溯到中文(中国)和闪语系文字(古代伊拉克)
  • 当基督教普及到埃及时,埃及的古文字因被视为异教的象征而被弃用,很长一段时间内埃及文字被认为是图画文字。1799年拿破仑军队在Rosetta小镇捡到了一块大石头,即罗塞塔石碑,上面写了两种埃及古文字(拼音和图画)和古希腊文。
  • 埃及古文字的破译:法国人商博良Champollion

语言学专用文字系统:IPA

  • 许多拼音文字的内部呈现形音对应的不一致,如英语中的enough和although
  • 国际音标(IPA, International Phonetic Alphabet)为每一个语音派定一个专属的符号,用方括弧加以标记。该符号是语音层面的,不是任何一种语言专属的文字系统。
  • 语音学名词:发音部位如唇音labial 齿音dental 齿龈alveolar 龈后postalveolar 卷舌retroflex 硬腭palatal 软腭velar 小舌uvular 咽音pharyngeal 喉音/声门glottal,发音方法如塞音stop 塞擦音affricate 擦音fricative 鼻音nasal 近音approximant 闪音flap 颤音trill 边音lateral

Lecture 4: 欧洲语言:概述

欧洲位于东半球的西北部,北临北冰洋,西临大西洋,南临地中海和黑海,大陆东至乌拉尔山脉,南至马罗基角(直布罗陀海峡北岸),西至罗卡角(葡萄牙),北至诺尔辰角(挪威北部)。习惯上将欧洲分为北欧、南欧、西欧、中欧和东欧。

欧洲语言主要介绍:印欧语系、乌拉尔语系、高加索诸语言、巴斯克语

印欧语系Indo-European

  • 16世纪,欧洲人到印度开始接触梵语后,认识到梵语和拉丁语、希腊语等语言之间有着广泛的相似性。18世纪,威廉琼斯爵士Sir William Jones__最早正式提出__印欧语假说,揭示了__梵语、希腊语、拉丁语、日耳曼语、凯尔特语__之间的关系,提出它们均由原始印欧语PIE演化而来。威廉琼斯是历史比较语言学的奠基人。
  • 按照母语人口排名,印欧语系是世界上第一大语系,占世界人口的41.8%。__从15世纪开始,随着欧洲殖民势力不断扩张,一些欧洲语言陆续传到世界许多其他地区,这是__印欧语系分布如此之广的直接原因
  • __ISO 639-3代码__是国际标准化组织ISO为各语言所规定的三位语言代码,目的是使每一种语言的名称都有独一无二的识别码,包括所有口语、手语、人造语言等,如英语为eng,汉语为zho。

印欧语系的分类

  • 凯尔特Celtic语族
    • 曾广泛分布于欧洲中、北、西部,后因拉丁语逐渐取代了其中的某些语言,现仅存于不列颠群岛的一些地区和法国西北部的布列塔尼半岛
    • 例:威尔士语Welsh、苏格兰盖尔语Scottish Gaelic、爱尔兰语Irish、法国的布列塔尼语Breton
  • 日耳曼Germanic语族
    • 主要分布于欧洲西北部,从奥地利到冰岛。
    • 语族语言的特点:a)附加齿音后缀 [d] 或 [t] 表示过去时(后起手段);b)使用元音交替来表达现在时和过去时的对立;c)遵循“格林姆定律Grimm’s law”的音变(如拉丁语-日耳曼语:p-f, d-th)
    • 格林姆定律描述了原始印欧语发展为原始日耳曼语时的音变规律,可概括为三条:bʰ > b > p > f,即浊送气塞音 > 浊塞音 > 清塞音 > 清擦音。
    • 北日耳曼语:挪威语、瑞典语、丹麦语、冰岛语等。挪威语和瑞典语可以互相通话;冰岛语的语法保持了古日耳曼语丰富且复杂的样貌,因其使用者长期居住在相对孤立的环境,它几乎不受其他语言的影响。
    • 西日耳曼语:英语、荷兰语、德语、意第绪语Yiddish(犹太人使用的国际语)等。
    • 英语简史:5世纪凯尔特人内斗,其中一位国王向几个日耳曼部族求救,这些部族(盎格鲁族、撒克逊族等)进入大不列颠群岛后,其语言演化为盎格鲁-撒克逊语Anglo-Saxon(即古英语)。留在欧洲的日耳曼部族语言演变为现代德语、荷兰语及北欧诸语。11世纪诺曼人征服英国后,规定国家的官方语言为法语,出现一国三语的情形(官员用法语,教会用拉丁语,平民用中古英语),此时的中古英语因缺乏规范丢失了大量形态语法变化,并在随后1500年逐渐演变为近代英语。英语吸收了全世界语言的元素。
  • 意大利Italic语族
    • 现仅剩__拉丁语及其后代罗曼语Romance__,如法、西、葡、意、罗马尼亚语等。
    • 上古拉丁语大约在250BC形成,1000AD左右罗马帝国扩张使得拉丁语成为各地第二通用语言,日耳曼部族入侵后拉丁语变成了死语言(很少人在日常生活中使用,受教会维护才得以保留),随后各地的拉丁语开始各自变化发展为罗曼诸语,其中法语居首要地位,曾作为宫廷、外交和上流社会的语言。
  • 波罗的-斯拉夫Balto-Slavic语族
    • 波罗的Baltic语支只剩下立陶宛语和拉脱维亚语,其他均已消失。
    • 斯拉夫Slavic语支阵容庞大,如西边有波兰语、捷克语、德国境内的索布语等,南边有马其顿语、保加利亚语、塞尔维亚-克罗地亚语等,东边有俄语、乌克兰语、白俄罗斯语等。
  • 希腊语Greek:这一语支仅含希腊语一种语言
    • 古希腊语最早可追溯至1400BC,由线形文字B书写并在1950s得到破译,为印欧语的研究提供了许多重要信息。希腊语和拉丁语是欧洲文明两大古典语言,也是国际科学术语的词汇来源。
  • 阿尔巴尼亚语Albanian、亚美尼亚语Armenian:同样也是单一语言构成的语支
  • 印度-伊朗语族Indo-Iranian、安纳托利亚语族Anatolian、吐火罗语族Tocharian:分布在亚洲,以后介绍

乌拉尔语系Uralic

  • 分布在瑞典北部到西伯利亚,主要语言有匈牙利语、芬兰语、爱沙尼亚语等。
  • 语音特点:许多语言中,单词的重音总在第一个音节;表现出__元音和谐律vowel harmony__,即一个单词中的所有元音必须属于同一类,如前元音/后元音、圆唇元音/非圆唇元音等。
  • 形态特点:词的变格形式非常多,通过__黏着语素__来实现;没有语法的性,他/她使用同一个代词;使用助动词来构成动词的否定式,且屈折变化只加在助动词上(匈牙利语除外)

高加索诸语言Caucasus

  • __这些语言不成一个语系,__地理分布包括高加索山脉两侧等。几乎所有高加索语言中都存在喷音。
  • 高加索语言中拥有历史文字记录的极少,其中__历史最悠久的是格鲁吉亚语__。格鲁吉亚语语音的一个突出特点是大量的辅音丛(可多达六个辅音),格鲁吉亚文使用自己的“骑士体”字母。

巴斯克语Basque

  • 分布地区:法国和西班牙交界处,比利牛斯山西部两侧,使用人口约50w
  • 巴斯克语是孤立语言,与任何其它语言都不存在亲属关系(注意区分孤立语isolating language和孤立语言language isolate),语音上更接近西语,形态上属于黏着语。
  • 西语中称该语为Vasco,法语中称该语为Basque,但巴斯克语自称为Euskara。巴斯克人非常注重自己民族语言的传承。

Lecture 5: 欧洲语言:俄语简介

俄语属印欧语系斯拉夫语族,约有2.7亿使用人口。苏联解体后,俄罗斯、白俄罗斯、哈萨克斯坦及吉尔吉斯斯坦等国家都将俄语列为官方语言。

俄文属音段文字中的真字母系统,使用西里尔字母Cyrillic,此名是为了纪念发明格拉哥里文字的圣西里尔。格拉哥里文字Glagolithic__是最古老的斯拉夫语言字母。18世纪时,__彼得大帝对西里尔字母进行了大变革,移除了一些古字母,引入了拉丁字母符号和自创的一些符号。

俄语的音系学

  • 辅音:唇辅音 <п, б, ф, в, м>、齿龈辅音 <т, д, ц, с, з, н, л>、龈后辅音 <ш, ж, р, ч>、软腭辅音 <к, г, х, й>。
  • 腭化palatalization:辅音带上 [j] 一起发的现象,如英语中key vs. car,在IPA中以 [◌ʲ] 表示。
  • 元音:前元音 <ы, и; э, е>、央元音 <а, я>、后元音 <у, ю; о, ё>。每一个元音有两种转写符号,第二个符号发音时前带 [j] 且元音前的辅音腭化。
  • 不发音字母:起分读的作用,软音符号 <ь> 强制前一个辅音腭化,硬音符号 <ъ> 强制前一个辅音不腭化。
  • 俄语会用重音区别语义,重读和非重读情况下的元音发音有一定区别。

俄语的形态学

  • 名词:区分性gender、数number、格case
    • __性gender__分阳性、阴性和中性,动物可根据雌雄来判断性,非动物名词的性一般由社会约定俗成。
    • __格case__按照名词在小句中的语法关系进行标记,分主格、属格、与格、宾格、工具格、方位格六种。
    • 名词通过后缀来同时表达性数格。俄语名词使用三套变格规则,第一套用于以-а/-я结尾的阴性名词(及少数阳性名词),第二套用于大多数阳性和中性名词,第三套用于以-ь结尾的阴性名词。
    • 形容词需要和它修饰的名词在性数格上保持一致,并置于名词前面,复数时变格不区分性。
    • 小称标记diminutive/大称标记augmentative:名词和形容词可以接小称后缀,令其具有”小”的语义,接在名字后面可表示爱称,形容词接小称表示又小又x。大称除表示尺寸大,还可表示粗糙、平庸等含义。
    • 父名标记patronymics:通常出现在俄罗斯人的middle name中,结构为父亲名字+父名标记,同时需要带上与形容词类似的性数格标记。
  • 动词:需标记时tense、体aspect、人称person等
    • __时tense__表示动作发生的时间,分过去和非过去(现在或将来)
    • __体aspect__表示动作进行的状态和阶段,分完成体和非完成体,通过前缀或改变词干来体现
    • 非过去时的动词变位需要与主语的__数和人称一致__,分两套变位规则
    • 过去时的动词变位需要与主语的__性、数和人称一致__(单数阳性-л 阴性-лa 中性-лo;复数-ли)
    • 祈使语气imperative:第二人称单数为词干加-й/и/ь,第二人称复数为在单数形式后再加-те
    • 条件语气conditional:主语 + бы + 动词过去时,用于视条件而定的情形

俄语的句法学

  • 基本语序为SVO,与汉语类似,但语序要求没有英语那么严格,因为词语结尾的标记基本无歧义地指明了句子中的语法关系。非正常语序的使用往往由风格化或话题化等原因导致。
  • 从属小句:不能单独做完整句子的小句,如时间状语从句、关系从句,语法与英语类似。
  • 否定标记:可以有双重或多重的否定标记,这些否定不会彼此抵消,而是对否定进行强调。否定句中,及物动词的非特指的直接宾语及存在句的逻辑主语用属格。

Lecture 6: 亚洲语言:概述

亚洲是七大洲中面积最大、人口最多的一个洲,东临太平洋,北临北冰洋。领土东至杰日尼奥夫角(俄罗斯),南至丹绒比亚(马来西亚),西至巴巴角(土耳其),北至切柳斯金角(俄罗斯),与非洲以苏伊士运河为界,与欧洲以乌拉尔山脉-乌拉尔河-里海-大高加索山脉-黑海-土耳其海峡为界,与欧洲共同构成亚欧大陆。

亚洲语言主要介绍:阿尔泰诸语言、古西伯利亚诸语言、汉藏语系、苗瑶语系、壮侗语系、南亚语系、布鲁夏斯基语、其他(亚非/南岛/爱斯基摩-阿留申/印欧)、德拉维达语系

使用人口最多的是汉藏语系语言,超过14亿人,位列世界第二(第一为印欧语系,约29亿人)

阿尔泰诸语言Altaic

  • “阿尔泰”来自哈萨克语,意为六个月,取名于阿尔泰山脉。阿尔泰语言覆盖了土耳其到西伯利亚东北部。包括60多种语言,使用人口约8千万。
  • 芬兰语言学家兰司铁Gustaf John Ramstedt最早提出”阿尔泰语系”的概念,并将朝鲜语和古代日本语纳入其中。__1960s随着各语言研究的更趋深入,学者们认为兰司铁对”阿尔泰语系”的论证并没有达到历史比较法的要求,”阿尔泰语系”的概念被否定。__现将阿尔泰语言分为突厥语系、蒙古语系、通古斯语系。
  • 阿尔泰语言的共同特点:SOV、黏着语、元音和谐律
  • 突厥语系Turkic
    • 包括西南语支(土耳其语、阿塞拜疆语)、西北语支(哈萨克语、吉尔吉斯语)、东南语支(维吾尔语、乌兹别克语)、东北语支(阿尔泰语、西部裕固语)等。中国境内主要分布在新疆、甘肃和青海。
    • 维吾尔语:以中心方言为基础,以伊犁和乌鲁木齐语音为标准音,属黏着语,现多用(修订过的)阿拉伯字母拼写维文,为全音素文字,语言中有大量来自波斯语和阿拉伯语的借词。
    • “维吾尔”一词与”回鹘”同源,然而历史语言学证据表明,现代维吾尔语实际上不是古回鹘语的后裔,而是古葛逻禄语的后裔。回鹘文为全音素文字,用以书写回鹘语。成吉思汗兴起后,以回鹘字母拼写蒙古语,成为回鹘式蒙古语,满文则借自回鹘式蒙古文字母。
    • 西部裕固语:古回鹘语直系后裔,分布于中国甘肃,与维吾尔语、蒙古语系的东部裕固语均不能沟通。
  • 蒙古语系Mongolic
    • 13世纪初,成吉思汗建立了蒙古国家(元朝),将蒙古语带到了元朝疆域的各个地方,随着时间的推移,不同地方的语言各自演化,形成蒙古语系。
    • 蒙古语系包括蒙古语、达斡尔语、东部裕固语等9种语言,在文字上,中国境内蒙古族使用传统蒙古文,蒙古国境内使用新蒙文(用西里尔字母书写)。
  • 通古斯语系Tungusic
    • 多分布在西伯利亚东部及中国东北,包括满语、锡伯语、鄂温克语等。
    • 满语的现有人口不到20人,对满语的研究可通过调查其分布在中国西部的近亲锡伯语进行。通古斯语系语言的现状不容乐观。
  • 朝鲜语Korean
    • 通行于韩国、朝鲜及朝鲜族聚居地。1392前随高丽王朝称”高丽语”,建立朝鲜王朝后改称”朝鲜语”,1897朝鲜高宗改国号为大韩帝国后改称”韩国语”,中国官方称其为”朝鲜语”,但实际教学均讲授首尔标准语。
    • 朝鲜语的语音:区分松辅音/紧辅音/送气辅音,其发音机制在语音学上仍有研究和争议。
  • 日本语系Japonic
    • 或称日本-琉球语系,包括日本语和琉球语两大分支,
    • “日本语系”的概念由美国的日本学者Leon Serafim提出,服部四郎认为日本语和琉球语分化的时间约为大和时代。”日本语系”的概念受到国际学者的普遍接受,但在日本学者中存在争议。
  • 朝鲜语和日语与其他阿尔泰语言的关系
    • 语言相似之处:流音不会出现在本土词汇的首个音节上,元音和谐律,均为黏着语
    • 朝鲜语、日本语、琉球语均缺少人称后缀。另外,朝鲜语和日本语与阿尔泰其他语言之间的同源词汇非常少,这条往往被作为反对把两者纳入阿尔泰语言的证据。
  • 阿伊努语Ainu:日本原住民阿伊努人的语言,一度有过至少19种方言,近代存有北海道、千岛、库页岛(桦太)三种方言,但目前只剩北海道一种。母语人数仅剩10,属于濒危灭绝的孤立语言。

古西伯利亚诸语言Paleo-Siberian

  • 用来指称某些西伯利亚偏远地区的孤立语言和小语系语言,如楚科奇语、尼夫赫语等。
  • __古Paleo这个词缀是为了表示这些语言的祖先比突厥语系、通古斯语系更早出现在这片区域。__这片区域的语言情况十分复杂,亲属关系也尚不明确,使用人口现已非常少。

汉藏语系Sino-Tibetan

  • 德国学者__Julius Klaproth__最早提出汉语、藏语、缅甸语的基础词汇之间存在同源关系,而在此之前流行的理论为__Leyden1808提出的印度支那语系__,直至1924年法国学者__Jean Przyluski__才提出”汉藏语系”的概念。__Benedict1972__恢复了Klaproth的理论,并进一步认为该语系下可分汉语族和藏缅语族两个分支。
  • 汉语族Sinitic
    • 关于其所包含的语言,语言学界主要有两种观点,一种认为只有汉语一种(其他均为方言),另一种认为汉语族包括官话、晋语、湘语、赣语、吴语、闽语、徽语、粤语、客家话等九种语言。
  • 藏缅语族Tibeto-Burman
    • 分布于中国西南部、尼泊尔、不丹、缅甸等地,最主要的语言有缅甸语、藏语、彝语、曼尼普尔语等
    • 藏语:分布于__藏青川甘滇,以及巴基斯坦印度尼泊尔不丹等地。中国境内的藏语可分为卫藏方言、康方言、安多方言,__现代通行的标准藏语源自卫藏方言中的拉萨方言(拉萨lha.sa意为神.地方)。藏文由土蕃时代松赞干布的重臣吞弥·桑布扎受梵文的影响创制,其拼读发音代表古代藏语,现代变化没有体现。
    • 缅甸语:缅甸联邦的官方语言,以仰光音为标准。缅文字母呈圆形,其拼读发音代表古缅甸语。
    • 曼尼普尔语:又称__梅泰语__,是印度东北部喜马拉雅山区东南部__曼尼普尔邦的官方语言及共通语__。
    • 藏文、缅文、曼尼普尔文均属__婆罗米系文字,该系文字属元音附标文字,在亚洲分布广泛且影响深远。__

苗瑶语系Hmong-Mien

  • 主要使用者为苗族、瑶族和畲族,下分苗语族(苗语/畲语)和瑶语族(勉语)
  • 语音特点:区分浊鼻音 [m] 和清鼻音 [m̥],许多方言有好几个区别意义的平调(如黔东苗语,区分55/44/33/22/11)

壮侗语系Tai-Kadai/Kra-Dai

  • 主要分布在东南亚和中国南部,其北支包括仡央语支和侗水语支,南支包括黎语支、泰语支(泰语/傣语/老挝语等)和临高语(分布于海南)
  • 泰语:旧称暹罗语Siamese,有大量来自梵语、巴利语(一种中古印欧语)和高棉语的借词。泰语有五种声调,表达礼貌的语尾词需根据说话者的性别发生变化(例如萨瓦迪卡,女生用kha21,男生用khrap)

南亚语系Austroasiatic

  • 由德国学者威廉·施密特提出。虽名为南亚语系,但__使用者大多在东南亚__,下分孟高棉语族和蒙达语族
  • 语系中历史最久的有孟高棉语族下的__越南语、高棉语(或柬埔寨语)和孟语__

布鲁夏斯基语Burushaski:一种分布于中亚的孤立语言,使用者分布在巴基斯坦、克什米尔地区北部等

其他在亚洲有分布的语系

  • 亚非语系:如阿拉伯语东部方言、希伯来语等,主体在阿拉伯半岛和非洲北部
  • 南岛语系:如马来语,主体在大洋洲
  • 爱斯基摩-阿留申语系:唯一分布于亚洲和美洲两大洲的语系
  • 印欧语系Indo-European:主体在欧洲
    • 印度-伊朗语族Indo-Iranian:印欧语系当下仍在使用的语言中最东边的一族
      • 印度语支:印度境内(梵语、印地语、马拉地语等)、孟加拉(孟加拉语)、巴基斯坦(乌尔都语、旁遮普语)、斯里兰卡(僧伽罗语)、罗马尼亚(罗姆语)等。
      • 罗姆语:属印度语支,但主要分布在欧洲。使用人口无固定居住点,常被称为吉普赛人。__罗姆人来自印度次大陆,__没有国家以罗姆语作为官方语言。
      • 伊朗语支:__波斯语__Persian/Farsi,是伊朗、塔吉克斯坦(称塔吉克语)、阿富汗(称达利语,与同一语支的普什图语同为)官方语言,使用人口约1亿。
    • 安纳托利亚语族Anatolian:曾在小亚细亚使用,现已消亡,包括__赫梯语__和卢维语等。
    • 吐火罗语族Tocharian:包括焉耆语和龟兹语,曾于6-8世纪在新疆塔里木盆地使用,后因被回鹘部落同化而最终消亡。使用印度北部的婆罗米字母,又称”斜婆罗米文”。
    • 中国境内的印欧语系语言:塔吉克族的塔吉克语、俄罗斯族的俄语、(已消亡的)吐火罗语

Lecture 7: 亚洲语言:泰卢固语简介

德拉维达语系Dravidian

  • 又称达罗毗荼语系,主要分布在印度南部和中部,其次在斯里兰卡北部(Tamil)和巴基斯坦等地,主要包括__泰米尔语、泰卢固语、马拉雅拉姆语、坎纳达语__等。泰米尔语也是斯里兰卡和新加坡的官方语言。
  • 德拉维达语系和印度其他语言没有亲属关系,它们的相似点是由语言接触和相互借用导致的。
  • __德拉维达语系和印欧语系印度语支(尤其是梵语)相互影响。__德拉维达语从梵语中引入大量借词;原始印欧语本没有卷舌辅音,但古梵文文献中有相应的语音记录,这可能是由原始德拉维达语的扩散导致。
  • 部分德拉维达语系的语言具有__舌冠音的三元对立__:齿音 [t̪]、齿龈音 [t]、卷舌音 [ʈ](主要涉及 [t, d, l, n]),这样的对立在整个世界语言的范围内较为罕见。

泰卢固语是__印度安得拉邦Andhra Pradesh和泰兰戛纳邦Telangana__两地泰卢固人的语言,属德拉维达语系中部语族,是该语系中使用人口最多的语言,于300BC-100BC便已形成自己的文学语言,字母属婆罗米系文字。

泰卢固语音系学

  • 元音:[a, e, i, o, u],元音长短可区别语义,有两个双元音 [ai, au],表现出一定的元音和谐。
  • 辅音:塞音和塞擦音分__清、浊、送气清、送气浊__(breathy voice,记为 [◌ʱ]),送气音大多出现在借词中,擦音分清浊。发声部位上,卷舌辅音 [ʈ, ɖ, ɭ, ɳ] 为一重要特征。辅音长短可区别语义。
  • 泰卢固语没有给单词指定重音,多数会放在倒数第二个或最后一个音节上。

泰卢固语形态学

  • 词语的形式变化均表现为黏着语素的添加
  • 名词:区分性、数、格
    • 名词的语素顺序为:词干 + 数 + 格
    • 性:单数时只区分阳人和其他(即阴人和非人),复数时只区分人(即阴人和阳人)和非人。性不体现在名词本身上,但会体现在指示代词和第三人称的动词变形上。
    • 数:分单数和复数,复数由后缀-lu/-ɭu表示。
    • 格:分七个格,包括主格、宾格-ni/-nu、与格-ki/-ku、属格-∅、离格-nintʃi、工具-伴随格-to:、方位格-lo:。主格形式自成一派,__主格以外的所有格均由旁格形式加相应后缀构成。__旁格又称间接格、斜格,可用于主格以外的任何格关系中,通常作为动词和介词的作用对象。
    • 形容词位于名词前且不随其修饰名词的性数格发生变化;无定冠词,数词1(oka-)可作为不定冠词。
  • 限定动词:一般出现于句末(SOV语序)
    • 动词的语素顺序为:词干 + 语法范畴(时/体/肯定否定等)+ 人称
    • 人称后缀:单数为1-nu 2-vu 3阳-ɖu 3非阳-di(否定式为-du),复数为1-mu 2-ru 3人-ru 3非人-ji(否定式为-vu),可用第三人称复数属人后缀-ru来表示尊敬。
    • 语法范畴:否定式为-a;过去时为-a:,非过去时(习惯和未来)为-ta:;存在动词un后跟-na:表示过去或现在(例外用法);进行体为-t + un的适当形式,如-tunːaːnu表第一人称现在进行体。
  • 非限定动词:不固定于具体人称、时体、肯定否定等语法范畴的动词形式
    • 动词基式:动词的词典引用式,多以-u结尾
    • 不定式:跟在助动词(或情态动词)后,由否定词干加-a(n)构成
    • 动名词:名词性动词派生形式,由否定词干加-aʈam构成
    • 分词:形容词性动词派生形式,基本词干加-tun:a构成现在分词,过去词干加-ina构成过去分词,过去词干加-e:构成非过去分词,否定词干加-ani构成否定分词。
    • 动副词:副词性动词派生形式,常起状语小句的功能。基本词干加-tu:构成进行体动副词,加-i构成完成体动副词,加-te:构成条件副词,加-ina:构成让步副词。

Lecture 8: 非洲语言:概述

非洲是世界上面积第二大洲,同时也是人口第二大洲,位于东半球西部,欧洲以南,亚洲以西。领土北至本赛卡角(突尼斯),南至厄加勒斯角(南非),西至佛得角(塞内加尔),东至哈丰角(索马里)。非洲地形以高原为主,其中埃塞俄比亚高原号称”非洲屋脊”,此外还分布有山脉(大陆边缘)、撒哈拉沙漠、刚果盆地等。

非洲语言主要介绍:亚非语系、尼罗-撒哈拉语系、尼日尔-刚果语系、科伊桑语区、其他(南岛/印欧)

对非洲语言的研究起步较晚,语言的分类及其内部关系目前仍不清晰或有较大争议。

亚非语系Afro-Asiatic

  • 旧称闪含语系,主要分布于西亚的阿拉伯半岛、北非和非洲之角(索马里半岛),母语人口世界排名第四(前三分别为印欧、汉藏、尼日尔-刚果)
  • 闪米特语族Semitic:起源于中东,语族名称来自圣经人名闪(Shem),但19世纪时语族名称拉丁化后开头音变为[s](拉丁语无[ʃ]音)
    • 东闪米特语支:阿卡德语Akkadian,存在于古代美索不达米亚,是目前已知最早的闪族语言,与苏美尔语(孤立语言)互相影响。曾充当古代近东通用语长达数世纪,8BC时因被阿拉姆语边缘化而走向消亡
    • 西闪米特语支-中闪米特语组:包括__阿拉伯语、希伯来语__、阿拉姆语等。阿拉伯语是亚非语系使用人口最多的语言,其中最著名的语音是咽音 [ʕ]。希伯来语在以色列1948建国以后开始复兴,而同一语群的腓尼基语则走向灭亡。古典阿拉伯语和圣经希伯来语均使用VSO语序,现代语则亦允许使用SVO语序。
    • 西闪米特语支-埃塞俄比亚语组:阿姆哈拉语Amharic,分布于埃塞俄比亚,是闪米特语族使用人数第二多的语言,使用斐德字母,属元音附标文字。
    • 西闪米特语支-南阿拉比亚语组:使用人数最多的是麦赫里语Mehri,分布于也门(亚洲)。注意南阿拉比亚South Arabian不等于阿拉伯语Arabic南部方言。
  • 柏柏尔语族Berber:分布在非洲北部尼罗河以西的区域
    • 因为受到阿拉伯语取代,现分布成星点状,较大片的连续分布区域都比较偏远,大部分是高山(摩洛哥及阿尔及利亚境内的阿特拉斯山脉)或者沙漠。
    • 语言名在柏柏尔语中均为阴性,而阴性的标记为环缀t…t(circumfix),因而语族语言名称多以t开头以t结尾。图阿雷格语Tuareg,使用人口不多但分布很广,是撒哈拉沙漠中伊斯兰教游牧民族的语言
  • 乍得语族Chadic:分布于乍得湖周围,代表语言为__豪萨语Hausa__,它不是任何国家的官方语言,但历来是__西非地区公认的商业交际语__。
  • 奥摩语族Omotic,库希特语族Cushitic(如索马里语),埃及语族Egyptian(已消亡,于古代被阿拉伯语取代,现仅作为宗教用语)

尼罗-撒哈拉语系Nilo-Saharan

  • 分布于尼罗河沿岸和撒哈拉地区等地,夹于北边的亚非语系和南边的尼日尔-刚果语系之间,规模较小,下分东苏丹语族、中苏丹语族、撒哈拉语族等。
  • 卢欧语Dholuo:东苏丹语族尼罗语支,使用于肯尼亚和坦桑尼亚,是美国总统奥巴马父亲的母语。

尼日尔-刚果语系Niger-Congo

  • 语系名称来自尼日尔河和刚果河。语系内部结构尚不明确,可分大西洋-刚果语族、科尔多凡语族、曼德语族等。大西洋-刚果语族下的__班图语支__,其使用人口约占整个语系的一半,分布于非洲整个中部和南部。
  • 语系中__使用人数最多的语言为斯瓦希里语__(分布于坦桑尼亚和肯尼亚等地),其次为津巴布韦的绍纳语和南非的祖鲁语,三个语言均属班图语支。
  • 名词往往被划分为多达十余个不同的类,这些类的功能类似于语法的性,但在语义上可能与性无关。班图语言中常以前缀来体现名词的类。

科伊桑语区Khoisan

  • 主要分布于非洲南部的卡拉哈里沙漠(纳米比亚和博茨瓦纳境内)及东部的坦桑尼亚(哈扎语和桑达韦语两种)。大多数语言处于濒危状态且无书面记录。
  • 科伊桑语言以搭嘴音丰富而闻名,如Juǀʼhoan语拥有48种搭嘴音。与该语区相邻的几种班图语言(如__祖鲁语Zulu、科萨语Xhosa__)也因受其影响而使用搭嘴音。
  • 基本搭嘴音:双唇 ʘ、齿音 ǀ、齿龈 ǃ、硬腭 ǂ、边音 ǁ

其他在非洲有分布的语系

  • 南岛语系:马达加斯加语Malagasy,为马达加斯加的官方语言之一。与马达加斯加语最接近的语言分布在印尼的婆罗洲,因马达加斯加在2k年前被印尼人殖民。马达加斯加语使用VOS语序。
  • 印欧语系:南非语Afrikaans,属印欧语系日耳曼语族,使用于南非及纳米比亚,是南非的第三大语言,仅次于祖鲁语和科萨语。”很少有语言能够像南非语一样产生这么多的争议。”——《大英百科全书》
  • 南非语的历史:南非语本是一种在南非使用的荷兰语方言,在17世纪由欧洲移民和契约工人及奴隶共同发展形成。南非白人从欧洲人手中争得自治权后,开始宣称南非语是南非白人的语言,并实行针对黑人的种族歧视政策,直到1994曼德拉领导的南非大选胜利后种族隔离制度才正式终结。

非洲使用人口最多的前十大语言

  • 1英语(印欧-日耳曼),2阿拉伯语(亚非-闪米特),3斯瓦希里语(尼日尔刚果-班图)
  • 4法语(印欧-罗曼),5阿姆哈拉语(亚非-闪米特),6豪萨语(亚非-乍得),7奥罗莫语(亚非-库希特)
  • 8约鲁巴语(尼日尔刚果-大西洋刚果),9葡萄牙语(印欧-罗曼),10祖鲁语(尼日尔刚果-班图)

Lecture 9: 非洲语言:阿拉伯语简介

阿拉伯语属亚非语系闪米特语族,包括书面语及流通于中东、北非和非洲之角的各种口语。

书面阿拉伯语,包括__现代标准阿拉伯语Modern Standard和古兰经中的古典阿拉伯语Classical__,是在官方、宗教或者较为正式的场合使用的阿拉伯语。书面阿拉伯语曾在中世纪成为中东和欧洲学术文化的重要载体,因而向欧洲语言输入了大量词汇(如algebra,al-为阿语定冠词)。以下仅介绍现代标准阿拉伯语。

口语阿拉伯语,为日常交流使用的阿拉伯语,各地的口语阿拉伯语构成方言连续体,其中使用人数最多的为埃及阿拉伯语。书面阿拉伯语和口语阿拉伯语的分歧称为__双层语言现象diglossia__,同样的例子如普通话和汉语方言。

阿拉伯语的音系学及正字法

  • 辅音:有咽音 [ʕ, ħ] 和喉音 [ʔ, h]。咽音是阿拉伯语的重要特征,辅音 [t, d, s, ð] 各有其咽化版本,用 [◌ˤ] 表示。辅音有相应的长音且区分语义。
  • 元音:[a, i, u] 及其长音,受相邻辅音(尤其是咽化辅音)的影响可产生许多音位变体。
  • __实际发音1:每个元音都必须跟在一个辅音后面。__单词中间不会出现两个连续的元音,而单词开头的元音 (a) 若前词以辅音结尾,则接其后;(b) 若前词以元音结尾,则被省略;(c) 若无前词,则接在喉塞音 [ʔ] 后面。
  • 实际发音2:每个词常以韵律停顿pausa的形式发音,单词末尾的短元音等常被省略。
  • 阿拉伯文使用阿拉伯字母,为辅音音素文字abjad,从右往左书写。”Abjad”一词即来源于古代阿拉伯字母表的前四个字母。阿拉伯文只需书写辅音字母,相应的元音(包括零元音)可选择性地用附加符号表示。
  • 每个字母根据其前后是否与其他字母相连,可拥有多达四种异体形式。

阿拉伯语形态学:名词

  • 阿拉伯语的名词区分__两性三格三数三式__
  • 性:分阴性和阳性,阴性名词常以-at结尾(省读为-ah/-a),阳性名词无特别标记。
  • 格:分主格、宾格和属格(属格可作介词对象),单数时三个格分别以-u, -a, -i表示(往往省读),非单数时仅区分主格和旁格。
  • 数:分单数、双数和复数(复数指三个及以上)。双数变格较为规则,主格加-a:ni旁格加-aini;复数变格分为完整复数sound plural和破碎复数broken plural两种方式。
    • 完整复数:通过加后缀完成,如阳性主格加-u:na旁格加-i:na,确指阴性主格加-a:tu旁格加-a:ti
    • 破碎复数:通过加插缀完成,如kita:b ‘book’变为kutub ‘books’,其进一步变格类似单数名词
    • 多数阿拉伯语词根由三个辅音构成(如k-t-b ‘to write’),__插缀transfix__通过插入词根中的空隙进行构词
  • 式state:分确指式和泛指式。确指式以前缀al-表示,泛指式以后缀-n表示
    • 名词还有一式称__构成式construct__,出现在所有格结构的被修饰名词上(语义上属确指),其后的修饰名词使用属格,两词之间不可插入其他词。
  • 名词变格总结:单数和破碎复数时为词干+格+式,双数和完整复数时为词干+格/式
  • 形容词需要和它修饰的名词在性、格、数、式上均保持一致,并置于名词后面,唯一例外为__非人复数名词在语法上视为阴性单数__。
  • 人称代词共12个,区分单数双数复数,非双数的__第二__和第三人称均区分阴阳性。相应地有12个指代人称的附着语素clitics,可接在名词、动词、介词等后面,表达从属或作用对象等含义。

阿拉伯语形态学:动词

  • 阿拉伯语的动词拥有时、性、数、人称、语态等__屈折范畴__以及丰富的__派生范畴__。动词无不定式,常以第三人称阳性单数过去时作为词典式。
  • 时:分过去时、现在时和将来时,使用插缀构成过去和非过去两种词干,并依性、数和人称添加相应前/后缀,如katab-a ‘过去写’, ja-ktub-u ‘现在写’。将来时可由前缀sa-或助动词sawfa指明。
  • 语态:分主动语态和被动语态,两者仅在插缀的元音上不同,因而字母拼写完全相同,如kutiba ‘过去被写’, juktabu ‘现在被写’。
  • 动词拥有丰富的派生形式,由插缀实现,表达使役、增强、被动、反身等十余种语法功能。
  • 动词变位使用的插缀形式取决于词干的柔性weakness,即词干的辅音性质。动词一般出现在句子开头(VSO语序),但实际的现代语更灵活一些。

Lecture 10: 大洋洲语言:概述

大洋洲地理概述

  • 地缘政治学上的大洋洲包括澳大利亚Australia、新西兰New Zealand、美拉尼西亚Melanesia、密克罗尼西亚Micronesia和波利尼西亚Polynesia(”nesia”来自希腊语,为”岛屿”之意)
  • 大洋洲是陆地面积最小,人口第二少的大洲(仅次于南极洲)
  • 美拉尼西亚 包括 新几内亚岛(太平洋最大岛屿)、所罗门群岛、斐济群岛等;密克罗尼西亚 包括 帕劳、基里巴斯、马绍尔群岛、马里亚纳群岛等;波利尼西亚 主要指 波利尼西亚三角——由夏威夷群岛、新西兰和复活节岛构成的三角——内的岛屿,其中的主要岛群还有萨摩亚、汤加、库克群岛等。
  • 语言学上的大洋洲还包括地理上属东南亚的马来群岛,其中主要岛群有巽他群岛(属印尼)、摩鹿加群岛(属印尼)、菲律宾群岛等,主要国家有马来西亚、菲律宾、新加坡、印度尼西亚、文莱、东帝汶等。

大洋洲语言主要介绍:南岛语系、澳大利亚诸语言、巴布亚诸语言

南岛语系Austronesian

  • 该语系使用人口约四亿,居世界第五;内含语言数目为1257种,居世界第二,仅次于尼日尔-刚果语系。语系中使用人口最多的为马来语、爪哇语和菲律宾语。
  • 福尔摩沙语区Formosa:指台湾南岛语言
    • “Formosa”一词相传为葡萄牙人最初登陆台湾时,感叹”美丽”后得名。台湾南岛语共有约28种,其在历史语言学上拥有非常重要的地位,许多学者相信台湾是整个南岛语系的发源地
    • 在台湾的著名景区几乎都能遇见__南岛民族部落__,如阿里山的邹族、日月潭的邵族、垦丁的阿美族和排湾族、兰屿(台湾东南方外海上)的达悟族等。达悟语不属福尔摩沙语区,而属马来-波利尼西亚语族。
  • 马来-波利尼西亚语族Malayo-Polynesian
    • 该语族的语言数量占到整个语系的98%。传统上分为 西部马来-波利尼西亚语支 和 中-东部马来-波利尼西亚语支,但前者只有地理上的相近关系而无确凿的谱系关系,故以下按地理顺序列出。
    • 密克罗尼西亚语区Micronesia
      • 包括帕劳语Palauan(分布于帕劳)和查莫罗语Chamorro(分布于马里亚纳群岛)作为独立分支;其他语言,如基里巴斯语、马绍尔语等,归到中-东部马来-波利尼西亚语支大洋语群之下。
      • 查莫罗语因受殖民影响而借入大量西班牙词汇(基本用语:你好Hafa Adai,回应Todo Maolek)
    • 菲律宾语区Philippine
      • 他加禄语Tagalog__是菲律宾境内最普及的语言,菲律宾的官方语言“菲律宾语”Filipino__指的是标准化的他加禄语。
      • 菲律宾境内其他通行较广的语言有宿雾语(中部米沙鄢和南部棉兰老岛)、伊洛卡诺语(北部吕宋岛)、希利盖农语(米沙鄢群岛)等。
    • 印度尼西亚语区Indonesia:包含印度尼西亚、马来西亚、新加坡、文莱和东帝汶等
      • 最主要的语支为马来-松巴哇语支Malayo-Sumbawan,其原乡为苏门答腊,语支下包括马来语、马都拉语(爪哇东部)、巽他语(爪哇西部)、巴厘语(巴厘岛)等。
      • 语区内还有__爪哇语支__、大巴里托语群(包括加里曼丹岛诸语和非洲的Malagasy)、南苏拉威西语支等
      • 马来语是南岛语系中使用最广泛的语言,原本仅通行于马六甲海峡两岸,在欧洲殖民者到达后成为广泛的通用语。印尼独立后,出于政治原因,将__官方语言定为印尼语,即一种标准化的马来语,而非使用人口更多的爪哇语。__
    • 莫肯语支Moklenic
      • 莫肯语Moken:莫肯人被称为__海上吉普赛__,主要漂泊在泰国和缅甸的海上,不是任何国家的公民。
      • 莫肯伦语Moklen:莫肯伦人居住在泰国南部的陆地上,莫肯伦语与莫肯语在文化上关系紧密。
    • 中-东部马来-波利尼西亚语支Central-Eastern Malayo-Polynesian
      • 马来-波利尼西亚语族的语言大多均落入该语支。该语支有700多种语言,但使用人口只有几百万。
      • 中马来-波利尼西亚:主要分布于印尼东部的小巽他群岛和摩鹿加群岛,亲缘关系不确凿。语言举例如德顿语Tetum,为东帝汶官方语言。
      • 东马来-波利尼西亚:下属语群亲缘关系较确定,包括 南哈马黑拉-西新几内亚语组 和 大洋语组。
      • 大洋语组Oceanic:分布于大洋洲三大岛群,拥有约500种语言,其下的中部太平洋语群包括斐济语及__波利尼西亚诸语__,如汤加语、萨摩亚语、东部的毛利语、夏威夷语、塔希提语等。
    • 大多数台湾南岛语、菲律宾语言和波利尼西亚语言均使用VSO语序。

澳大利亚土著语言Australian Aboriginal

  • 澳大利亚当地原本有四五百种土著语言,而现在英语已经成为澳大利亚的绝对优势语言,日常仍在使用的土著语言已不到150种,代表语言有Warlpiri、Dyirbal、Guugu Yimidhirr等,大部分已处于濒危状态。
  • 约2/3的澳大利亚语言均属__帕马-努干Pama-Nyungan语系__,语系名称来源于东北部的帕马语支和西南部的努干语支,pama和nyunga在两者各自的语言中均为”人”的意思。
  • 语音特点:元音只有 [i, u, a] 三个;辅音中没有清浊的对立,不存在擦音和塞擦音,舌冠塞音往往存在四元对立(齿/齿龈/卷舌/硬腭)。
  • 一个典型的社会语言学现象为回避言语avoidance speech,指的是当”禁忌亲属”在场时使用的特殊言语,通常表现为改用一个更小的词汇表,”禁忌关系”一般存在于男性和其岳母、女性和其公公等之间。

巴布亚诸语言Papuan

  • 包括所有既非南岛语系又非澳大利亚土著的大洋洲语言,分布于新几内亚及周边岛屿。
  • 该语区包含约800种语言,由于大部分的语言都很少有记录,语言之间的谱系关系并不明确,较受认可的分类为__跨新几内亚语系Trans-New Guinea__,是世界上语言数量第三大的语系。

按照使用人口的语系排名:印欧、汉藏、尼日尔-刚果、亚非、南岛

按照语言数量的语系排名:尼日尔-刚果、南岛、跨新几内亚、汉藏、印欧


Lecture 11: 大洋洲语言:噶玛兰语简介

噶玛兰语Kavalan属于南岛语系,为台湾原住民族噶玛兰族所使用的语言。Kavalan在噶玛兰语中为”平原之人类”的意思。噶玛兰语已被认定为濒危语言,2000年的统计数据显示仅有24位母语使用者。

噶玛兰族原居于宜兰县内的兰阳平原,后因与汉人斗争而被迫向花莲及台南一带迁徙,与当地的阿美族等共享土地,现各地的噶玛兰族部落规模均比较小。噶玛兰族曾被认为是阿美族的一支,经过寻根运动的长期努力在2002年终于被认定为台湾原住民第11族。

噶玛兰语的音系学

  • 辅音:练习清小舌塞音 [q] 和浊小舌擦音 [ʁ],有喉塞音,有长辅音(拥有长辅音的台湾南岛语只有两种)
  • 元音:[a, i, u, ə],长短元音的对立较少,不如长短辅音的对立常见。
  • 单词的重音永远落在最后一个音节,即使是后面添加了各种标记也一样。

噶玛兰语语法:焦点系统focus system

  • 焦点系统又称南岛语配列Austronesian alignment,作为一种特殊的配列系统,现仅见于台湾南岛语、菲律宾语言、马达加斯加语等中,在其他南岛语中均已退化或完全消失。
  • 焦点系统指定了动词各论元(具体为及物动词的施事/受事论元和不及物动词论元)之间的关系,表现为动词上的词缀标记 和 相应论元在形态句法上的标记。有学者认为焦点系统是一种语态系统。
  • 施事焦点agent focus:突出施事者的角色
    • 常用于不及物句,或动作对象为泛指的及物句
    • 动词上以mə-/-əm-标记,施事者标记为主格,受事者标记为旁格
  • 受事焦点patient focus:突出受事者的角色
    • 常用于及物句,可强调施事者的意愿、受事者受到的直接影响、或受事对象为确指名词等
    • 动词上以-an-标记,受事者标记为主格,施事者标记为属格
  • 焦点系统中一般有四五种焦点,其他常见的焦点包括方位焦点locative、工具焦点instrumental、受惠焦点beneficiary等。噶玛兰语中方位焦点和受事焦点合并,工具焦点和受惠焦点均在动词上以 ti- 标记(使用频率较低,现通常以”使用”或”帮助”等三论元动词表示)

噶玛兰语的形态学和句法学

  • 名词:没有性和数的变化,格分为__主格、旁格、属格和位格__
    • 格标记分为一般名词和人名名词两套,在句子中作为独立词__置于名词前__
    • 主格标记(a/ja):用于标记句中的焦点,经常可以省略
    • 旁格标记(tu ta):用于标记非受事焦点句中的受事者,包括直接受事者和间接受事者,不可省略
    • 属格标记(na ni):用于标记非施事焦点句中的施事者,也用于所有格结构(类似于of)
    • 位格标记(ta…-an, sa):用于标记事件发生的处所,或者动作移动的方向
  • 南岛语擅长以叠词reduplication来进行构词,用于表示动作的反复和延续、形容词程度的加深、概念上相近或用于比喻的名词等多种语义功能。
  • 人称代词:有以附着语素出现的主格和属格人称(但无第三人称主格),可接在动词或名词后面,表达施事者或从属等含义。
  • 动词:时-体-气范畴
    • 可分为将来时和非将来时,或者已然语气和非已然语气
    • 完成体perfective/起始体inchoative:以附着语素 =ti 表示,相当于汉语的”了”
    • 经验体experiential:以 u- 表示,表示曾经发生过的事件
    • 将来时:以 qa-/=pa 表示(可同时使用),qa- 亦可表示非已然语气(如很可能快要发生的事件)
  • 动词一般置于句首,基本语序为VSO或VOS
  • 存在句:表达某物在某处的句型为 “jau + 主语物体 + 处所名词(位格)”。噶玛兰语中__没有表示”拥有”的动词__,”拥有”用存在句表示,如”我有钱”=”我的钱存在”
  • 祈使句:肯定句中,施事焦点为动词后加-ka,受事焦点为动词后加-ika(动词本身无需再加焦点标记);否定句为在肯定句开头加上否定词naʁin

Lecture 12: 美洲语言:概述

美洲Americas在自然地理上分为北美洲和南美洲,在人文地理上分为盎格鲁美洲(多使用英语)和拉丁美洲(多使用西语和葡语)。美洲领土北至卡菲克卢本岛(地球最北端),南至南图勒群岛,东至格陵兰岛东北端的Nordostrundingen,西至阿拉斯加属的阿图岛。

美洲以意大利探险家Amerigo Vespucci的名字命名,并沿用至今。

美洲早在1w5年前就有人类的足迹。__1492年哥伦布踏上美洲大陆后开启了欧洲殖民的时代,美洲原住民和欧洲人发生了许多血流冲突,但__来自欧非的传染性疾病(如天花、麻疹、流感等)使美洲原住民的数量急剧减少。18世纪的美国革命和19世纪的拉丁美洲独立战争使得美洲大部分摆脱了欧洲殖民,但殖民的影响现仍非常深远。

美洲语言的总体特点

  • 大量的多式综合型语言,如Eskimo-Aleut、Na-Dene、Algonquian、Iroquoian、Uto-Aztecan、Salishan、Mayan、Arawakan、Quechuan、Tupi-Guaraní、Aymaran等
  • 许多语言有喷音,如Na-Dene、Salishan、Mayan、南部Quechuan、Aymaran等
  • 许多语言使用head-marking而非dependent-marking,两者的区别包括 动词论元的语法关系标记在动词上还是论元上 和 名词所有格结构的从属标记体现在被所有者上还是所有者上 等。

北美洲语言

北美洲(这里指墨西哥以北)约有296种原住民语言,包括29个语系及一些孤立或未分类的语言,其中__Na-Dene、Algic和Uto-Aztecan__三个语系囊括了北美语系语言数量的前三和使用人数的前三。

北美洲语言主要介绍:爱斯基摩-阿留申语系、纳-德内语系、阿尔吉克语系、易洛魁语系、犹他-阿兹特克语系、萨利希语系

爱斯基摩-阿留申语系Eskimo-Aleut

  • 唯一跨美洲和亚洲的语系,分布于阿拉斯加、格陵兰、加拿大北部、楚科奇半岛等地
  • 阿留申语族:只有阿留申语Aleut一种,分布于阿留申群岛等地,受俄语影响较大
  • 爱斯基摩语族:包括因纽特Inuit和尤皮克Yupik两个语支
    • Inuit语支:分布于阿拉斯加北部、格陵兰和加拿大。虽然周围分布着各种欧洲的语言,但该语支现在仍在蓬勃发展,尤其是在格陵兰和加拿大北部的Nunavut地区。
    • Yupik语支:分布于阿拉斯加西南部及西伯利亚最东端。Central Alaskan Yup’ik是使用最广泛的Yupik语言,也是阿拉斯加最主要的原住民语言
  • 该语系以其高度的多式综合性而闻名,通过向词根后面不停加后缀完成,如Nunavut Inuktitut中有 tusaa-tsia-runna-nngit-tu-aluu-junga = hear-well-can-no-it-very-I = I can’t hear it very well.

纳-德内语系Na-Dene

  • 主要分布在阿拉斯加中东部、加拿大西北部和美国西南部。语系下现存有阿萨巴斯卡Athabaskan语族和特林吉特语Tlingit,语系名称来源于该系语言表示”人”的词。
  • 语系中最有名的语言是__纳瓦霍语Navajo,可能是美国境内最有影响力的美洲原住民语言__。有超过17w使用者,分布于Arizona、Utah、New Mexico等地。它可能是唯一一种使用人数还在增加的美国原住民语言。
  • 美国海军陆战队曾使用Navajo作为密码在无线电报中使用,且这一密码直到二战结束都没有被破译。

阿尔吉克语系Algic

  • 分布从落基山脉一直到北美东岸。语系内多数语言属于阿尔贡金Algonquian语族(如黑脚语Blackfoot、夏安语Cheyanne等),还包括分布于加州的尤罗克语Yurok和维约特语Wiyot。
  • “五月花号”上的英国清教徒为寻求宗教自由踏上北美土地时,遇到的就是阿尔贡金人。阿尔贡金语为英语引入了大量词汇,如caribou、skunk、moccasin、hominy、raccoon等。
  • 语系的形态句法特点
    • 语篇中的名词带有proximate和obviative两种语法人称标记(有时称为第三人称和第四人称),proximate表示语篇中最重要或作为话题的对象,obviative表示其他相对不重要的对象。
    • 及物动词上的标记由两个论元在人称层级上的相对位置决定,若层级高者为主语则以”直接后缀”标记,若层级低者为主语则以”相反后缀”标记;典型的阿尔贡金人称层级为2>1>3>4。

易洛魁语系Iroquoian

  • 分为南北两支,以缺少唇音而闻名。该语系引入了许多地名,如Canada、Toronto、Ohio、Kentucky等。
  • 切罗基语Cherokee,是唯一的南易洛魁语,现大部分使用于Oklahoma。切罗基语的唇音只有一个 [m](出现频率也极低),没有 [p, b, f, v]。切罗基人是首个被联邦政府允许取得公民身份的原住民族群。
  • 莫霍克语Mohawk,是使用人数最多的北易洛魁语,现使用于Ontario、Quebec和纽约西北部。电话的发明人贝尔是第一个对莫霍克语进行书面记录的人。莫霍克语完全没有唇音。

犹他-阿兹特克语系Uto-Aztecan

  • 分布从美国西部一直到墨西哥。犹他州的名称来自犹特族Ute;阿兹特克Aztec是存在于14-16世纪的墨西哥古文明,是美洲三大古文明之一,使用古典纳瓦特尔语,后被西班牙殖民者灭亡。
  • 语系中使用人数最多的为纳瓦特尔语Nahuatl。所有现代Nahuatl方言均因受西班牙语影响,而和阿兹特克时期的古典Nahuatl不同。英语中的Nahuatl词包括chili、tomato、avocado、chocolate、coyote等。

萨利希语系Salishan

  • 分布于环萨利希海一带,包括美国华盛顿州及加拿大不列颠哥伦比亚省等地,现使用人口非常少。西雅图Seattle的名称便来自萨利希语中一位酋长的名字 [‘siʔa:ɬ],现代拼写是拉丁化的结果。
  • 语系特点:有大量的辅音丛,甚至__单词里可以只有辅音没有元音__,如Nuxalk中有 [xɬpʼχʷɬtʰɬpʰɬ:skʷʰt͡sʼ];有lexical affixes,形式上为词缀,但功能为独立语义,词缀往往长得与相同语义的自由名词完全不像。

其他北美语言特色拾遗

  • Tanoan语系的”反数标记”:名词分为单数双数复数,无标记名词表示其固有的数,带”相反标记”的名词表示其他的数,如Jemez语中pá表示单数或复数的花,pá-sh表示双数的花
  • Nez Perce语的三分型配列:及物动词的施事/受事论元和不及物动词论元三者的格均不相同
  • 许多语言在动词上有switch-reference标记,用来指示下一小句的主语与当前小句相同或是不同

拉丁美洲语言

中部美洲Mesoamerica是文化地理上的概念,覆盖区域自墨西哥中部,经过危地马拉、伯利兹、萨尔瓦多、洪都拉斯、尼加拉瓜,到哥斯达黎加北部。中美洲Central America则是区域地理上的概念,不包括上述区域中的墨西哥,但包括巴拿马。

中部美洲的语言主要形成四个较大的语系,其中使用人数最多的为玛雅语系和欧托-曼格语系。

欧托-曼格语系Oto-Manguean

  • 曾在中美洲广泛分布,阿兹特克帝国兴起后,因__Nahuatl成为通用语__而被边缘化,现只分布于墨西哥。
  • 特色:北美洲和中美洲唯一的声调语言语系,更偏向分析语而非多式综合语。

玛雅语系Mayan

  • 主要使用于墨西哥东南部、危地马拉、伯利兹和洪都拉斯,包括约30种语言,使用人口超过600w。虽然现今这些地区的官方语言基本为西班牙语,但玛雅语仍为当地居民的第一或第二语言。
  • 玛雅文明是独立发明文字的少数文明之一,其文字在文明的古典时期得到广泛使用。玛雅文结合了词素文字和音节文字,现代玛雅语以拉丁字母书写。

南美洲目前约有350种原住民语言,使用人口约为1120w。对南美洲语言的语言学调查直到20世纪后半叶才开始,因而它们的谱系关系尚无确切定论,最保守的分类法将这些语言分为110多个语系和孤立语言。

南美洲语言简述

  • 阿拉瓦克语系Arawakan是美洲原住民语言中__语言数量最多、地理分布最广__的语系,含64种语言,几乎分布于所有南美国家(除厄瓜多尔、乌拉圭和智利)
  • 就__使用人数__而言,南美原住民语言排名前三为Quechua、Guaraní、Aymara,其中Quechua和Aymara主要分布在安第斯山脉中部,Guaraní主要分布在巴拉圭及周边地区。
  • 在南美总能找到罕见的句法类型学特征:如Hixkaryana的OVS语序、Warao的OSV语序等。

克丘亚语Quechua

  • 克丘亚语是使用人口最多的美洲原住民语言(约900w),其分布地从哥伦比亚一直延伸到阿根廷,是秘鲁、厄瓜多尔和玻利维亚的官方语言之一,各地的克丘亚语形成方言连续体。
  • 克丘亚语是印加帝国的官方语言。印加帝国是15-16世纪位于南美洲的古老帝国,也是前哥伦布时期美洲最大的帝国,版图横跨整个安第斯山脉,帝国中心位于今日秘鲁的库斯科,后被西班牙殖民者灭亡。

瓜拉尼语Guaraní

  • 属于图皮语系Tupian下的Tupi-Guarani语族,是唯一有着大量非原住民使用的美洲原住民语言,也是巴拉圭的官方语言之一。
  • 语音特点:高度的鼻音和谐律nasal harmony,如果一个重读音节出现鼻化元音,那么鼻化就会向前后两个方向传播,直到碰到另一个非鼻化的重读音节为止。

皮拉罕语Pirahã

  • 皮拉罕人居住于巴西亚马逊河支流沿岸,他们仍过着狩猎采集的生活。
  • 皮拉罕语的使用人口约为150人,但它并没有面临要灭绝的危险,因为皮拉罕人为单语社群。与此同时,与皮拉罕语同族的其他语言,均因族人转向使用葡萄牙语而在数世纪内灭亡。
  • 皮拉罕语以拥有许多罕见的语言特征而闻名,主要描述来源于Daniel Everett的研究
    • 音系:是世界上音系最简单的语言之一,大约只有10个音素,一些音位由性别决定
    • 词汇:数词上1986年认为只有1和2,2005年认为完全没有数词,只有”少量”和”大量”;颜色上只有对明和暗的形容,没有关于颜色的抽象词(如用”血”指代”红色”)
    • 语法:没有递归性recursion,即短语结构不能嵌套。乔姆斯基在普遍语法universal grammar理论中认为,递归性是人类语言和思维独一无二的特征,语言学界对皮拉罕语这一疑似反例有着大量的争议。
  • Sapir-Whorf假说:又称语言相对论,认为语言对思维有着决定/影响作用,涉及研究有颜色词汇对颜色知觉的影响、Guugu Yimidhirr使用者的(绝对)方位认知、Pirahã使用者的数字认知等。

Lecture 13: 美洲语言:TBD

Lecture 14: 其他语言的讨论

最后我们讨论一些其他语言,包括混合语、皮钦语、克里奥语、手语和人造语。

语言接触language contact

  • 语言之间互相接触可导致词汇借用,导致新语言的诞生,也可导致旧语言的灭亡
  • 混合语mixed languages
  • 皮钦语pidgins
  • 克里奥语creoles
  • 语言转移language shift:一个语言的使用群体改用另一种语言的现象,最后可能导致原语言灭亡

手语sign languages

人造语言constructed languages

为什么发明人造语言?

  • 原因1:理想主义者,想创造一种独一的语言,使人类在彼此了解中团结起来
  • 原因2:理想主义者,建立排外的秘密社团
  • 原因3:用于衬托虚构的文明世界
  • 原因4:思想家们认为自然语言无法完美表现这个世界,心里非常恼火
  • 19世纪后期人们试图创造一种普世通行的语言,开始于1880年面世的沃拉普克的语言,之后又出现世界语Esperanto、创新语Novial、国际语Interlingua等数十种,均以欧洲语言为根基,但目前几乎都绝迹了。
  • 索来索语Solresol
    • 原则:使用音高来区分语义,使用唱名的不同序列方式组合来表示词汇的意思,基于十二平均律。
    • 发明人是Francois Sudre,1827年问世,有2660个单词,七个基本全音音符各代表一类意思。
    • 重音要唱两拍,重音可以区分不同的词类,有些词使用相反的音阶排序来表达相反的意义。
  • 世界语Esperanto
    • 由柴门霍夫发明,使用拉丁字母(及变体),按语音拼写,语法非常简单。动词有三个时三个式,不随人称和数变化。
    • 世界语是少数仍存活且持续发展中的人造语言,甚至有好几百人以世界语为母语,预估使用人口超过一百万。
  • 逻辑语
  • 克林贡语Klingon
    • 为星际迷航Star Trek虚构的语言,是少数在创造者离世之后仍继续存活的语言
    • 语音听起来像外星人。使用OVS语序,给人以一种外星语言的感觉。

总结:语言的谱系关系、文化、历史、兴衰、创造力和想象力,独一无二的心智工具,是我们之所以为人的标示