科普丨什么是语言?什么是自然语言?-程序员宅基地

一、什么是语言?


语言(英文名:Language)是人类最重要的交际工具,是人们进行沟通交流的主要表达方式。人们借助语言保存和传递人类文明的成果。语言是民族的重要特征之一。一般来说,各个民族都有自己的语言。汉语法语俄语西班牙语阿拉伯语英语是世界上的主要语言,也是联合国的工作语言。汉语是世界上使用人口最多的语言,世界语英语是世界上使用最广泛的语言。据德国出版的《语言学语言交际工具问题手册》说,现在世界上查明的有5651种语言。在这些语言中,约有1400多种还没有被人们承认是独立的语言,或者是正在衰亡的语言。

语言是人们交流思想的媒介,它必然会对政治、经济和社会、科技乃至文化本身产生影响。语言这种文化现象是不断发展的,其现今的空间分布也是过去发展的结果。根据其语音语法词汇等方面特征的共同之处与起源关系,把世界上的语言分成语系。每个语系包括有数量不等的语种,这些语系语种地域上都有一定的分布区,很多文化特征都与此有密切的关系。语言是指生物同类之间由于沟通需要而制定的具有统一编码解码标准的声音(图像)讯号

语言又是符号系统,语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息,但这只是一些固定的程式,不能随机变化。


表达方式


语言就广义而言,是一套共同采用的沟通符号、表达方式与处理规则,符号会以视觉、声音或者触觉方式来传递。严格来说,语言是指人类沟通所使用的语言-自然语言。一般人都必须通过学习才能获得语言能力,语言的目的是交流观念、意见、思想等。语言学就是从人类研究语言分类与规则而发展出来的。研究语言的专家被称呼为语言学家。当人类发现了某些动物能够以某种方式沟通,就诞生了动物语言的概念。到了电脑的诞生,人类需要给予电脑指令。这种“单向沟通”就成了电脑语言


性质


编辑


语言是人与人之间的一种交流方式,人们彼此的交往离不开语言。尽管通过图片动作表情等可 以传递人们的思想,但是语言是其中最重要的,也是最方便的媒介。然而世 界各地的人们所用的语言各不相同,彼此间直接交谈是困难的,甚至是不可能的。即使是同一种语言,还有不同的方言,其差别程度也不相同。有的方言可以基本上相互理解,有的差别极大,好像是另一种语言,北京人听不懂广东话就是一个很好的例子。

不仅在不同的地区,有不同的语言和方言,就是在同一地区,不同的社会阶层,不同年龄的人之间都会有特殊的词汇来表达其独特的感情,使另一 阶层或不同年龄的人难以理解。如美国的黑人,他们虽然也使用英语,但是他们说的英语也有自己的特点,甚至被称为黑人英语。

在一种语言环境中掌握某种语言后,虽然也可以学会另一种或几种其他语言或方言,可是原语言或方言的口音很难完全改变,总会留下一定程度的原来所操语言的口音。熟悉语言的人往往就能从这些细微的差别中区分出说话人的家乡所在地及其身分和职业特征。

语言是文化的一个重要组成部分,甚至可以说没有语言也就不可能有文化,只有通过语言才能把文化一代代传下去。语言是保持生活方式的一个重要手段,几乎每个文化集团都有自己独特的语言。

语言是在特定的环境中,为了生活的需要而产生的,所以特定的环境必然会在语言上打上特定的烙印。另外,语言是人们交流思想的媒介,因此,它必然会对政治经济社会科技,乃至文化本身产生影响。语言这种文化现象是不断发展的,其现今的空间分布也是过去扩散、变化和发展的结果,所以,只有摆在时空的环境里才能全面地、深入地了解其与自然环境及人文环境的关系。


定义

语言的定义:以语音为物质外壳,由词汇和语法构成并能表达人类思想的符号系统。


特性

语言的特性有:创造性、结构性、意义性、指代性和社会性与个体性。


结构

语言的结构:音位语素、词、短语句子、全文。


种类

语言的种类:对话语言、独白语言、书面语言、内部语言

就大脑来说,语言分“脑语”和“嘴语”,脑语就是我们时时在大脑里产生称作“思考”或“思想”或“思维”的东西,脑语被嘴表达出来就叫“嘴语”。脑语和嘴语并不是一个东西,第一、脑语和嘴语在表达时失真;第二、嘴语不是脑语的唯一表达方式,因为脑语还可以通过肌肉群来表达:就是我们的行为。语言是一个人能力的重要表述部分。

语言分为“第一语言”和“第二语言”。

一个人从小通过和同一语言集团其它成员(如父母、亲属、周围的人们)的接触,自然学到并熟练运用于交际和思维过程中的语言。本族语言或母语一般说都是个人的第一语言,也是主要语言。

人出生后,首先掌握和使用的语言,叫第一语言。第二语言专指本国内非本族语。在全世界里,第二语言往往是和第一语言同时被使用的。


用途

语言的功能主要分为社会功能和思维功能两方面,其中社会功能包括信息传递功能和人际互动功能。

语言是思维工具和交际工具,它同思维有密切的联系,是思维的载体和物质外壳以及表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是人类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。语言具有稳固性和民族性

语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息但是这都只是一些固定的程式, 不能随机变化。只有人类才会把无意义的语音按照各种方式组合起来,成为有意义的语素,再把为数众多的语素按照各种方式组合成话语,用无穷变化的形式来表示变化无穷的意义。

人类创造了语言之后又创造了文字。文字是语言的视觉形式。文字突破了口语所受空间和时间的限制,能够发挥更大的作用。


文字

对于文字的发明,古人更加认为是一件了不起的大事。《淮南子》里说:“昔者仓颉作书而天雨粟,鬼夜哭。”最能表示文字的神力的是符号,这是跟口语里的咒语相当的东西。一般的文字也都沾上迷信的色彩,有字的纸不能乱扔,要放在有——“敬惜字纸”标签的容器里,积聚起来烧掉。文字里边当然也有避讳,嘴里不能说的名字,纸上也不能写;必得要写就得借用同音字,或者缺一笔。语言虽然可以作文字的基础,但语言毕竟不等于文字,尽管各国科学界和宗教界做出很大努力,然而世界上还有一半的语言没有相应的文字。


特征

符号性和系统性

首先,语言是社会约定俗成的表达观念的符号,符号的本质是社会的。它在某种程度上要逃避社会上某一些小集体,小圈子的意识。这是语言最主要的特征。语言是一种社会契约,一个社会接受一种表达手段而排斥另一种表达手段其实都是社会上的集体意识的习惯。或者可以说,没有好坏之分,关键是使用那一种表达方式。

语言符号是一种包含着两面性的实体。一方面语言是表示事物的名称的,所以任何语言都是概念的映像,即具有所指性;另外,语言要依托声音,这种媒介来表达所指,所以说语言也是声音的映像,声音是语言的另一个侧面,也就是说语言具有能指性。

任意性和线条性

所谓的任意性是指语言符号和文字能指所指之间是一种任意的连接关系(是不可论证的),即使有的可以论证,但是在普遍意义上来讲,还是不可论证的关系。这就是世界上的语言为什么各式各样的原因之一。

所谓的线条性是指语言的能指是依托声音来完成的,所以他只能在一维的声音的空间里传播,而不能突破声音的范围和能力,所以说在分析语言的时候语言使能在横向上依照词语出现的先后顺序来完成,这也造就了语言使用和表达的局限,但是语言的声音性,决定了语言的线性是不可消除的必然结果。

不变性和可变性

语言是一个处在不断地运动变化发展之中的体系,这个体系中的各个要素既有一定的稳定性,也有一定的变动性,稳定性是语言系统的已存在的前提,也是语言自身被大规模研习使用的必备条件,而变动性不仅仅是作为一个系统,语言内部的不断衍生、发展的规律所致,而且也是语言的传承性的表现。任何事物都是不断的运动变化发展的,新事物不断地产生,旧事物不断地消亡。语言也是这样,语言系统的变化虽然不是很明显,速度并不是很快,但是受到使用的推动以及社会、文化等等很多因素的影响,语言本身在不断的向着经济、简练、实用、包容力、表现力强的趋势发展。

语言内部的各个组成部分都有着不同方式、不同形态的变化,而且变化的多少快慢也是不一样的,但是在以往的研究中,我们逐渐掌握了越来越多的规律来解释、预测语言的变化。这不但体现了人们对于语言学的关注、探索取得了很多的成就同时也昭示了语言学的变化性还是有据可依,有律可循的。

传承性和交际性

语言从某种意义上来看,是人类文化得以传承和储存的有效载体。因此,它在自身的发展当中,逐步体现出很强的传承性和交际性。

所谓传承性,是指语言以自己的风格特色吸引或者促使人们在生活生产中自觉不自觉地通过语言这个工具直接或者间接影响着相关的人群,或者波及其他更广泛的区域。达到传承的效果。另外,语言在人类社会发展当中,不仅在人与人之间,古代人与现代人之间,中国人与外国人之间储存了文明的精华信息,承担文明发展的桥梁,同时,也由于语言本身的强大交际性功能,更显示出独特的交际功能,在丰富的交际中应对各种变化,产生更加有表达力的语言,产生更多的基于生活生产实际的意义。

表征 

语言表征】就是语言材料所负载的信息在头脑中存在的方式。语言的表征具有层次性。


加工

语言加工】就是对输入的语言信息进行编码、转换、存储、提取的过程。语言的加工可分为自动加工和受控制加工、系列加工和平行加工、模块化加工和交互作用式加工。


生理机制

1、语言的发音机制:呼吸器官喉头声带,口腔、鼻腔和咽腔。

2、语言活动的中枢机制:布洛卡区威尔尼克区角回

(1)布洛卡区病变引起的失语症通常称为运动性失语症或表达性失语症。

(2)威尔尼克区病变会引起接受性失语症,这是一种语言失认症。切断或损伤威尔尼克区与布洛卡区联系起来的神经纤维束-弓形束,也将产生同样的效果。

(3)角回实现口语和书面语言的转换。角回损伤将会引起语义性失语症。

3、语言在大脑两半球的一侧优势与语言活动。(割裂脑的研究),研究证实语言活动主要是大脑左半球的功能,但大脑右半球在语言理解中也有重要作用。


语音知觉

1、语音的物理性质:音高、音强、音长与音色。

2、音位是在一种语言中能够区别意义的最小的语音单位。音位分元音辅音。研究音位的区别特征有助于解释人对语音的感知。影响语音知觉的各种因素有:语音类似性,语音强度,噪音掩蔽,语境,句法、语义的作用。

3、影响词汇理解的因素:单词的部位信息、正字法规则字母长度或笔画数量、字形结构、字词的使用频率、语音的作用、语境的作用、语义的作用。

4、影响句子理解的因素:句子的类型、词序、语境、句法分析和语义分析。

5、影响话语理解的因素:推理、语境、图示作用。


语言起源

大致可以分为神授说和人创说,劳动创造说。


二、什么是自然语言?


自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人造语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。 自然语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的,也是各国人表达的方法其中之一。


简介


自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种由人蓄意为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人造语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。


发展


随着计算机和互联网的广泛应用,计算机可处理的自然语言文本数量空前增长,面向海量信息的文本挖掘、信息提取、跨语言信息处理、人机交互等应用需求急速增长,自然语言处理研究必将对我们的生活产生深远的影响。

自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的。随着计算机和互联网的广泛应用,,也随之衍生出了一系列的产品。相对而言,截止到2012年,国外在该领域的研究投入和成果都相对领先于国内,尤其汉语天然就相对于其他语种更为复杂,更为难以分析。

特点

自然语言处理发展的4个特点:

1. 基于句法—语义规则的理性主义方法受到质疑,随着语料库建设和语料库语言学的崛起,大规模真实文本的处理成为自然语言处理的主要战略目标;

2. 自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识;

3. 统计数学方法越来越受到重视;

4. 自然语言处理中越来越重视词汇的作用,出现了强烈的“词汇主义”的倾向。 

VB

在Visual Basic中 自然语言是指人类语言。是描述算法的一种方法。

缺陷

与自然语言相对的是逻辑语言。自然语言是人脑与人脑的交际工具 ,逻辑语言是人脑与电脑的交际工具。认知科学认为,思维和认知是知识的逻辑运算,任何计算化的自然语言分析都主要依赖逻辑语言对这种分析的表述。研究心智表现及其运算的认知科学理论追求的是心智研究的物质体现,这最终将导致语言学研究进入自然科学研究。自然语言的高度形式化描写对计算机程序的机械模仿至关重要,但理解力模仿不同于机械模仿,它们之间的区别非常类似自然语言中形式操作与意义操作之间的不同。机械模仿涉及的是形式性质,而理解力模仿涉及的却是准语义性质。现阶段计算机以机械模仿为主并通过逻辑语言与人类的自然语言对话。

现代逻辑作为分析自然语言的工具,认为自然语言的缺陷有:(1)表达式的层次结构不够清晰;(2)个体化认知模式体现不够明确;(3)量词管辖的范围不太确切;(4)句子成分的语序不固定;(5)语形和语义不对应。

从自然语言的视角衡量逻辑语言,其不足有:(1)初始词项的种类不够多样;(2)量词的种类比较贫乏;(3)存在量词的辖域在公式系列中不能动态的延伸;(4)由于语境的缺失而使语言传达信息的效率不高。


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/R1uNW1W/article/details/79683747

智能推荐

oracle 12c 集群安装后的检查_12c查看crs状态-程序员宅基地

文章浏览阅读1.6k次。安装配置gi、安装数据库软件、dbca建库见下:http://blog.csdn.net/kadwf123/article/details/784299611、检查集群节点及状态:[root@rac2 ~]# olsnodes -srac1 Activerac2 Activerac3 Activerac4 Active[root@rac2 ~]_12c查看crs状态

解决jupyter notebook无法找到虚拟环境的问题_jupyter没有pytorch环境-程序员宅基地

文章浏览阅读1.3w次,点赞45次,收藏99次。我个人用的是anaconda3的一个python集成环境,自带jupyter notebook,但在我打开jupyter notebook界面后,却找不到对应的虚拟环境,原来是jupyter notebook只是通用于下载anaconda时自带的环境,其他环境要想使用必须手动下载一些库:1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb__jupyter没有pytorch环境

国内安装scoop的保姆教程_scoop-cn-程序员宅基地

文章浏览阅读5.2k次,点赞19次,收藏28次。选择scoop纯属意外,也是无奈,因为电脑用户被锁了管理员权限,所有exe安装程序都无法安装,只可以用绿色软件,最后被我发现scoop,省去了到处下载XXX绿色版的烦恼,当然scoop里需要管理员权限的软件也跟我无缘了(譬如everything)。推荐添加dorado这个bucket镜像,里面很多中文软件,但是部分国外的软件下载地址在github,可能无法下载。以上两个是官方bucket的国内镜像,所有软件建议优先从这里下载。上面可以看到很多bucket以及软件数。如果官网登陆不了可以试一下以下方式。_scoop-cn

Element ui colorpicker在Vue中的使用_vue el-color-picker-程序员宅基地

文章浏览阅读4.5k次,点赞2次,收藏3次。首先要有一个color-picker组件 <el-color-picker v-model="headcolor"></el-color-picker>在data里面data() { return {headcolor: ’ #278add ’ //这里可以选择一个默认的颜色} }然后在你想要改变颜色的地方用v-bind绑定就好了,例如:这里的:sty..._vue el-color-picker

迅为iTOP-4412精英版之烧写内核移植后的镜像_exynos 4412 刷机-程序员宅基地

文章浏览阅读640次。基于芯片日益增长的问题,所以内核开发者们引入了新的方法,就是在内核中只保留函数,而数据则不包含,由用户(应用程序员)自己把数据按照规定的格式编写,并放在约定的地方,为了不占用过多的内存,还要求数据以根精简的方式编写。boot启动时,传参给内核,告诉内核设备树文件和kernel的位置,内核启动时根据地址去找到设备树文件,再利用专用的编译器去反编译dtb文件,将dtb还原成数据结构,以供驱动的函数去调用。firmware是三星的一个固件的设备信息,因为找不到固件,所以内核启动不成功。_exynos 4412 刷机

Linux系统配置jdk_linux配置jdk-程序员宅基地

文章浏览阅读2w次,点赞24次,收藏42次。Linux系统配置jdkLinux学习教程,Linux入门教程(超详细)_linux配置jdk

随便推点

matlab(4):特殊符号的输入_matlab微米怎么输入-程序员宅基地

文章浏览阅读3.3k次,点赞5次,收藏19次。xlabel('\delta');ylabel('AUC');具体符号的对照表参照下图:_matlab微米怎么输入

C语言程序设计-文件(打开与关闭、顺序、二进制读写)-程序员宅基地

文章浏览阅读119次。顺序读写指的是按照文件中数据的顺序进行读取或写入。对于文本文件,可以使用fgets、fputs、fscanf、fprintf等函数进行顺序读写。在C语言中,对文件的操作通常涉及文件的打开、读写以及关闭。文件的打开使用fopen函数,而关闭则使用fclose函数。在C语言中,可以使用fread和fwrite函数进行二进制读写。‍ Biaoge 于2024-03-09 23:51发布 阅读量:7 ️文章类型:【 C语言程序设计 】在C语言中,用于打开文件的函数是____,用于关闭文件的函数是____。

Touchdesigner自学笔记之三_touchdesigner怎么让一个模型跟着鼠标移动-程序员宅基地

文章浏览阅读3.4k次,点赞2次,收藏13次。跟随鼠标移动的粒子以grid(SOP)为partical(SOP)的资源模板,调整后连接【Geo组合+point spirit(MAT)】,在连接【feedback组合】适当调整。影响粒子动态的节点【metaball(SOP)+force(SOP)】添加mouse in(CHOP)鼠标位置到metaball的坐标,实现鼠标影响。..._touchdesigner怎么让一个模型跟着鼠标移动

【附源码】基于java的校园停车场管理系统的设计与实现61m0e9计算机毕设SSM_基于java技术的停车场管理系统实现与设计-程序员宅基地

文章浏览阅读178次。项目运行环境配置:Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。项目技术:Springboot + mybatis + Maven +mysql5.7或8.0+html+css+js等等组成,B/S模式 + Maven管理等等。环境需要1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。_基于java技术的停车场管理系统实现与设计

Android系统播放器MediaPlayer源码分析_android多媒体播放源码分析 时序图-程序员宅基地

文章浏览阅读3.5k次。前言对于MediaPlayer播放器的源码分析内容相对来说比较多,会从Java-&amp;amp;gt;Jni-&amp;amp;gt;C/C++慢慢分析,后面会慢慢更新。另外,博客只作为自己学习记录的一种方式,对于其他的不过多的评论。MediaPlayerDemopublic class MainActivity extends AppCompatActivity implements SurfaceHolder.Cal..._android多媒体播放源码分析 时序图

java 数据结构与算法 ——快速排序法-程序员宅基地

文章浏览阅读2.4k次,点赞41次,收藏13次。java 数据结构与算法 ——快速排序法_快速排序法