互联网的诞生,无疑是20世纪人类科技史上最伟大的事件之一,它使人类生活发生了深刻的变革,网络成为继报纸、广播、电视之后的“第四媒体”,创造了一种新的信息传播和交流方式,带来了交际环境、交际观念的更新,并由此形成了一种新的语言变体?D?D网络语言。
一般认为,网络语汇由三个部分构成:1、计算机和网络技术的专业术语。专业术语是网络固有的,表述的是网络语言所依托的客观技术背景的最基本要素和物质基础,与其他领域的专门术语具有同等性质,如Bandwidth(带宽)、Buffer(缓冲器)、Gateway(网关)、Hub(集线器)、IP address(IP地址)、Jumper(跳线)、LAN(局域网)、brorser(浏览器)等;2、与网络文化现象相关的术语,如“触网、网吧、网民、网恋、网龄、网友、网校、第四媒体、网上当铺、网上购物、网络文学、网络银行、电子名片、网络公寓、电子商务、政府上网、虚拟空间、信息高速公路”等;3、BBS、网络聊天等使用的特殊语汇,即网络交流经常使用的词语、数字、字母、符号等,如“美眉、恐龙、大虾、斑竹、帖子、楼上、楼下、GG(哥哥)、JJ(姐姐)、RPWT(人品问题)、PF(佩服),FT(晕倒)、596(我走了)、7456(气死我了)、9958(救救我吧)”等。这里所说的网络语汇专指第三部分。
BBS是英文Bulletin Board system的缩写,直译为“公告板系统”,也称电子公告牌。用户可以在不同的讨论区获取信息,也可以将自己要发布的信息或回应的帖子张贴到公告板上,与网友展开讨论。鉴于网络语汇集中体现在BBS、网络聊天等网络环境中,为了调查网络语汇使用状况,国家语言资源监测与研究中心网络媒体语言分中心建立了2005年中文BBS语料库,并对其用字用语情况进行了调查统计。
一、语料说明
本次调查的主要对象为我国高校的BBS网站。根据网络访问量、地域平衡性等因素,选择清华大学、南京大学、中山大学、浙江大学、华中科技大学、四川大学、南开大学等7所高校网站的BBS,下载了上述BBS的2005年的全部网页,共计601336个文本,l76574655字符次(不包括无法显示的字符)。为了对网络用语做动态考察,同时还下载了上述网站2000-2004年的全部BBS网页,共计l703033个网页,约40亿字符次。
二、调查内容
调查项目与计算方法同报纸、广播电视、网络的用字用词调查。
三、调查结果
(一)网络BBS汉字、符号的使用情况
说明:
1、本次统计没有甄别文本中的别字。
2、本次调查统计中共出现773种无法显示的字符,共计30363字符次,占全部语料字符的0.0l7%,在计算过程中没有包括这部分字符。这些字符可以分为以下几类
①不同的编辑软件进行格式转化时生成的特殊符号;
②用来代表网页图片的符号;
③文本处理过程中产生的乱码。
调查结果:
1、总字符数计l76574655字符次。
2、字符种数ll554个。
3、总汉字数计78087435字次,占总字符数的44.73%。
4、字种数9793个。
5、汉字覆盖率见020页图2-1。
6、各种符号总数指语料库中除汉字以外的符号的总数,计97587220字符次,占总字符数的55.07%。
7、符号种数l761个。这里的符号种,指语料库中除汉字以外的不同形式的符号。其中
半角标点总数14618368;
全角标点总数4782537;
标点数占总符号数的百分比l9.88%。
半角英文字母33183107;
全角英文字母25508;
英文字母数占总符号数的百分比34.03%。
符号中还包括数字、日语假名、希腊字母、西里尔字母、拉丁语字母、制表符、注音符号、几何图形符、数字运算符、零杂技术用符号等。
(二)网络BBS用语情况
说明:
1、本次调查通过互联网、《中国网络语言词典》(于根元主编,中国经济出版社2001年6月第1版)收集整理了常用网络用语1500余个,调查这些词语在2005年网络BBS语料库中的使用情况,结果只出现了869个。故本次调查以这869个网络用语作为调查用词语表。
2、由各种标点符号构成的表情符也是网络常用的表达方式,但因其形式不很固定,所以本次调查没有考察它们的使用情况。
3、为便于阅读,对每个网络词语做了简单的提示性解释。
4、根据词语变体的规则,把“555、5555、55555”等作为一个词语处理,给出一个总数据。
调查结果:
l、网络用语总数3678008词次。
2、网络用语种数758个。其中
汉字词种数367个,占网络用语种数的48.42%。
字母词种数223个,占网络用语种数的29.42%。
数字词种数136个,占网络用语种数的l7.04%。
其他32个,占网络用语种数的4.22%。
(三)BBS用字用语特点
1、 BBS的汉字、符号使用情况与平面媒体有明显差异,主要表现在:
(1)BBS的字符种数、汉字种数明显高于平面媒体,特别是汉字种数高达9793个。其中繁体字和构字部件的出现频次较低。
(2)汉字之外的各种符号所占比例达55.07%,高于汉字所占比例。
(3)高频字的使用情况与平面媒体相似,前127字覆盖率达50%;当覆盖率达90%时,使用汉字923个。覆盖率与字数的关系见图2-l。
图 2-1 盖率变化曲线
2、网络BBS词语的使用具有多样化和不稳定性,主要表现在:
(1)表达同一意义常有多种书面形式。例如“哥哥”可以写作GG或gg等;“感谢”可以写作39、3x、3Q、3Ks、SNQ、THX等;“再见”可以写作88、886、3l66、C、CU、CUL、BBN、BFN、TTYL等;“版主”可以写作“班主、斑竹、版竹、版猪、板猪”等。
(2)网络BBS由于表达方式的需要,往往迅速产生大量的近义词。例如“水鬼、水母、水手、水桶、水王、水仙”一组近义词,都是指灌水的人,但在使用时却有性别、等级、褒贬色彩等的差异。
(3)网络BBS由于多种表达方式共用,容易造成大量的一词多义或同形词。如表示“宝贝、孩子”用BB,表示“情人”也用BB,表示“byebye”还用BB;又如“BG”既可以表示“报告”,又可以表示“请客、饭局”或“男女恋爱”等。
3、网络BBS用语种数早期增长较快,但近期增长速度明显放缓。
以869个网络用语组成的调查用词语表作为参照系进行对比,2000年至2004年出现了其中的530个,占60.99%;2005年又出现了7个,占0.8l%;而2000年至2004年出现、2005年又隐去的有64个,占7.36%。详情如表2-l所示
表2-1 2000-2005年网络BBS用语对比
版权所有:中华人民共和国教育部 中文域名:教育部.政务
京ICP备10028400号-1 京公网安备11010202007625号 网站标识码:bm05000001