中国大学生英汉汉英口笔译语料库(外研社英汉语料库系列)(附赠DVD光盘2张)

分類: 图书,英语与其他外语,大学英语,翻译,
品牌: 文秋芳
基本信息·出版社:外语教学与研究出版社
·页码:123 页
·出版日期:2008年
·ISBN:7560079008/9787560079004
·条形码:9787560079004
·包装版本:1版
·装帧:平装
·开本:32
·正文语种:中文/英语
·丛书名:外研社英汉语料库系列
·附带品描述:附赠DVD光盘2张
产品信息有问题吗?请帮我们更新产品信息。
内容简介“中国大学生英汉汉英口笔译语料库”(Parallel Corpus of ChineseEFL Learners,简称PACCEL)是我国第一个学习者英汉、汉英口笔译语料库,收录了我国大学英语专业三、四年级学生的口译和笔译翻译测试语料,设计总规模为150万字词,实际收录210万字词。PACCEL分为两个子库:口译平行语料库(Parallel Corpus of chineseEFIJ Learners-Spoken,简称PACCEL-s)和笔译平行语料库(ParallelCorpus of Chinese EFL Leallaers-Written,简称PACCEL-W)。其中,口译部分约50万字词,笔译部分约160万字词。PACCEL的建成对于我们了解和研究中国人学英语的全貌具有重大意义,在口笔译教学研究、翻译测试、教材编写、英语师资培训以及英语网络课程建设等方面具有重大价值。
硬件最低要求:
PII300或以上频率CPU,64MB及以上内存,DVD光驱,16位以上声卡,200MB或以上硬盘空间。
软件运行要求:
MS-Windows 2000或更高,Windows Media Player 6.4或更高。
PACCEL语料库光盘的总体结构包含三个部分:口译语料库、笔译语料库以及检索工具。口译语料库包含语音文件和文本文件,文本文件包含学生的完整英汉、汉英译作和经过句级对齐的平行语料,平行语料又进一步分为生文本和经过词性赋码的文本。笔译语料只包含文本语料,其分级格式与口译部分相同,同时笔译平行语料也包含生文本和词性赋码文本。本手册共四章,第一章为绪论部分,对PACCEL进行了总体介绍;第二章详细介绍了PACCEL的口译语料库;第三章详细介绍PACCEL的笔译语料库;最后一章对PACCEL检索工具的使用进行了详细说明。
编辑推荐我国首个大型学习者英汉、汉英口笔译语料库;包含最真实的学习者口笔译样本,2003-2007年八级考试口译部分全部的语音语料;50万字词的语音转写口译平行语料;160万字词的笔译平行语料。 《中国大学生英汉汉英口笔译语料库》收录了全国18所高等院校英语专业三、四年级学生的英汉、汉英口译和笔译翻译测试语料,其中包括完整的11译语音语料以及根据语音语料转写而成的口译文字语料。
目录
第一章 绪论
1.1 PACCEL建设背景
1.2 PACCEL概述
1.2.1 PACCEL-S简介
1.2.2 PACCEL-w简介
1.2.3 PACCEL总体结构
1.3 PACCEL项目组概况
1.3.1 项目组的构成
1.3.2 提供口笔译语料的学校(排名不分先后)
1.3.3 项目参与人员(排名不分先后)
1.4 PACCEL的安装使用
1.4.1 PACCEL的文件格式
1.4.2 PACCEL的运行要求
1.4.3 PACCEL的安装步骤
第二章 PACCEL-S
2.1 PACCEL-S的建库程序
2.2 语料来源
2.2.1 口试内容
2.2.2 口试评分标准
2.2.3 口试评分步骤
2.3 样本的选择
2.4 转录与转写
2.4.1 声音语料的转录与命名
2.4.2 语音语料的转写与命名
2.5 规模与结构
2.5.1 规模
2.5.2 结构
2.6 文本头标记
2.7 词性赋码
第三章 PACCEL-W
3.1 PACCEL-W的建库程序
3.2 样本的选择
3.3 语料转写
3.4 规模与结构
3.5 文本头标记
3.6 词性赋码
第四章 PACCEL检索工具简介
4.1 ParaConc初始设置
4.1.1 启动
4.1.2 加载语料
4.1.3 标注设置
4.2 ParaConc检索
4.2.1 一般检索
4.2.2 检索设置
4.2.3 高级检索(Advanced Search)
4.2.4 平行检索
4.3 词频统计(Frequency)
4.3.1 词频同现数据(Collocate Frequency Data)
4.3.2 高级同现(Advanced Collocation)
4.3.3 词频排序(Frequency Order)和字母排序(Alphabetical Order)
4.3.4 词频选项(Frequency Option)
参考文献
附录一 PACCEL-S 2003-2007年TEM 8口语试题
附录二 PACCEL-W试题
附录三 PACCEL词性赋码集
……[看更多目录]
序言“中国大学生英汉汉英口笔译语料库”(Palallel corpus of chineseEFL Learners,简称PACCEL)是我国第一个学习者英汉、汉英口笔译语料库,收录了我国大学英语专业三、四年级学生的口译和笔译翻译测试语料,设计总规模为150万字词,实际收录210万字词。PACCEL分为两个子库:口译平行语料库(Parallel Corpus of chinese EFL Learners-Spoken,简称PACCEL-S)和笔译平行语料库(Parallel corpus of Chinese EFL Learnets-Written,简称PACCEL-W)。其中,口译部分约50万字词,笔译部分约160万字词。PACCEL的建成对于我们了解和研究中国人学英语的全貌具有重大意义,在口笔译教学研究、翻译测试、教材编写、英语师资培训以及英语网络课程建设等方面具有重大价值。
PACCEL语料库光盘的总体结构包含三个部分:口译语料库、笔译语料库以及检索工具。口译语料库包含语音文件和文本文件,文本文件包含学生的完整英汉、汉英译作和经过句级对齐的平行语料,平行语料又进一步分为生文本和经过词性赋码的文本。笔译语料只包含文本语料,其分级格式与口译部分相同,同时笔译平行语料也包含生文本和词性赋码文本。本手册共四章,第一章为绪论部分,对PACCEL进行了总体介绍;第二章详细介绍了PACCEL的口译语料库;第三章详细介绍PAccEL的笔译语料库;最后一章对PACCEL检索工具的使用进行了详细说明。
文摘插图:

2.4 转录与转写
由于磁带语音的应用有很大的局限性,不利于语音研究的开展,因此磁带录音转录为电子音频是一项必经的程序,而转为电子音频仅仅是建库的第一步。语音转写,即将电子语音转写为文本格式的文档,是建库过程中最为复杂、也是最为繁重的任务,需要投入大量的人力和资源,只有实现了这一步才能使文本检索成为可能。
2.4.1 声音语料的转录与命名
为了保证声音语料转录的质量,转录时采用专业的音频设备与计算机连接,一边播放磁带,一边采集语音。本语料库中的语音文件采用使用最广泛的MP3格式保存,既保证了文件大小适中,也保证了磁带语音的转录质量。转录完成后,语音文件分别按照年份、组别、序号进行了命名,例如2003年第20组第1盒磁带则命名为03-20-01,所有同一组别的磁带均放在同一文件夹内。