在学习和生活中,我们时常会遇到语音转文字的问题,如讲座音频转成文稿、提取歌曲中的歌词文本等。其实,我们身边有很多语音转文字的工具可以使用,它们各有所长。这里介绍一款好用且免费的语音转文字工具——网易见外工作台。网易见外工作台是由网易提供的智能转写翻译在线服务平台,它主要有视频翻译、视频转写、字幕翻译、文档翻译、语音翻译、语音转写、会议同传、图片翻译8项功能,下面主要介绍它的语音转写,也就是语音转文字的功能。
网易见外工作台的语音转写功能操作步骤如下:
①在网页中输入网址或搜索打开网易见外工作台。
②输入网易邮箱账号和密码,登录网易见外工作台。
③在工作台界面的右上方单击“新建项目”,如图1.14所示。
图1.14 新建项目
④在新建项目中单击“语音转写”选项,如图1.15所示。
图1.15 语音转写
⑤在语音转写界面中填写项目名称,上传音频文件,选择文件语言,选择出稿类型后单击“提交”按钮,如图1.16所示。
图1.16 填写和提交
⑥等待工作台处理,完成后在音频栏目中找到转录文稿,单击话筒图标进入在线校译界面,如图1.17所示。
图1.17 在线校译
⑦借助原语音对文本进行校对,可以使用平台提供的语气词过滤、词汇替换功能来实现,如图1.18所示。校对完毕后单击“导出”按钮生成文稿文件,如图1.19所示。
图1.18 文本校对
图1.19 生成的文稿
①如果没有网易邮箱,需要事先注册一个网易邮箱账号。
②网易见外工作台大部分的功能是免费的,可上传500 MB以内的音频用于转文字。
③在上传过程中如果出现页面不全或卡顿的情况,可刷新网页解决问题。
词频分析是近年来较为热门的文本分析方法,其功能主要是对文本内容进行拆字拆词,进而统计每个字或词在文本中出现的频率。该方法可以帮助我们把握文本主题,找到关键字。例如,在科学研究中,研究者借助词频分析工具统计文献核心内容的关键词或主题词在总样本中出现的频次来确定此领域的研究重点和发展动向;在经济领域,经济学家借助词频分析工具统计两会的政府工作报告中国家重点关注的领域和方向,并从中找到研究方向和投资机会。
实现词频统计的方法有很多,编写词频统计程序、借助词频统计工具都可以。微词云是一个在线文字云、在线词云图生成器,支持在线分词、词频分析等功能。微词云可以自动将文本进行分词,并生成词云图,也可以导出词频统计的结果。微词云的具体使用步骤如下:
①在网页中输入网址或搜索打开微词云,单击“开始创建”或“创建词云”按钮。
②单击右上角的“登录”按钮,使用微信或手机号登录微词云,如图1.20所示。
图1.20 登录微词云
③单击左上角的“导入单词”,再选择“分词筛词后导入”,将整段文本复制到文本框中,单击右下角的“开始分词”按钮,如图1.21所示。
图1.21 导入与分词
④单击“确定使用所选单词”按钮,如图1.22所示。
图1.22 确定使用所选单词
⑤单击“加载词云”按钮获取词云图,单击“导出”按钮获取词频分析结果,如图1.23所示。同时,用户可在左侧菜单栏中对词云图的形状、配置、插图和字体进行个性化设置。
图1.23 加载词云与导出