全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
手机远见搜索 |设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
发文数量
被引数量
学者研究热点:
    引用
    筛选:
    文献类型 文献类型
    学科分类 学科分类
    发表年度 发表年度
    基金 基金
    研究层次 研究层次
    排序:
    显示:
    CNKI为你找到相关结果

    基于递归神经网络的语音识别快速解码算法  CNKI文献

    递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用...

    张舸 张鹏远... 《电子与信息学报》 2017年04期 期刊

    关键词: 语音识别 / 递归神经网络 / 解码器 / 跳帧计算

    下载(549)| 被引(14)

    基于改进主题分布特征的神经网络语言模型  CNKI文献

    在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的...

    刘畅 张一珂... 《电子与信息学报》 2018年01期 期刊

    关键词: 语音识别 / 语言模型 / 隐含狄利克雷分布 / 长短时记忆

    下载(211)| 被引(5)

    基于对抗训练策略的语言模型数据增强技术  CNKI文献

    基于最大似然估计(Maximum likelihood estimation,MLE)的语言模型(Language model,LM)数据增强方法由于存在暴露偏差问题而无法生成具有长时语义信息的采样数据.本文提出了一种基于对抗训练策略的语言模型数据增强的...

    张一珂 张鹏远... 《自动化学报》 2018年05期 期刊

    关键词: 数据增强 / 语言模型 / 生成对抗网络 / 强化学习

    下载(397)| 被引(5)

    基于注意力LSTM和多任务学习的远场语音识别  CNKI文献

    由于背景噪声、混响以及人声干扰等因素,远场语音识别任务一直充满挑战性。该文针对远场语音识别任务,提出基于注意力机制和多任务学习框架的长短时记忆递归神经网络(long short-term memory,LSTM)声学模型。模型中嵌...

    张宇 张鹏远... 《清华大学学报(自然科学版)》 2018年03期 期刊

    关键词: 语音识别 / 长短时记忆 / 声学模型 / 注意力机制

    下载(508)| 被引(8)

    小资源下语音识别算法设计与优化  CNKI文献

    可穿戴设备和智能家居系统需要语音识别引擎占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源系统的这种需求。该文针对小资源下语音识别系统,在解码策略和拒识算法设计上均提出了改进方法。在...

    张鹏远 计哲... 《清华大学学报(自然科学版)》 2017年02期 期刊

    关键词: 语音识别 / 小资源 / 置信度

    下载(354)| 被引(4)

    基于维特比算法的深度神经网络语音端点检测  CNKI文献

    语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但...

    李文洁 张晴晴... 《重庆邮电大学学报(自然科学版)》 2018年02期 期刊

    关键词: 语音端点检测 / 深度神经网络 / 维特比 / 语音识别

    下载(218)| 被引(2)

    基于动态时间规整的语音关键词检索算法  CNKI文献

    提出一种通过声学模板匹配进行基于音频模板的语音关键词检索算法。该算法通过动态时间规整将音频模板与待检索语音进行匹配,获得音频模板所对应的关键词的出现位置。为了提升匹配质量,本文对音频模板进行筛选和预处理...

    张舸 张鹏远... 《网络新媒体技术》 2019年01期 期刊

    关键词: 关键词检索 / 动态时间规整 / 模板匹配 / 模板预处理

    下载(108)| 被引(2)

    双向长短时记忆模型训练中的空间平滑正则化方法研究  CNKI文献

    双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构。但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进...

    李文洁 葛凤培... 《电子与信息学报》 2019年03期 期刊

    关键词: 语音信号处理 / 空间平滑 / 双向长短时记忆模型(LSTM) / 正则化

    下载(131)| 被引(0)

    卷积神经网络声学模型的结构优化和加速计算  CNKI文献

    将卷积神经网络(convolutional neural networks,CNN)声学模型应用于中文大词表连续电话语音识别任务中,分析了卷积层数、滤波器参数等变量对CNN模型性能的影响,最终在中文电话语音识别测试中,CNN模型相比传统的全连接...

    王智超 徐及... 《重庆邮电大学学报(自然科学版)》 2018年03期 期刊

    关键词: 语音识别 / 声学模型 / 卷积神经网络 / 矢量化

    下载(132)| 被引(2)

    汉语自然口语中声调识别的研究  CNKI文献

    汉语是一种带声调的语言,声调信息在汉语识别中具有非常重要的意义.传统的声调识别一般只研究朗读式语音中相对标准的声调,很少对声调调型比较复杂的自然口语进行专门的处理.针对汉语自然口语的特点,在声调建模单元的...

    刘赵杰 邵健... 《物理学报》 2007年12期 期刊

    关键词: 声调识别 / 自然口语 / 真实上下文模型 / 聚类

    下载(394)| 被引(11)

    连接时序分类准则声学建模方法优化  CNKI文献

    对基于连接时序分类准则(connectionist temporal classification, CTC)的端到端声学建模方法进行研究和优化。研究分析了不同声学特征、建模单元以及神经网络结构对CTC声学模型性能的影响,针对CTC模型中blank符号共享...

    王智超 张鹏远... 《声学学报》 2018年06期 期刊

    关键词: CTC / 音素序列 / 声学建模 / 神经网络结构

    下载(81)| 被引(1)

    广播新闻语音的关键词检测系统  CNKI文献

    提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词...

    张鹏远 邵健... 《通信学报》 2007年12期 期刊

    关键词: 关键词检测 / 音节识别器 / 置信度计算

    下载(168)| 被引(12)

    基于SVD的DNN裁剪方法和重训练  CNKI文献

    深层神经网络(DNN)的参数量巨大,限制了其在一些计算资源受限或是注重速度的应用场景中的应用。为了降低DNN参数量,有学者提出利用奇异值分解(SVD)对DNN进行裁剪,然而其方法缺乏自适应性,因为它会从所有隐层裁减掉同样...

    邢安昊 张鹏远... 《清华大学学报(自然科学版)》 2016年07期 期刊

    关键词: 语音识别 / 深层神经网络(DNN) / 奇异值分解(SVD)

    下载(108)| 被引(1)

    基于指纹权重的音频模板检索方法  CNKI文献

    针对音频模板检索方法在噪音和频谱缺失等环境下鲁棒性不够强的问题,在原有Philips检索方法的基础上,提出了一种以帧能量差作为权重的检索方法,即充分利用原方法忽略的能量信息,通过对不同音频帧的DNA设置不同的匹配权...

    张学帅 邹学强... 《中国科技论文》 2018年20期 期刊

    关键词: 音频检索 / 音频指纹 / 索引 / 样例检索

    下载(48)| 被引(0)

    基于异构计算的语音识别解码加速方法  CNKI文献

    提出一种基于异构计算方法加速基于神经网络声学模型的语音识别解码器的方法。该方法通过GPU和CPU协同计算,利用GPU的浮点运算能力和并行计算能力加速神经网络计算,从而加快语音识别解码过程。为了充分利用计算资源,本...

    张舸 张鹏远... 《网络新媒体技术》 2019年03期 期刊

    关键词: 语音识别 / 解码器 / 异构计算 / 神经网络

    下载(26)| 被引(0)

    关键词检测系统中基于音素网格的置信度计算  CNKI文献

    该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采...

    张鹏远 韩疆... 《电子与信息学报》 2007年09期 期刊

    关键词: 语音识别 / 关键词检测 / 置信度 / 后验概率

    下载(196)| 被引(6)

    一种任务域无关的语音关键词检测系统  CNKI文献

    提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共...

    韩疆 刘晓星... 《通信学报》 2006年02期 期刊

    关键词: 声学置信度 / 多尺度声学建模 / 搜索空间

    下载(161)| 被引(6)

    基于多任务学习的神经网络语言模型建模方法  CNKI文献

    针对特定的语言模型建模任务而言,领域相关的语料往往非常稀缺。针对此问题,本文提出了一种基于状态子空间共享的多任务学习模型,并将其应用于多个低资源的递归LSTM神经网络语言模型建模任务中。实验证明,相比于单任务...

    张一珂 张鹏远... 第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集 2017-10-11 中国会议

    关键词: 语音识别 / 语言模型 / 多任务学习 / 状态子空间共享

    下载(91)| 被引(1)

    基于注意力LSTM和多任务学习的远场语音识别  CNKI文献

    由于背景噪声,混响以及人声干扰等因素,远场语音识别任务一直充满挑战性。本文针对远场语音识别任务提出基于注意力机制和多任务学习框架的长短时记忆递归神经网络声学模型。模型中嵌入的注意力机制使其自动学习调整对...

    张宇 张鹏远... 第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集 2017-10-11 中国会议

    关键词: 远场语音识别 / 长短时记忆 / 声学模型 / 注意力机制

    下载(121)| 被引(0)

    一种小资源下语音识别算法设计与优化  CNKI文献

    在可穿戴设备和智能家居系统的实际应用中,语音识别引擎需要占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源的这种需求,本文在解码策略和拒识算法设计上均提出了改进方法。解码策略方面,通过...

    张鹏远 计哲... 第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集 2015-10-25 中国会议

    关键词: 语音识别 / 小资源 / 置信度

    下载(87)| 被引(3)

    学术研究指数分析(近十年)详情>>

    • 发文趋势

    获得支持基金

      同机构合作作者

      其他机构合作作者

      主要合作者关系图

      轻松读懂《孙子兵法》