作者单位

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
手机远见搜索 |设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

自然语言处理中主题模型的发展  CNKI文献

主题模型在自然语言处理领域受到了越来越多的关注.在该领域中,主题可以看成是词项的概率分布.主题模型通过词项在文档级的共现信息抽取出语义相关的主题集合,并能够将词项空间中的文档变换到主题空间,得到文档在低维...

徐戈 王厚峰 《计算机学报》 2011年08期 期刊

关键词: 自然语言处理 / 主题模型 / 隐性语义索引 / LDA

下载(7241)| 被引(492)

基于大规模语料库的汉语词义相似度计算方法  CNKI文献

词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。该文研究了基于大规模语料库的汉语词义相似度计算方法,系...

石静 吴云芳... 《中文信息学报》 2013年01期 期刊

关键词: 词义相似度 / 上下文特征 / 权值选择 / 依存关系

下载(821)| 被引(57)

结合RNN和CNN层次化网络的中文文本情感分类  CNKI文献

提出一种多层网络H-RNN-CNN,用于处理中文文本情感分类任务。将文本按句子进行划分,引入句子层作为中间层,以改善文本过长带来的信息丢失等问题。模型中使用循环神经网络建模词语序列和句子序列,并通过卷积神经网络识...

罗帆 王厚峰 《北京大学学报(自然科学版)》 2018年03期 期刊

关键词: 中文情感分类 / 深度学习 / 卷积神经网络 / 循环神经网络

下载(743)| 被引(20)

基于马尔可夫逻辑的中文零指代消解  CNKI文献

中文零指代消解问题包括零指代项的识别和零指代项的消解2个相互关联的子任务.传统的方法在解决该问题时,往往不考虑2个子任务间的关联关系,比如识别出的零指代项必须被消解以及发生消解的必须是零指代项等约束.基于马...

宋洋 王厚峰 《计算机研究与发展》 2015年09期 期刊

关键词: 马尔可夫逻辑网络 / 中文零指代消解 / 零指代项识别 / 联合学习

下载(202)| 被引(7)

词汇计量研究与常用词知识库建设  CNKI文献

面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件...

俞士汶 朱学锋 《中文信息学报》 2015年03期 期刊

基于语义组块分析的汉语语义角色标注  CNKI文献

近些年来,中文语义角色标注得到了大家的关注,不过大多是传统的基于句法树的系统,即对句法树上的节点进行语义角色识别和分类。该文提出了一种与传统方法不同的处理策略,我们称之为基于语义组块分析的语义角色标注。在...

丁伟伟 常宝宝 《中文信息学报》 2009年05期 期刊

关键词: 计算机应用 / 中文信息处理 / 语义角色标注 / 语义组块分析

下载(800)| 被引(39)

基于浅层句法分析的中文语义角色标注研究  CNKI文献

语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想。因此该文将...

王鑫 孙薇薇... 《中文信息学报》 2011年01期 期刊

关键词: 语义角色标注 / 浅层句法分析 / 语素 / 构词法

下载(990)| 被引(29)

词义标注语料库建设综述  CNKI文献

词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍...

金澎 吴云芳... 《中文信息学报》 2008年03期 期刊

关键词: 计算机应用 / 中文信息处理 / 词义消歧 / 词义标注语料库

下载(1636)| 被引(40)

关键词自动标引的最大熵模型应用研究  CNKI文献

关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ...

李素建 王厚峰... 《计算机学报》 2004年09期 期刊

关键词: 关键词标引 / 关键词抽取 / 最大熵模型 / 信息抽取

下载(1427)| 被引(225)

动词对宾语的语义选择限制  CNKI文献

动词对论元的语义选择限制一直是自然语言处理研究领域一个备受关注的问题。本文选取现代汉语中4 6个高频的、可以带体词性宾语的动词,借助知网的名词语义分类体系,基于《人民日报》语料,考察了动词对宾语的语义选择限...

吴云芳 段慧明... 《语言文字应用》 2005年02期 期刊

关键词: 选择限制 / 名词语义分类 / 语义关系 / 词义消歧

下载(1376)| 被引(76)

综合型语言知识库的建设与利用  CNKI文献

语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义...

俞士汶 段慧明... 《中文信息学报》 2004年05期 期刊

关键词: 计算机应用 / 中文信息处理 / 语言处理 / 语言知识库

下载(950)| 被引(79)

浅层句法分析方法概述  CNKI文献

浅层句法分析是近年来自然语言处理领域出现的一个新的语言处理策略。它不要求得到完全的句法分析树,只要求识别其中的某些结构相对简单的成分。它将句法分析分解为两个子任务:(1)语块的识别和分析;(2)语块之间...

孙宏林 俞士汶 《当代语言学》 2000年02期 期刊

关键词: 浅层句法分析 / 统计方法 / 互信息方法 / 概率方法

下载(1940)| 被引(159)

采用无标注语料的动词和形容词主观性评级  CNKI文献

为了自动区分中文主观词和客观词,采用主观性线索和汉字的主观性两种手段对动词和形容词进行主观性度量.主观性的线索进一步被分成级差(gradability)线索和主体(subject)线索;根据这些线索,使用基于图的算法进行评级(...

徐戈 蒙新泛... 《软件学报》 2013年05期 期刊

关键词: 主观性 / 无标注语料 / 级差线索 / 主体线索

下载(215)| 被引(2)

文本自动校对技术研究综述  CNKI文献

概述了文本自动校对技术的产生背景,分析了中西文文本的各自特点以及它们之间的异同,对中西文文本校对的技术难点和解决方法以及国内外的研究现状进行了回顾和评述,探讨了文本校对技术未来的发展方向及需要解决的问题...

张仰森 俞士汶 《计算机应用研究》 2006年06期 期刊

关键词: 文本自动校对 / 孤立词校对策略 / 上下文相关的校对策略 / 语言模型

下载(1106)| 被引(91)

并列成分中心语语义相似性考察  CNKI文献

本文基于中文概念词典CCD,从《人民日报》语料中抽取了2101个名词性并列结构,对并列成分中心语的语义相似性进行了定量考察。结果表明,90%的并列结构的并列成分中心语的语义类是相同的,而有10%的并列结构其并列成分中...

吴云芳 《当代语言学》 2005年04期 期刊

关键词: 并列结构 / 并列成分 / 语义类 / 语义相似

下载(863)| 被引(36)

基于最大熵模型的组块分析  CNKI文献

采用最大熵模型实现中文组块分析的任务 .首先明确了中文组块的定义 ,并且列出了模型中所有的组块类型和组块标注符号 .组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程 ,我们可以把它作为一...

李素建 刘群... 《计算机学报》 2003年12期 期刊

关键词: 组块分析 / 语法分析 / 最大熵原理 / 浅层分析

下载(752)| 被引(179)

基于规则与统计相结合的中文文本自动查错模型与算法  CNKI文献

中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并...

张仰森 曹元大... 《中文信息学报》 2006年04期 期刊

关键词: 计算机应用 / 中文信息处理 / 中文文本自动查错 / 规则与统计相结合

下载(579)| 被引(59)

信息处理用词语义项区分的原则和方法  CNKI文献

本文探讨了面向汉语信息处理的词语义项区分应该遵守的原则和方法。先界定了作为计算机自动词义消歧对象的多义词的范围;然后指出面对大规模真实文本,词语义项区分应具有可操作性,即应具有完备性和离散性;最后论证了上...

吴云芳 俞士汶 《语言文字应用》 2006年02期 期刊

关键词: 义项 / 多义词 / 词义标注 / 词义消歧

下载(742)| 被引(44)

基于最大间隔马尔可夫网模型的汉语分词方法  CNKI文献

分词是汉语自然语言处理研究中非常重要的一个环节,在早先的研究中,最大熵模型和条件随机场(CRF)模型已经广泛运用到汉语自动分词的工作中。最大间隔马尔可夫网(M3N)模型是近年来由B.Taskar等[1]人提出的一种新型结构...

李月伦 常宝宝 《中文信息学报》 2010年01期 期刊

关键词: 计算机应用 / 中文信息处理 / 最大间隔马尔可夫网模型 / 汉语分词

下载(506)| 被引(23)

隐喻自动处理研究进展  CNKI文献

隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几...

贾玉祥 俞士汶... 《中文信息学报》 2009年06期 期刊

关键词: 人工智能 / 机器翻译 / 隐喻自动处理 / 自然语言处理

下载(538)| 被引(18)

学术研究指数分析(近十年)详情>>

  • 发文趋势

热门学者(按发文篇数排行)

相关机构

时间的形状