全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
手机远见搜索 |设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
发文数量
被引数量
学者研究热点:
    引用
    筛选:
    文献类型 文献类型
    学科分类 学科分类
    发表年度 发表年度
    基金 基金
    研究层次 研究层次
    排序:
    显示:
    CNKI为你找到相关结果

    文本挖掘、数据挖掘和知识管理——二十一世纪的智能信息处...  CNKI文献

    本文首先介绍了数据挖掘、文本挖掘和知识管理等概念 ,然后从技术角度出发 ,将知识管理划分为知识库、知识共享和知识发现三个阶段 ,分析了作为最高阶段的知识发现的关键技术和意义 ,最后指出在文本中进行知识发现是新...

    韩客松 王永成 《情报学报》 2001年01期 期刊

    关键词: 文本挖掘 / 数据挖掘 / 知识管理 / 知识发现

    下载(2181)| 被引(141)

    改进的多模式匹配算法  CNKI文献

    在有限自动机的多模式匹配算法 (DFSA算法 )的基础上 ,结合 Quick Search算法的优点 ,提出了一个快速的多模式字符串匹配算法 .之后在算法中以连续跳跃的思想 ,给出了另一个更加有效的改进 .在一般情况下 ,这两个算法...

    王永成 沈州... 《计算机研究与发展》 2002年01期 期刊

    关键词: 匹配 / 字符串 / 有限自动机 / 多模式匹配

    下载(849)| 被引(171)

    一种改进的快速分词算法  CNKI文献

    首先介绍了一种高效的中文电子词表数据结构 ,它支持首字 Hash和标准的二分查找 ,且不限词条长度 ;然后提出了一种改进的快速分词算法 ,在快速查找两字词的基础上 ,利用近邻匹配方法来查找多字词 ,明显提高了分词效率...

    陈桂林 王永成... 《计算机研究与发展》 2000年04期 期刊

    关键词: 分词 / Hash / 二分查找 / 近邻匹配

    下载(837)| 被引(193)

    一种基于字同现频率的汉语文本主题抽取方法  CNKI文献

    主题抽取是文本自动处理的基础工作之一 ,而主题的抽取一直以分词或者抽词作为第 1步 由于汉语词间缺少明显的间隔 ,因此分词和抽词的效果往往不够理想 ,从而在一定程度上影响了主题抽取的质量 提出以字为处理单位 ...

    马颖华 王永成... 《计算机研究与发展》 2003年06期 期刊

    关键词: 自然语言处理 / 主题抽取 / 同现频率

    下载(625)| 被引(105)

    对网页PageRank算法的改进  CNKI文献

    分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构...

    宋聚平 王永成... 《上海交通大学学报》 2003年03期 期刊

    关键词: 搜索引擎 / 网页 / 超链分析 / PageRank

    下载(1031)| 被引(129)

    网页去重策略  CNKI文献

    提出基于同源网页去重与内容去重的策略.通过对网址URL进行哈希散列完成对同源网页的去重,并对内容相同或近似的网页采用基于主题概念的去重判断.实验表明,该方法有效且去重效果良好.基于上述算法实现了教育资源库教育...

    高凯 王永成... 《上海交通大学学报》 2006年05期 期刊

    关键词: 信息检索 / 搜索引擎 / 哈希函数 / 主题概念

    下载(711)| 被引(50)

    基于用户访问路径分析的网页预取模型  CNKI文献

    随着网络信息的飞速增长,互联网已成为人们获取信息的重要来源.但是,受限于网络带宽,用户往往需要忍受较长的访问延时.为了缓解这种情况,人们提出了网页预取技术,用于降低用户的访问延迟,提高Web服务器的服务质量.提出...

    许欢庆 王永成 《软件学报》 2003年06期 期刊

    关键词: 网页预取 / 潜在需求概念 / 隐马尔可夫模型

    下载(468)| 被引(78)

    HTML文件的文本信息预处理技术  CNKI文献

    介绍了一种常用的文件类型HTML文件的文本信息预处理技术。该方法能够解析HTML文件的组成结构,并从中提取出主体文本以供处理。测试表明该方法能有效地得到大部分HTML网页的主体部分。文中对HTML文件的解析不仅可以用...

    王志琪 王永成 《计算机工程》 2006年05期 期刊

    关键词: HTML / 文本信息 / 预处理

    下载(760)| 被引(43)

    一种快速的多模式字符串匹配算法  CNKI文献

    以基于有限自动机的多模式匹配算法 (DFSA)为基础 ,结合 Boyer- Moore(BM)和 QuickSearch (QS)快速单模式匹配算法的优点 ,提出了一种快速的多模式字符串匹配算法 .在一般情况下 ,该算法不需要匹配目标文本串中的每个...

    许一震 王永成... 《上海交通大学学报》 2002年04期 期刊

    关键词: 匹配 / 有限自动机 / 多模式匹配

    下载(654)| 被引(76)

    基于加权概念网络的用户兴趣建模  CNKI文献

    提出了一种基于加权概念网络(WCN)的用户兴趣建模方法,该方法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系,建立WCN的用户模型,从而捕捉和表述用户兴趣偏好.基于WCN用户兴趣模型,提出了检索提问个性...

    许欢庆 王永成 《上海交通大学学报》 2004年01期 期刊

    关键词: 加权概念网络 / 用户建模 / 概念映射

    下载(463)| 被引(66)

    无词典高频字串快速提取和统计算法研究  CNKI文献

    本文提出了一种快速的高频字串提取和统计方法。使用Hash技术 ,该方法不需要词典 ,也不需要语料库的训练 ,不进行分词操作 ,依靠统计信息 ,提取高频字串。用语言学知识进行前缀后缀等处理后 ,得到的高频字串可以作为未...

    韩客松 王永成... 《中文信息学报》 2001年02期 期刊

    关键词: Hash技术 / 高频字串 / 统计 / 算法

    下载(372)| 被引(98)

    中文全文标引的主题词标引和主题概念标引方法  CNKI文献

    中文全文标引正在越来越受到重视。本文主要研究了三个方面的问题 ,首先是全文主题词标引的加权问题 ,综合考虑了五个方面的因素 ;其次是介绍了一种用层次概念词典改进主题词标引质量的新方法 ;最后又提出了用三种不同...

    韩客松 王永成 《情报学报》 2001年02期 期刊

    关键词: 主题词标引 / 主题概念标引 / 层次概念词典 / 自动标引

    下载(497)| 被引(78)

    An improved TF-IDF approach for text classification  CNKI文献

    This paper presents a new improved term frequency/inverse document frequency (TF-IDF) approach which uses confidence, support and characteristic words to enhance the recall and precision of text cla...

    张云涛 龚玲... 《Journal of Zhejiang University Science A(Science in Eng...》 2005年01期 期刊

    关键词: Term / frequency/inverse / document / frequency

    下载(303)| 被引(49)

    文本自动分类中的词权重与分类算法  CNKI文献

    本文详细阐述了自动分类中的词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了两种典型的分类算法———Bayes判别准则与向量空间模型 (VSM) ,并提出结合词权重和分类算法进行分类的具体...

    刁倩 王永成... 《中文信息学报》 2000年03期 期刊

    关键词: 自动分类 / IDF / Bayes判别准则 / 向量空间模型(VSM)

    下载(487)| 被引(91)

    基于综合方法的文本主题句的自动抽取  CNKI文献

    提出了基于综合方法的主题句的提取方法,并着重讨论了文本主题概念的提取以及相应的权值体系.根据概念间的相互关系,对同义概念进行语义归并,对上下位概念进行语义聚焦,模拟人工标引专家在分析文本主题时的“兼顾各个...

    张云涛 龚玲... 《上海交通大学学报》 2006年05期 期刊

    关键词: 主题句 / 主题抽取 / 文本压缩

    下载(355)| 被引(34)

    搜索引擎中Robot搜索算法的优化  CNKI文献

    目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长...

    宋聚平 王永成... 《情报学报》 2002年02期 期刊

    关键词: 搜索引擎 / 超链接 / Robot / PageRank

    下载(435)| 被引(43)

    自动文摘系统评价方法的研究与实践  CNKI文献

    自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的...

    沈洲 王永成... 《情报学报》 2001年01期 期刊

    关键词: 自然语言处理 / 自动文摘 / 评价方法

    下载(316)| 被引(39)

    一种用于主题提取的非线性加权方法  CNKI文献

    主题提取是文本处理的一项重要工作。本文首先分析了主题抽取中加权方法形成时的一些定量问题 ,然后提出了主题相关词一种非线性加权处理方法 ,对比实验结果显示它不仅是一种比较稳健的方法 ,而且能在一定程度上提高主...

    韩客松 王永成 《情报学报》 2000年06期 期刊

    关键词: 主题提取 / 非线性 / 加权

    下载(410)| 被引(63)

    Web页面中文文本主题的自动提取研究  CNKI文献

    Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间...

    韩客松 王永成... 《情报学报》 2001年02期 期刊

    关键词: Web页面文本 / 主题抽取 加权

    下载(279)| 被引(34)

    OA中文文献自动摘要系统  CNKI文献

    本文概括地介绍了研究与开发中文文献自动摘要系统的必要性、突破口的选择、发展进化的简史、已达到的最新水平以及实现的诀窍

    王永成 许慧敏 《情报学报》 1997年02期 期刊

    关键词: 中文 / 自动摘要 / 技术诀窍 / 最新水平

    下载(312)| 被引(99)

    学术研究指数分析(近十年)详情>>

    • 发文趋势

    获得支持基金

      同机构合作作者

      其他机构合作作者

      主要合作者关系图

      时间的形状