发表状态 | 已发表Published |
题名 | 基于概念的文本类别特征提取与文本模糊匹配 |
其他题名 | The Feature Extraction of Text Category and Text Fuzzy Matching Based on Concept |
作者 | |
发表日期 | 2002 |
发表期刊 | 计算机工程与应用/Computer Engineering and Applications
![]() |
ISSN/eISSN | 1002-8331 |
期号 | 16页码:97-99+104 |
摘要 | 文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点。该文给出一种新的类别特征提取与文本匹配方法。首先对术语特征权进行了综合计算,然后基于概念网络术语—概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理。在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算来对文本进行类别匹配。该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性。 |
其他摘要 |
Text feature extraction and text categorization is the focal point of basic research in the field of intelligent information service system.A novel method of category feature extraction and text fuzzy matching is presented in this paper.On the basis of comprehensive calculation,conversion from term space to concept space using term-concept mapping table of concept network and amplitude limiting procession on feature weight ,a statistic analysis is processed within categories and between categories.The category feature is then signified by two vectors:mean value and standard deviation.Furthermore,the category matching of text is implemented by using fuzz distance calculation.This new method eliminates the drawbacks of traditional IDF method and it can efficiently conduct text feature extraction thus to promote the accuracy of automation text categorization. |
关键词 | 概念网络 概念空间 特征提取 文本分类 模糊距离 Conceptual Network Concept Space Feature Extraction Text Categorization Fuzz distance |
DOI | 10.3321/j.issn:1002-8331.2002.16.033 |
URL | 查看来源 |
收录类别 | 中文核心期刊要目总览 |
语种 | 中文Chinese |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | https://repository.uic.edu.cn/handle/39GCC9TT/5785 |
专题 | 个人在本单位外知识产出 |
作者单位 | 1.中南大学信息科学与工程学院 长沙 410083 2.香港城市大学电脑工程与信息技术系 香港 |
推荐引用方式 GB/T 7714 | 罗三定,陆文彦,王浩等. 基于概念的文本类别特征提取与文本模糊匹配[J]. 计算机工程与应用/Computer Engineering and Applications, 2002(16): 97-99+104. |
APA | 罗三定, 陆文彦, 王浩, & 贾维嘉. (2002). 基于概念的文本类别特征提取与文本模糊匹配. 计算机工程与应用/Computer Engineering and Applications(16), 97-99+104. |
MLA | 罗三定,et al."基于概念的文本类别特征提取与文本模糊匹配". 计算机工程与应用/Computer Engineering and Applications .16(2002): 97-99+104. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
查看访问统计 |
谷歌学术 |
谷歌学术中相似的文章 |
[罗三定]的文章 |
[陆文彦]的文章 |
[王浩]的文章 |
百度学术 |
百度学术中相似的文章 |
[罗三定]的文章 |
[陆文彦]的文章 |
[王浩]的文章 |
必应学术 |
必应学术中相似的文章 |
[罗三定]的文章 |
[陆文彦]的文章 |
[王浩]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论