公司名称:九九信用 大象金服北京科技有限公司

联系人:张 先生 (CEO)

电话:010-62648216

传真:

手机:

供应NLPIR大数据语义系统助中文处理行业深度应用

发布时间:05月06日

详细说明

  进入21世纪,面对网络时代信息的爆炸式增长,中文信息处理作为一项基础性、普适特性的信息技术,面临着挑战和再次发展的机遇,在互联网时代则显示出其优势。它的开发利用关系到我国今后信息产业乃至社会经济的发展和安全,具有巨大的经济价值和社会价值。
  汉语在世界上属于汉藏语系,是一种孤立语。汉语在历史上先后吸收和同化了匈奴、鲜卑、突厥、契丹、满、蒙古、梵语等语言里面的许多成分。其主要特点有:
  (1) 汉语的独一无二的特色是:完全使用由象形文字演化而来的方块汉字;
  (2) 词语没有形态标记;  汉语是以字为基本单位,词之间没有明显的标记,词本身也没有明显的形态标志。所以中文信息处理的基础课题和特有的问题就是中文分词,分词本身的也有一定的错误率[2],这无疑降低了后续处理的实际效果。
  (3) 结构松散,比如:我上街买菜,看见一个人,穿着一件军大衣,打了卖菜的一巴掌, 脸都肿了。
  (4) 语法灵活,即缺乏狭义的形态,汉语句子中各个成分之间的关系一靠词序,二靠“意 合”,三靠虚词。
  (5) 语义灵活,一方面语法的灵活主要来源于语义的灵活;另一方面同一结构可以表达 不同的意思,同一意思可以用不同结构表达。
  另外.现有的自然语言处理理论和技术大多都是以英语为研究对象语言发展起来的.而汉语无论在语音、文字表示,还是在词汇,语法,语义及其语用等各个层面上都与之存在着很大的差异.这使得无法直接套用西方已成熟的理论和技术,汉语无疑是计算模型比较不发达的语言。这对从事中文信息处理的研究者来说是一个巨大的挑战和压力。
  北京理工大学大数据搜索与挖掘实验室张华平主任研发的NLPIR大数据语义智能分析技术是满足大数据挖掘对语法、词法和语义的综合应用。NLPIR大数据语义智能分析平台是根据中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。
  NLPIR大数据语义智能分析平台主要有精准采集、文档转化、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档去重、全文检索、编码转换等十余项功能模块,平台提供了客户端工具,云服务与二次开发接口等多种产品使用形式。各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,

九九信用 大象金服北京科技有限公司


联系人:张 先生 (CEO)
电 话:010-62648216
传 真:
手 机:
Q Q:
地 址:中国北京海淀区苏州街49-3号盈智大厦五层
邮 编:
网 址:http://jiuxinyong.qy6.com(加入收藏)