正在加载
请稍等

菜单

Home 项目page 4
Home 项目page 4
词库生成

基于凝聚度和自由度的非监督词库生成

by   阅读量 5,381

中文分词是中文文本自然语言处理的第一步,然而分词效果的好坏取决于所使用的语料词库和分词模型。主流的分词模型比较固定,参见中文分词一些思路的总结,而好的语料词库往往很难获得,并且大多需要人工标注。这里介绍一种基于词频、凝聚度和自由度的非监督词库生成方法,什么是非监督呢?输入一大段文本,通过定义好的模…

阅读全文

14 2016-08
星战知识图谱circle

星战系列电影知识图谱探索

by   阅读量 4,431

作为星战迷,看了N遍星球大战,你能说出《星球大战》系列的7部电影中出现了多少个角色、多少个种族、多少艘飞船、多少架战车吗?不要掰着手指头数了,看完这篇你能获知想要的一切~ 知识图谱全景展现星球大战 没有看过星战的同学,一张图就可以告诉你,这7部电影里,共出现了87名角色、21颗星球、37艘飞船、39架战车、37个…

阅读全文

09 2016-08
魔镜杯风云大奖

拍拍贷魔镜杯数据产品大赛金奖

by   阅读量 6,488

1 项目背景 拍拍贷是我国知名的P2P平台,以极其前瞻的视角举办了魔镜杯金融数据应用大赛,共设风控算法大赛、数据产品开发大赛、金融产品创新大赛三个子赛题。我参加的是数据产品开发大赛,在经过了将近两个月的奋斗之后,拿到了数据产品开发大赛的金奖,以及三个赛题各自的金奖中再次筛选出的风云大奖。数据产品开发大赛…

阅读全文

15 2016-06
首页

看看我属于哪种月饼

by   阅读量 3,691

1 项目背景 不应该说是一个项目,顶多算是自己的第一次微信h5页面尝试。以前经常在微信上看到各种h5页面,以测试为主题的居多。当时是中秋节,也想趁着过年赶紧做一个微信h5页面,实际感受下微信的传播效应,万一火了呢? 既然是中秋节,那就做一个“看看我属于哪种月饼”的测试页面吧,流程很简单,用户输入自己的姓名,提…

阅读全文

15 2016-01
维基百科

基于维基百科的中文词语相关度计算

by   阅读量 5,022

1 背景介绍 传统的文档相关度一般是基于特征提取所得的向量相关度,而词语相关度也经常在不少实际应用中涉及到。对于要比较的两个词语,相对于仅仅在“相等”和“不等”这两者间做一个选择,更好的方法应当是对相关度的大小作一个数值性刻画。如果“1”对应完全相关,“0”对应完全不相关(当然也可以将相关度最小值设为-1),那么…

阅读全文

15 2016-01