正在加载
请稍等

菜单

Home 码农菜园 算法编程
Home 码农菜园 算法编程
thumb19

中文分词一些思路的总结

算法编程 by   阅读量 4,853

中文分词是中文自然语言处理的第一步,也是最为核心的基础,分词的好坏和准确率直接影响到后续进行的其他处理和分析。常用的中文分词工具包括jieba分词、哈工大分词、Stanford分词等,但是除了会使用这些工具外,掌握相关的模型和思想更为重要。 1 mmseg 每次从一个完整的句子里,按照从左向右的顺序,识别出多种不同的3个…

阅读全文

21 2016-07
工具教程集合

常用工具的10mins集合

算法编程 by   阅读量 3,476

慢慢整理一些常用工具的10 Minutes入门教程,避免总是要找。 1 Pandas Pandas是一款用于数据清洗和预处理的python包,功能强大、好用。 http://pandas.pydata.org/pandas-docs/stable/10min.html 2 正则表达式 正则表达式的作用就不用多说了,脚本之家提供了一个30分钟的入门教程,不记得了可以来翻翻。 http://www.jb51.n…

阅读全文

24 2016-05
thumb7

Poj C++: 2000 Gold Coins

算法编程 by   阅读量 2,070

题目链接:http://poj.org/problem?id=2000 第一天给1个金币,接下来两天每天给2个金币,……,接下来N天每天给N个金币。输入为天数,输出到这一天一共给出的金币,根据题意计算即可。 #include <iostream> using namespace std; int main(){ int N; while(cin >> N &…

阅读全文

04 2015-11
thumb2

Poj C++: 1017 Packets

算法编程 by   阅读量 2,220

题目链接:http://poj.org/problem?id=1017 等高的包裹,长宽有1×1、2×2、3×3、4×4、5×5、6×6六种规格,使用同样高度、长宽为6×6的盒子打包,求所需盒子的最小数量。 对于6×6,一个包裹对应一个盒子;对于5×5,一个包裹对应一个盒子,剩余空间用1×1填充;对于4×4,一个包裹对应一个盒子,剩余空间优先用2×2填充,若不够则…

阅读全文

04 2015-11