tanglei's blog|唐磊的个人博客

python Libsvm实例讲解

前面说了windows命令行使用libsvm，现在需要用python去调用。一种方法是用python去进行系统调用windows的exe程序。另外一种方法就是通过libsvm的python接口去调用。这里说的是第二种方法，即通过调用libsvm的python接口。

2012-03-29 阅读全文评论

LibSVM入门实例

搜索SVM入门，收录排名最前的应该就是这几篇文章了：SVM 入门资料。具体什么原理貌似挺高深的，我也没怎么去看其中的原理。这里我说的LibSvm就是SVM其中一个解决方案的软件包。

2012-03-28 阅读全文评论

ubuntu自动挂载Windows分区以及对NTFS分区写和执行权限

这两天都用了下ubuntu写代码，记得以前好像不是那么容易使eclipse和windows下的workspace同步的，得需要一些配置才可以。现在把它写下来备份一下。

2012-03-25 阅读全文评论

删除ubuntu下多余的启动项

上次装了ubuntu(3个系统,windows xp,64-位win7,ubuntu)后好久没用了。今天突然跟google一样抽风进去看看，才发现，原来我的ubuntu下有那么多启动项。（又查了下图中的PAE//Physical Address Extension，效果是使32位系统用4g内存）

2012-03-25 阅读全文评论

拒收联通垃圾短信10010100,10010998等

还是用之前在深圳实习时候办的联通3g卡号。资费也还好，但苦逼的是整天来自10010100、10010998、10010755等等几个号码的垃圾短信。整天都推荐什么热点应用啊，热点咨询免费推荐啊，什么精彩视频推荐啊等等。谁稀罕啊……不采用什么dataming技术也就算了，也不让用户可定制下什么内容推荐等等，反正就是所有的信息都push给你，你要也得要，不要也得要。网上一搜，大家都一样的骂声。看看吧。。。

2012-03-23 阅读全文评论

GitHub搭建博客教程

上次不知道是谁问我有否考虑把博客迁移到github上，今天无意间又碰到了关于这个问题，于是就试了试。用github首先得安装SCM工具Git，还记得上一次接触Git，还是在上软件配置管理课的时候讲软件配置管理工具时遇到的，有关git的教程，这个讲得比较好Git中文教程。

2012-03-22 阅读全文评论

中南出牛人啊——22岁教授级别的本科生

中南大学数学科学与计算技术学院2008级本科生-刘嘉忆（本名刘路）,太牛X了，牛B得一发不可收拾啊。转载下http://hn.rednet.cn/c/2012/03/20/2555600.htm

2012-03-20 阅读全文评论

序列模式挖掘-AprioriAll算法详解(附python源码)

序列数据是非常重要的一种，在很多领域里面都频繁出现，例如：医药，商业，财政，客户行为，教育，安全等等。相关研究可以大致将序列数据的挖掘分为两类，发现序列模式和挖掘周期模式。Agrawal 等人^[1]首次提出了挖掘频繁序列模式，利用支持度的概念来发现频繁模式，AprioriALL算法也是一种基于Apriori性质的算法，采用逐层搜索的算法来挖掘模式。这篇论文本身还讲了另外基于Apriori的变种序列模式挖掘算法，AprioriSome和DynamicSome。下面将根据这篇论文和结合自己的理解来说明下AprioriAll算法。总体来说，自我感觉这个AprioriAll算法相当于利用了两次前面提到的Apriori算法，中间包含一个频繁项的映射Map。区别在于其支持度的定义有所区分：本文所述的序列模式的支持度是指支持某特定某次的custom数量，而前面提到的关联规则Apriori算法中的支持度是在项集的交易数量上（就是下面的baskets数量）。

2012-03-20 阅读全文评论