2005-3-12
想法和技术在与同竞争对手的面前都不是关键,关键的东西是实践。关于新闻分类聚类零零碎碎的做了快3,4个月了,一直没有没有精力来全力以赴的去完成这个。Google的中文新闻刚出来的时候不但分类有误差,而且关于新闻内容的摘要常常也是文不对题,可是就是在这样的磕磕绊绊中google的新闻做的越来越好,我这边的一些想法正在着手实现的时候,Google新闻总是非常意料之中的做到了。 [搜索技术] 计算机文本分类和模糊聚类 #
分类和聚类为什么出错?关键在于一个模糊上。因为机器不像人拥有极强的认知能力,利用机器进行新闻分类和聚类所采用的做法通常都是我们说的模式识别,或者更精确的说其实是一种模糊特征识别。 [搜索技术] 简并算法:文本自动聚类算法的实现 #
基于文本的信息自动聚类的算法很多,我以前介绍过一些,比较流行的算法有我以前提到的KNN和SVM,在过去的一段时间里,空闲的时间基本上都用来研究能否快速的实现自动聚类。上周终于完成了文本自动聚类的兼并算法,能够相对快速的实现文本信息的自动聚类。下面就介绍一下信息自动聚类的实现,希望能够帮助大家了结google news 的新闻如何进行自动聚类工作。 [IT业界] Groove Virtual Office 成为MS Office的一员 #
Groove Networks的创始人Ray Ozzie曾经创造了Lotus Notes,那个曾经被誉为最成功的办公系统。而Groove Networks从1997年创立开始,就主要致力于Virtual Office等协同办公软件和解决方案,在2001 Groove Networks接受了微软5100万美元的投资,可以看出MS在观望Groove的模式和协同办公这个领域已久。此次收购后,Ray Ozzie会成为微软公司的首席技术官,直接向Bill Gates负责,那么现在开始,你感觉到这场震撼了吗? [365Key报道] 365key.com 为什么不能做的更好? #
还要说说的就是 365key 的搜索,简直是弱。能不能增强一点,做一个所有已收录网页内容的搜索?你不是在本地都有境象吗?第一步都做了,为什么不往前再走一点?还有客服——就只有一个邮箱地址,用户之间没有办法交流。还有导出和导入,万一你 365key 哪一天被 XXXX 查封了,你每天服务器备份又有什么用? [互联网] Blog的弱宣传 #
弱宣传并不意味着效果就弱,相反,弱宣传经常可以获得比其他宣传更好的效果。如果我们把类似于在QQ上直接对别人宣传的行为称做“手状宣传”(从手臂延伸分叉到五个手指,到了指甲上就分不出去了——通常情况下别人不会为你做二次宣传),那么弱宣传就是“网状宣传”(可以无限分叉,比如你把自己的blog保存网摘到365key上,被另一个人收录,于是就变成了两条传播途径,然后变成三四五,如此循环……)。当然,这也缘于弱宣传的另一个优势——人性化。弱宣传没有压迫性,让人不觉得你是在宣传(而更像是在传播知识^_^),比较容易被人接受、产生好感。 [软件] SuprNova研发eXeem,取代BT #
根据Neowin报道,因为受到美国电影协会MPAA等等版权组织打击BT盗版的影响,著名的BT资源网站SuprNova自行关闭网站上的一切BT资源。不过,SuprNova今天在网站上表示,将和匿名的开发者联合研发名为“eXeem”的软件,来取代目前广泛使用的Bit Torrent软件。SuprNova表示,eXeem是结合kazaa和BT两者优势的新的文件共享软件。eXeem目前处于beta测试阶段, eXeem将在未来几周进入公开Beta测试。eXeem有可能添加广告,来支持开发费用。eXeem重要的优势是,可以让使用者来对提供的下载文件进行打分和评论,这样就有效避免虚假文件、低质量文件在共享互联网上的泛滥。另外,有消息指出,eXeem因为没有Hub,可以在一定程度上避免版权组织的起诉和打击。 365Key-天天网摘自动生成
更多新闻,请访问我的365Key(RSS),你可以通过365Key订阅。