Next Entries »

SWIG发布1.3.33版本

Tuesday, December 25th, 2007

SWIG是个帮助使用C或者C++编写的软件能与其它各种高级编程语言进行嵌入联接的开发工具,通俗的说就是用来封装C/C++开发包的语言“粘合剂”。是发布在SourceForge上的开源软件,英文官方地址http://www.swig.org,国内Swig的用户目前还非常少。Minidx搜索引擎2.0版本因为已经将搜索引擎功能模块独立出来,为了能够被C#,Php,Perl,ruby等众多C/C++以外的语言调用,引入了Swig,同时为了方便中文程序员,两个月前开始开展了Swig中文计划,计划将其翻译为中文,不过TT同学身体原因进展缓慢……人多力量大,众人拾柴火焰高~~~欢迎有兴趣的朋友加入。

网络服务红黑板之飞豆网(Feedou),警惕自己的文章被飞豆“窃取”

Friday, December 21st, 2007

feedou.com,google一下“Feedou”,可以看到飞豆网给自己的介绍是“精选博客,精选视频,RSS在线阅读,小组讨论……”,这里的“精选”可是大有文章可做。先让我们用前面发布的《利用JavaScript实现隐藏推介链接(任意外部链接)》来google一下,复制“利用JavaScript实现隐藏推介链接(任意外部链接)”到google,然后“google搜索”,可以看到下面图片的结果:

浅谈图片搜索引擎的实现

Wednesday, December 19th, 2007

leo在他的《博客营销》中说不清楚全文检索博客的领域是什么,呵呵,整个Minidx.com其实都只不过是一个自己随便涂鸦的地方,倒还真没考虑过什么领域,更加没有考虑过自己的博客应该专注于哪一方面……如果非要划分,大概http://minidx.com勉强还能算得上一点“领域”吧。呵呵,无所谓了,随便涂鸦吧……OODA SAN说他在研究图片搜索引擎,所以就和他探讨了一些图片搜索的实现的问题,这里也记录一下自己的思路,OODA是这方面的专家,而我只能算是“新手上路”,下面说的有什么不对的还望包涵指出,:)
简单的说,图片搜索是搜索引擎针对网络上的图片所提供的服务。包括Google, Yahoo!, Ask, MSN和AOL以及国内的Baidu这些大型搜索引擎都提供有图片搜索,还有号称图片搜索专用的picsearch,但它们并非真正地对文件中的图像进行搜索,而是对附加在图片中的文字(比如img标签的alt属性)以及文件名进行搜索,也就是通常意义上的关键字索引,所以实质上用的还是基于文本内容的检索,因此也只能搜索数量较少的文件,IBM 公司的研究人员也曾经开发一种名为Marvel的可以实现音像资料搜索的搜索引擎,它能够获取目前在互联网上很难获取的音像资料,只是没有关注过目前的进展。目前微软也正在研究可以通过头像来查找某人的信息这样的搜索引擎,微软将之成为Photo2Search,“a picture is worth a thousand words”,真正意义上的多媒体搜索引擎的实现,带给人们的影响,将可以与蒸汽机,电脑相媲美……

全文检索博客的Alexa排名继续迅速攀升

Monday, December 17th, 2007

在四天前发布《提前知道下次更新时你的PR》的时候全文检索博客的Alexa排名还是964866,今天又再一次被更新,串到829971了。不过80%的来访者都是通过搜索引擎过来的,这些用户目的性很强,跑过来找到了自己需要的,解决了自己的问题,啪啦一下就关了,什么也没留下……不过至少还是为Alexa的排名作了一点贡献~不知道全文检索博客是否可以继续保持这样的攀升势头哈

Minidx.RC1.1的中日英版本下载数都已经超过1K了

Tuesday, December 11th, 2007

自从11月20日发布了Minidx.RC1.1.Installer.exe,因为情绪的问题就没碰过Minidx了。今天想起来到http://minidx.com看看,发现http://minidx.com和http://cn.minidx.com 下的Minidx.RC1.1.Installer.exe版本下载量分别为1341和1282,http://jp.minidx.com 下也有127,这是因为Minidx已经收录与Vector(这里),而鬼子们习惯于在这里下载,加起来也已经超过1K了~Minidx全文检索引擎2.0开发完成已经有一段时间了,一直懒得集成到Minidx系统中,呵呵,看来还是要整顿整顿心情,继续~~~

开博1个月不到,照样可以申请到text-link-ads

Saturday, November 24th, 2007

Text Link Ads是世界上最大的出售文字付费链接的平台。一般使用过的人写申请体会的时候,通常都会加上“根据经验,PR 值为2 或者以上的博客申请的话,一般都比较容易通过”云云,不过我的全文检索博客开了1个月还不到,却照样审核通过并且顺利的将广告位摆上了Text Link Ads的货架。

靠搜索引擎带来流量的网站的大忌

Monday, November 19th, 2007

在《文章中的关键字带来的意外点击》曾经提到过因为删除了一个该域名下的论坛,导致原先被搜索引擎收录的3000多页面出现404错误,并且忍痛抛弃了原先有PR的地址起用了全文检索博客的子域名……之前的表现是google,百度对这个域名的收录都变得非常小心。

文章中的关键字带来的意外点击

Wednesday, November 14th, 2007

这个blog里放了google-analyics的脚本,一直都不怎么留意,今天打开看了一下,居然发现最近每天都有几十个通过关键字PFSVODDATA过来的点击,并且一直在增长,自己试着google和baidu了一下,原来是前面写过一片《关于PFSVODDATA文件或者文件夹》,其中在两个搜索引擎中关键字PFSVODDATA分别google中排第1,百度中排第7。建议不凡将一些比较好的关键字设为Tag,也许会有意想不到的效果。

网络爬虫如何抓取web2.0 Ajax页面

Wednesday, October 31st, 2007

伴随着AJAX/Web2.0的流行,如何抓取Ajax页面成了搜索引擎急需解决的一个问题,因为Ajax颠覆了传统的纯HTTP请求/响应协议机制,如果搜索引擎依旧采用“爬”的机制,是无法抓取到AJAX页面的有效数据的。

Next Entries »

Search Posts