<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>中文Flex例子 &#187; baidu</title>
	<atom:link href="http://blog.minidx.com/tag/baidu/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.minidx.com</link>
	<description>中文Adobe Flex例子,Flex实例教程,RIA资源,全文检索技术,算法和数据结构</description>
	<lastBuildDate>Thu, 31 Mar 2011 03:22:33 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Google,丢弃中文市场又有何妨？</title>
		<link>http://blog.minidx.com/2008/04/27/779.html</link>
		<comments>http://blog.minidx.com/2008/04/27/779.html#comments</comments>
		<pubDate>Sun, 27 Apr 2008 13:57:39 +0000</pubDate>
		<dc:creator>Minidxer</dc:creator>
				<category><![CDATA[随便写写]]></category>
		<category><![CDATA[baidu]]></category>
		<category><![CDATA[eBay]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[淘宝]]></category>

		<guid isPermaLink="false">http://blog.minidx.com/2008/04/27/779.html</guid>
		<description><![CDATA[自从互联网结束了门户时代，进入搜索引擎年代之后，在中国这片领土中，人们便不断的拿着Google于Baidu当作两个对手，不断的讨论着百度占据了多少市场份额，而Google的份额又少了多少，为此津津乐道，乐此不彼。不管从资金、技术、人才还是品牌，Baidu其实连给Google提鞋的资格都没有&#8211;哪怕Baidu在中国市场称雄称霸，那又如何？在关于百度(NASDAQ:BIDU)获得了“中国企业走出去”国家贡献奖的很有意思的一篇文章中就说过，Baidu的成功，也仅仅只能是在中国市场的成功。 








Baidu的发家是从哪里开始的？中国的网民们在下载着靠百度搜索出来的“免费MP3”的时候，心里都应该清楚吧。而这，并不是技术问题，而是政策问题，同时也是一个道德问题。
马云，这个靠着一张嘴，把一个要技术没技术，要资金没资金的小作坊，创建成为今日的阿里巴巴，原因是什么？大家一定还记得eBay收费的开始，也就是淘宝发家的开始，免费！
官方高姿态的宣布中国网民跻身世界第一，2亿多的网民，的确是一个潘大的数字。不过从Baidu与阿里巴巴的今日的成功（当然还有腾讯），我们都可以看到他们的一个共同点，他们面向低端市场。的确，中国网民数字是庞大，但是却基本上没有什么消费能力。美国的1000IP可以有10美元的价值，而中国的呢？1块RMB都不到。那个2亿，充其量也只不过面子好看的工程而已。
中国市场不断的发展，生气勃勃，中国市场也的确是一块非常重要的市场，不过目前占有这块市场并不等于以后也就占据了这块市场，如果那些依靠政策，依靠成为市委书记、省委书记们的座上宾而换来的成功的企业，不好好的思考着如何让自己的产品更加的具有竞争力，那么，当中国人民整体素质提升的时候，中国市场不再是低端市场的时候，也就是中国用户开始丢弃你们的时候了。
今日之Google，你又何必要苦苦守着犹如鸡肋般毫无价值可言的大陆市场呢？
你可能还对下列文章感兴趣:浅谈图片搜索引擎的实现文章中的关键字带来的意外点击Ntt.CC从Google沙盒(Sandbox)出来了全文检索博客也被Google惩罚了？世界各地主流，非主流搜索引擎以及功能性搜索引擎一览]]></description>
		<wfw:commentRss>http://blog.minidx.com/2008/04/27/779.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>浅谈图片搜索引擎的实现</title>
		<link>http://blog.minidx.com/2007/12/19/265.html</link>
		<comments>http://blog.minidx.com/2007/12/19/265.html#comments</comments>
		<pubDate>Wed, 19 Dec 2007 15:10:41 +0000</pubDate>
		<dc:creator>Minidxer</dc:creator>
				<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[baidu]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[msn]]></category>
		<category><![CDATA[picsearch]]></category>
		<category><![CDATA[Yahoo]]></category>
		<category><![CDATA[关键字索引]]></category>
		<category><![CDATA[图片搜索]]></category>
		<category><![CDATA[图片搜索引擎]]></category>
		<category><![CDATA[多媒体]]></category>
		<category><![CDATA[音像资料搜索]]></category>

		<guid isPermaLink="false">http://blog.minidx.com/2007/12/19/265.html</guid>
		<description><![CDATA[ leo在他的《博客营销》中说不清楚全文检索博客的领域是什么,呵呵，整个Minidx.com其实都只不过是一个自己随便涂鸦的地方，倒还真没考虑过什么领域，更加没有考虑过自己的博客应该专注于哪一方面……如果非要划分，大概http://minidx.com勉强还能算得上一点“领域”吧。呵呵，无所谓了，随便涂鸦吧……OODA SAN说他在研究图片搜索引擎，所以就和他探讨了一些图片搜索的实现的问题，这里也记录一下自己的思路，OODA是这方面的专家，而我只能算是“新手上路”，下面说的有什么不对的还望包涵指出，：）
简单的说，图片搜索是搜索引擎针对网络上的图片所提供的服务。包括Google, Yahoo!, Ask, MSN和AOL以及国内的Baidu这些大型搜索引擎都提供有图片搜索，还有号称图片搜索专用的picsearch，但它们并非真正地对文件中的图像进行搜索，而是对附加在图片中的文字（比如img标签的alt属性）以及文件名进行搜索，也就是通常意义上的关键字索引，所以实质上用的还是基于文本内容的检索，因此也只能搜索数量较少的文件，IBM 公司的研究人员也曾经开发一种名为Marvel的可以实现音像资料搜索的搜索引擎，它能够获取目前在互联网上很难获取的音像资料，只是没有关注过目前的进展。目前微软也正在研究可以通过头像来查找某人的信息这样的搜索引擎，微软将之成为Photo2Search，“a picture is worth a thousand words”，真正意义上的多媒体搜索引擎的实现，带给人们的影响，将可以与蒸汽机，电脑相媲美……








也许有人不明白图片搜索能给我们带来什么
当你看到了一种植物，但是不知道叫什么名字及其相关信息……
当你有一张某酒店的照片但是不知道这一酒店的信息……
当你看到某张照片上美丽的风光是你很向往的但是却偏偏没有相关的介绍……
当摄像头拍下了某“坏蛋”的面孔但是却没有人认识这个人……
当你看到上面的美女却压根找不到一点相关的信息……
对于这些问题，用google的图片搜索，可以吗？baidu能够告诉你答案吗？虽然Google 图片搜索的时候，在搜索结果页面的网址后面加入&#38;imgtype=face这个参数，即可将图片类型限定为人脸，但是很显然，这样的技术并不能帮助我们解决上面那些问题。而这些需求却是一直都存在的，那么能够帮我们解决这些问题的真正意义上的多媒体（注：不仅仅是图片，其实包括声音文件，影像文件等）搜索引擎应该如何去实现？下面是我所能想到的几种方案
●统一多媒体文件的存储格式。不管是BMP,JPG,GIF……还是MP3,RM，AVI……在生成这样的文件的时候都必须添加必要的文本信息，以特有的结构体存储。这样输入一张图片进行查询的时候，搜索引擎需要的只不过是去解析这一图片的信息，抽取关键字进行查询就可以了。但是，这个世界，是没有想象中那么理想的，否则也不会存在中文，英文，法语，日语……也不会有东方神仙与西方大神了……要制定这样的标准，不是google，yahoo这样的公司可以做到的，也不是美国，中国可以做到的。所以这只能说是镜中水月……无法实现的，就当时我心中的一个美丽的肥皂泡吧。
●提取事物特有的信息对搜索引擎进行训练。研究过搜索引擎的朋友们应该知道，中文分词不同于英文分词，英文可以按照空格来划分单词，但是中文却是连成一片的。所以为了提高中文分词的准确率，通常会准备大量的语料对其进行训练。而有用3D Max之类工具建模经验的朋友们应该知道，在构造某一事物的时候，最先需要对这一事物的特征进行分析，确定好坐标，然后进行构造。不管后面用什么场景来渲染，所建的模都是一样的。比如茶壶，有自己特有的曲线，还有人的脸，一些坐标是相对固定的，不管这个人是年轻，还是变老，这些特征都是无法改变的。所以如果可以采集到足够的“语料”，对搜索引擎进行训练，那么随着训练的进行，搜索引擎认识的东西也就不断的增加，能够提供给我们的信息帮助我们解决的问题也就越来越多。这个和早期的文本搜索引擎应该是一样的。
●对多媒体文件的内容进行分析索引。这种方式是OODA告诉我他正在研究的，大体思路是这样的，比如BMP位图，实际上是以比特流，也就是位的方式存储的，某一类物质，比如说rose，实际上内部的很多比特流都是有一定特征的，这个和通常意义上的文本分类很像，先根据大的特征进行大的分类，然后范围逐步缩小，最终确定目标。不过这个所需要的知识面太过于广泛，至少我无法分析出两张rose图片的相似比特流，希望OODA能够带来一个惊喜吧。
各大搜索引擎公司目前都在投入大量的资金研究这样的搜索引擎，我的Minidx是基于文本的搜索引擎，而我本身对图片之类的比较“白痴”，所以也只能写这么些废话，来贻笑大方了。：）
你可能还对下列文章感兴趣:Google,丢弃中文市场又有何妨？文章中的关键字带来的意外点击精彩教程:Flex中如何利用Papervision3D制作地球仪的教程Ntt.CC从Google沙盒(Sandbox)出来了全文检索博客也被Google惩罚了？]]></description>
		<wfw:commentRss>http://blog.minidx.com/2007/12/19/265.html/feed</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>申请百度联盟居然没通过！</title>
		<link>http://blog.minidx.com/2007/11/25/167.html</link>
		<comments>http://blog.minidx.com/2007/11/25/167.html#comments</comments>
		<pubDate>Sun, 25 Nov 2007 13:14:42 +0000</pubDate>
		<dc:creator>Minidxer</dc:creator>
				<category><![CDATA[随便写写]]></category>
		<category><![CDATA[]]></category>
		<category><![CDATA[baidu]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google Adsense]]></category>
		<category><![CDATA[爬虫]]></category>
		<category><![CDATA[申请]]></category>
		<category><![CDATA[百度联盟]]></category>

		<guid isPermaLink="false">http://blog.minidx.com/2007/11/25/167.html</guid>
		<description><![CDATA[偶然间知道除了 原来还有 ，然后又是偶然间知道除了Google Adsense原来还有百度联盟，于是乎试着用http://minidx.com提交了申请，想看看百度联盟和Google Adsense之间有什么区别，不过不愧为百度，百度爬虫貌似已经把我的想法抓了过去，很快百度给我发来了下面的Mail :








minidxer，您好：
很抱歉！您的网站尚不符合百度网站搜索的要求，暂时不能通过审核。
未通过原因：
您的网站尚未建设完善，请在网站建设完善后再提交申请。
如果您还有疑问，请发邮件至 union1@baidu.com
谢谢您的合作。
更多常见业务问题说明
百度联盟发展部敬上
百度联盟 帮助合作伙伴在各自领域取得成功
呵呵，没办法，人家把原因都写的清清楚楚地。不过倒是想知道百度用来判断网站是否建设完善的标准是什么，是人工的还是机器人来处理的。因为这封mail是在27分钟以前收到的，也就是周日晚上21：36，北京时间20：36发送的，如果是人工的话，那我倒是真的要重新审视百度这个公司了。
你可能还对下列文章感兴趣:Google,丢弃中文市场又有何妨？浅谈图片搜索引擎的实现开博1个月不到，照样可以申请到text-link-ads文章中的关键字带来的意外点击百度，不懂中文的是你！]]></description>
		<wfw:commentRss>http://blog.minidx.com/2007/11/25/167.html/feed</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>文章中的关键字带来的意外点击</title>
		<link>http://blog.minidx.com/2007/11/14/88.html</link>
		<comments>http://blog.minidx.com/2007/11/14/88.html#comments</comments>
		<pubDate>Wed, 14 Nov 2007 16:29:25 +0000</pubDate>
		<dc:creator>Minidxer</dc:creator>
				<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[baidu]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[google-analyics]]></category>
		<category><![CDATA[PFSVODDATA]]></category>
		<category><![CDATA[PR值]]></category>
		<category><![CDATA[WordPress]]></category>
		<category><![CDATA[关键字]]></category>
		<category><![CDATA[百度]]></category>

		<guid isPermaLink="false">http://blog.minidx.com/2007/11/14/88.html</guid>
		<description><![CDATA[这个blog里放了google-analyics的脚本，一直都不怎么留意，今天打开看了一下，居然发现最近每天都有几十个通过关键字PFSVODDATA过来的点击，并且一直在增长，自己试着google和baidu了一下，原来是前面写过一片《关于PFSVODDATA文件或者文件夹》，其中在两个搜索引擎中关键字PFSVODDATA分别google中排第1，百度中排第7。建议不凡将一些比较好的关键字设为Tag，也许会有意想不到的效果。







另外这个blog开设的时间非常短并且换过子域名，之前用过其他的系统，发现搜索引擎对现在的WordPress特别钟爱，现在索引更新速度比原先的有PR值的还快，收录的页面也更多，这不得不令我重新思考搜索引擎对信息筛选的处理方式。前段时间把minidx.com下的一个论坛删除了，导致搜索引擎中3000多页面出现404错误，现在百度对这个域名的收录都变得非常小心，可见改变URL，大面积删除被收录的页面对于靠搜索引擎带来流量的网站来说简直就是噩梦~
你可能还对下列文章感兴趣:全文检索博客也被Google惩罚了？靠搜索引擎带来流量的网站的大忌Google,丢弃中文市场又有何妨？浅谈图片搜索引擎的实现百度，不懂中文的是你！]]></description>
		<wfw:commentRss>http://blog.minidx.com/2007/11/14/88.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>百度，不懂中文的是你！</title>
		<link>http://blog.minidx.com/2007/11/12/79.html</link>
		<comments>http://blog.minidx.com/2007/11/12/79.html#comments</comments>
		<pubDate>Mon, 12 Nov 2007 16:17:35 +0000</pubDate>
		<dc:creator>Minidxer</dc:creator>
				<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[baidu]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[google fans]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[百度]]></category>

		<guid isPermaLink="false">http://blog.minidx.com/2007/11/12/79.html</guid>
		<description><![CDATA[首先申明：作者并非google fans也没有对百度有任何的成见。仅仅是就事论事。记得看到过百度对google中国的评价：google不懂中文。
抛开各种因素不谈，用google和baidu对自己的博客site了一下，发现tag中的汉字，“不懂中文”的google可以显示得很正常，很可惜我们“懂中文”的百度显示的却是一堆乱码。难道懂中文的百度只知道中文有GB2312,GBK，而不知道中文可以是UTF8吗？








※注意图中绿色链接部分的汉字


你可能还对下列文章感兴趣:文章中的关键字带来的意外点击比较郁闷的几件事情&#8211;单篇文章的PR居然和首页一样高&#8230;&#8230;Google,丢弃中文市场又有何妨？Google的创意，百度的产品&#8211;百度工具栏浅谈图片搜索引擎的实现]]></description>
		<wfw:commentRss>http://blog.minidx.com/2007/11/12/79.html/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
	</channel>
</rss>

<!-- Performance optimized by W3 Total Cache. Learn more: http://www.w3-edge.com/wordpress-plugins/

Minified using disk
Page Caching using disk (enhanced)
Database Caching 2/25 queries in 0.708 seconds using disk
Object Caching 449/856 objects using disk

Served from: blog.minidx.com @ 2012-02-09 10:27:49 -->
