<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>中文Flex例子 &#187; VC.net</title>
	<atom:link href="http://blog.minidx.com/tag/vcnet/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.minidx.com</link>
	<description>中文Adobe Flex例子,Flex实例教程,RIA资源,全文检索技术,算法和数据结构</description>
	<lastBuildDate>Thu, 31 Mar 2011 03:22:33 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>利用Minidx Extract-Text Com组件从doc,Xls,Pdf&#8230;&#8230;等读取文本内容VC Demo</title>
		<link>http://blog.minidx.com/2008/01/10/373.html</link>
		<comments>http://blog.minidx.com/2008/01/10/373.html#comments</comments>
		<pubDate>Wed, 09 Jan 2008 16:47:46 +0000</pubDate>
		<dc:creator>Minidxer</dc:creator>
				<category><![CDATA[Minidx相关]]></category>
		<category><![CDATA[C++]]></category>
		<category><![CDATA[Com组件]]></category>
		<category><![CDATA[doc]]></category>
		<category><![CDATA[Extract Text]]></category>
		<category><![CDATA[IFilter]]></category>
		<category><![CDATA[indexing service]]></category>
		<category><![CDATA[Minidx]]></category>
		<category><![CDATA[pdf]]></category>
		<category><![CDATA[VC.net]]></category>
		<category><![CDATA[xls]]></category>
		<category><![CDATA[搜索引擎]]></category>

		<guid isPermaLink="false">http://blog.minidx.com/2008/01/10/373.html</guid>
		<description><![CDATA[ 《利用Minidx Extract-Text Com组件从Word,Xls,Pdf……等文件中读取文本内容》中具体的说明了Vb.Net中调用Minidx Extract-Text Com组件对Word,Excel,Pdf等各种文件进行文本抽取的用法。结果很多人都发邮件过来询问C++中如何调用（一些邮件会被Gmail判断为垃圾邮件……强烈建议有问题直接在本文后面留言或在这里提问，这样也可以减轻一点我的工作量，不必挨个回复）。抽空作了一个VC的Demo，工程用VS2005创建的，Unicode版本。下面对Demo稍微做一些说明，一些基本原理直接参照《利用Minidx Extract-Text Com组件从Word,Xls,Pdf……等文件中读取文本内容》就可以了，这里不再重复。








●Demo(VC++)源代码从这里下载(相关文档资料分类中的“Doc,Xls,Pdf等文件中抽取文本的Com组件及Demo(VC++)源代码”)
●执行Demo
①、双击run.bat执行，注册Com组件
 
②、双击demo_vc\release或者demo_vc\debug目录下的demo_vc.exe
 
③、点“File”，选择对象文件（ex: 从demo_vc\test-data中选择）
 
④、选中文件，查看抽取文本结果。（下面分别是中日英Word的抽取结果）
  
 
注意:抽取文本对象文件需要有读写权限，正在编辑中的文件抽取文本时可能会出错。
●实际调用方法：
①、复制下面三个文件到自己工程的相应目录下
・ExtractText.dll・ExtractText.h・ExtractText_i.c
②、在需要的文件中用下面的代码引入
#include &#8220;ExtractText.h&#8221;#include &#8220;ExtractText_i.c&#8221;
③、抽取文本部分代码：

   1:  ITextExtractor *te = NULL;
   2:  // Declare and HRESULT and a pointer to the Simple_ATL interface
   3:  HRESULT           [...]]]></description>
		<wfw:commentRss>http://blog.minidx.com/2008/01/10/373.html/feed</wfw:commentRss>
		<slash:comments>80</slash:comments>
		</item>
	</channel>
</rss>

<!-- Performance optimized by W3 Total Cache. Learn more: http://www.w3-edge.com/wordpress-plugins/

Minified using disk
Page Caching using disk (enhanced)
Database Caching 2/14 queries in 0.328 seconds using disk
Object Caching 163/345 objects using disk

Served from: blog.minidx.com @ 2012-02-09 10:44:09 -->
