<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: 利用Minidx Extract-Text Com组件从Word,Xls,Pdf&#8230;&#8230;等文件中读取文本内容</title>
	<atom:link href="http://blog.minidx.com/2007/12/31/334.html/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.minidx.com/2007/12/31/334.html</link>
	<description>中文Adobe Flex例子,Flex实例教程,RIA资源,全文检索技术,算法和数据结构</description>
	<lastBuildDate>Thu, 18 Mar 2010 13:20:59 +0800</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: Minidxer</title>
		<link>http://blog.minidx.com/2007/12/31/334.html/comment-page-1#comment-13516</link>
		<dc:creator>Minidxer</dc:creator>
		<pubDate>Mon, 12 Oct 2009 12:54:02 +0000</pubDate>
		<guid isPermaLink="false">http://blog.minidx.com/2007/12/31/334.html#comment-13516</guid>
		<description>可以从 http://blog.minidx.com/2008/01/10/373.html 下载。</description>
		<content:encoded><![CDATA[<p>可以从 <a href="http://blog.minidx.com/2008/01/10/373.html" rel="nofollow">http://blog.minidx.com/2008/01/10/373.html</a> 下载。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: tyq</title>
		<link>http://blog.minidx.com/2007/12/31/334.html/comment-page-1#comment-13514</link>
		<dc:creator>tyq</dc:creator>
		<pubDate>Mon, 12 Oct 2009 09:07:08 +0000</pubDate>
		<guid isPermaLink="false">http://blog.minidx.com/2007/12/31/334.html#comment-13514</guid>
		<description>我mail:tangyq169@sohu.com</description>
		<content:encoded><![CDATA[<p>我mail:tangyq169@sohu.com</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: tyq</title>
		<link>http://blog.minidx.com/2007/12/31/334.html/comment-page-1#comment-13513</link>
		<dc:creator>tyq</dc:creator>
		<pubDate>Mon, 12 Oct 2009 09:06:28 +0000</pubDate>
		<guid isPermaLink="false">http://blog.minidx.com/2007/12/31/334.html#comment-13513</guid>
		<description>我想要一个VC Demo能给我发一个吗，谢谢</description>
		<content:encoded><![CDATA[<p>我想要一个VC Demo能给我发一个吗，谢谢</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Minidxer</title>
		<link>http://blog.minidx.com/2007/12/31/334.html/comment-page-1#comment-12441</link>
		<dc:creator>Minidxer</dc:creator>
		<pubDate>Sat, 08 Aug 2009 00:20:54 +0000</pubDate>
		<guid isPermaLink="false">http://blog.minidx.com/2007/12/31/334.html#comment-12441</guid>
		<description>@pang 
增加这样的接口可以实现，不过由于个人时间等原因这个项目基本上处于停滞状态，实在抱歉。</description>
		<content:encoded><![CDATA[<p>@pang<br />
增加这样的接口可以实现，不过由于个人时间等原因这个项目基本上处于停滞状态，实在抱歉。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: pang</title>
		<link>http://blog.minidx.com/2007/12/31/334.html/comment-page-1#comment-12405</link>
		<dc:creator>pang</dc:creator>
		<pubDate>Thu, 06 Aug 2009 03:40:15 +0000</pubDate>
		<guid isPermaLink="false">http://blog.minidx.com/2007/12/31/334.html#comment-12405</guid>
		<description>关于从文件读取文本的问题咨询：
目前提取文档的接口如下：
ITextExtractor *te = NULL;
HRESULT Cohr = CoCreateInstance(CLSID_TextExtractor, NULL, CLSCTX_INPROC_SERVER,IID_ITextExtractor, (void**) &amp;te);
if(SUCCEEDED(Cohr)&amp;&amp;te) 
{
	te-&gt;ExtractText(fileName, 0,&amp;bstr);	
	te-&gt;Release();	
}
在使用接口ExtractText析取文本的时候，文件的类型是通过fileName确定的，但我希望ExtractText增加一个参数：filetype（文件类型），这样我可以用自己指定的格式读取文本，例如：
我有一个text文件，文件名是a.text，但希望使用doc的方式来读取文件，目前我采用的措施是先重命名文件为a.doc，析取文本后再将文件改回a.text，操作比较麻烦，而如果接口添加关于文件类型的参数后，我就不用重命名了。
不知道您能否提供这样的接口，我目前的一个项目正需要这样的接口，如能提供将不胜感激！！！</description>
		<content:encoded><![CDATA[<p>关于从文件读取文本的问题咨询：<br />
目前提取文档的接口如下：<br />
ITextExtractor *te = NULL;<br />
HRESULT Cohr = CoCreateInstance(CLSID_TextExtractor, NULL, CLSCTX_INPROC_SERVER,IID_ITextExtractor, (void**) &amp;te);<br />
if(SUCCEEDED(Cohr)&amp;&amp;te)<br />
{<br />
	te-&gt;ExtractText(fileName, 0,&amp;bstr);<br />
	te-&gt;Release();<br />
}<br />
在使用接口ExtractText析取文本的时候，文件的类型是通过fileName确定的，但我希望ExtractText增加一个参数：filetype（文件类型），这样我可以用自己指定的格式读取文本，例如：<br />
我有一个text文件，文件名是a.text，但希望使用doc的方式来读取文件，目前我采用的措施是先重命名文件为a.doc，析取文本后再将文件改回a.text，操作比较麻烦，而如果接口添加关于文件类型的参数后，我就不用重命名了。<br />
不知道您能否提供这样的接口，我目前的一个项目正需要这样的接口，如能提供将不胜感激！！！</p>
]]></content:encoded>
	</item>
</channel>
</rss>
