GBK,BIG5等字符集编码范围的具体说明

通过前面的 关于计算机中Endian(big-edian和little-endian)存储机制的由来、特点和区别一篇关于Unicode编码的UCS、UTF、BMP、BOM等概念的不错的文章 这两篇文章,读过之后应该对字符编码有一个比较深刻地了解,不过这个世界是有很多个说着不同语言的国家组成的,在追求国际化的同时,更多的是要求本土化,所以很多计算机软件系统应用的是本土的语言编码,而不是通用的UTF8等。各自的编码都有一定的范围,下面的文章对字符集和编码的概念,以及一些常用编码的范围进行了非常详细地说明,做相关方面工作的可要收藏了。
Continue reading “GBK,BIG5等字符集编码范围的具体说明”

将任意的非ASCII字符串进行HTML的URL编码

Java的HTML的URL字符编码转换为Java字符串的函数中,介绍了将HTML的字符串转换为Java中的字符串(String)的操作,相反的,我们也需要将一些字符串编码为HTML的形式,否则由某些字符组成的URL并不能将你带到期望的Page中去。下面是具体的代码,读懂它同样需要一定的计算机文字编码的功底,否则可能会看得一头雾水,纯粹使用的话那把下面URLUTF8Encoder类加到自己的工程中就可以正常使用了,:)
Continue reading “将任意的非ASCII字符串进行HTML的URL编码”

UTF8编码的中文词库下载

其实这里提供的中文词库是是Sucirst转发给我的,“做任何搜索或者其他应用的词库都不是一个人能完成的,原来在和一些朋友讨论的时候得到了附件中的资料,是用于Lucene的中文UTF-8词库,也许对你也能有些帮助……”,Minidx目前拥有非常庞大的词库而没有使用这一词库,不过非常感谢Sucirst,呵呵,正如Sucirst所说的,也许有人需要,所以在这里传上来,在http://cn.minidx.com/index.php?option=com_docman&task=cat_view&gid=17相关文档资料中)下载

利用Packer对JavaScript进行加密(压缩),解密(解压)

有人将Packer称为JavaScript的加密工具(混淆工具),也有人将其称为压缩工具。不管怎么说,Packer实质上是一个编码工具,不过经过它编码后可以被浏览器直接识别。使用也非常简单,在“Encoding”选项中,有四个项目可以选择:None:简单压缩,移除空格和注释,编码特殊字符
Numeric:所有的字符都被编码成数字
Normal :所有的字符都被编码成字母与数字符号构成的值。这是推荐的方式。
High ASCII:这种方式的压缩率较高。不推荐,会有兼容性

Continue reading “利用Packer对JavaScript进行加密(压缩),解密(解压)”

自动链接CGI和HTML的Location功能

※作者:丁志刚  转载请注明:Minidx全文检索http://blog.minidx.com/2007/11/02/44.html

何谓“自动链接CGI”

所谓自动链接CGI,就是调用这个CGI的时候,可以转向致任意URL的CGI。应该有其他正式的名称,不过找了一下没有找到。
这里用httpd Head中的变量「Location」来实现。当然,HTML中还有同样功能的「refresh」,但是这样的话一旦转向到新的URL,点击浏览器的返回键好像很难返回。所以还是推荐使用「Location」。
简单的几个例子看看CGI中如何实现的吧。 Continue reading “自动链接CGI和HTML的Location功能”