当前位置:首页> PHP教程> 经典文章
关键字
文章内容
在 PHP 中用描点法“绘制”中文
 
 
修改时间:[2008/10/31 07:00]    阅读次数:[1022]    发表者:[起缘]
 


前言:

现在,越来越多的人喜欢上网了,越来越多的人拥有了自己的个人主页。随着各种自动化软件工具的出现,制作网页越来越简单。但,由于特效随处可得,创新的东西,越来越少。说不定,哪天,你会发现某个网站上的计数器和自己的一模一样。网页越做越老练。网页上的东西,也越来越多,越来越丰富。
设问:

  • 在网页上,如果我要添加一个计数器:
    以前,那就去空间提供商那里要个链接,或其他地方去复制个地址,但这一些,总归是别人做的,好不好,你是没有太多的发言权的,只能一个一个地找。
  • 在网页上,我要将一些信息发布出去:
    假如信息是文本,做一个新页面,加个链接;
    是数据,做一个新页面,加个链接:
    可要是这些数据经常更新,甚至,每小时、每分钟,都可能会改变,你是否愿意守在电脑前,不停修改、上传呢?(咱可不是商业网站,没有人愿意为你而烧钱。)
    而留言板、聊天室、论坛,这些,决不是单靠HTML和JAVASCRIPT就能搞定的。

为了实现更多的自动控制,可以使用CGI(Common Gateway Interface)程序来实现这些功能。

软件需求:
PHP:GD Library
配置支持PHP的服务器。我用OmniHTTPd Professional

对于计数器和实时数据统计、发布,我们可以用图片来完成。在图片中输出文字。
在PHP中,要创建一个图片,并在上面显示点内容,基本步骤如下:

<?php
//http头,告诉浏览器,这是一个GIF图片
header ("Content-type: image/gif");
// 要画画,先要有花布不是?创建一个400×300调色板图像
$im = imagecreate (400, 300);
$black = imagecolorallocate ($im, 0, 0, 0);
// 默认黑色背景。
//(默认,是指第一个定义的颜色。如果在此行代码前面定义了另一个颜色,那么,最先定义的那个,就是默认背景颜色。)
$red = imagecolorallocate ($im, 255, 0, 0);
//红色。如果这两行交换,你会发现背景是红色,文字是黑色。
$string="1234567890";
// 要绘制的字符
imagestring ($im,12,10,10,$string,$red);
//在(10,10)开始绘制字符串
imagepng ($im);
// 以png格式输出,也可以用imagejpeg($im);或magegif($im);但后者,如果GD版本高于1.6,就不能用了。
imagedestroy ($im);
// 结束,清除所有占用的内存资源
?>


上面示例,在400×300的图片上,自点(10,10)开始,绘制12磅的"1234567890"。你有没有注意到这张图片的大小是:251字节!你也可以试试其他的输出格式。
图片的大小,与图片中非背景象素点数有关,跟输出多少象素无关。

然而,有一个问题。
你可以用imagestring()输出如下的信息:
imagestring($im,1,0,0,"abcdefghijklmnopqrstuvwxyz0123456789~!@#$%^&*()_+{}|:"<>?[]';,./",$red);
可是,你无法正确输出中文!!!
imagestring($im,1,0,0,"啊",$red);
你看到的,决不是中文!!而是乱码。
PHP默认的字符集是UTF-8,而简体中文是GB2312。

如何解决?!
为了解决这个问题,你可以让PHP加载扩展模块php_iconv.dll(UNIT下的后缀名是.SO),不过,有时候,可能不能正常工作。本来,我要把一段测试代码放上来,可这次,怎么弄都没有成功。为了避免错误,我还是不把它们放上来了。
但,最致命的,如果你的空间服务商关闭了该扩展模块,或者,甚至禁止了加载模块的DL()函数,那,你就只能跟中文BYE-BYE了。
还好,还有其他办法。
可以通过字符映射,将预先转换好的码表中字符输出来。但,你需要一张码表!
或者,手工绘制每一个中文的每一个点!感觉怎么样?!

好,来吧,我们一起来画字!

画字,首先要知道怎么画。
初中的简单函数,学过吧?要画出函数的图形,做过吧?算出某点的坐标,然后连接两相邻点。这种方法,叫描点法。
我们要做的,是尽量多地将点算出来,然后在相应坐标显示出来。
你是否听说过点阵打印机、点阵汉字?
在输出汉字时,它们是用一个个点来表示的。

在某个坐标上显示一个某种颜色的点的函数是:
int imagesetpixel ( resource image, int x, int y, int color)
假定我要在坐标(100,100)处显示一个白色的点,那么,只需如下代码:

<?php
  header ("Content-type: image/gif");
  $image = imagecreate (400, 300);
  $black = imagecolorallocate ($image, 0, 0, 0);
  $white = imagecolorallocate ($image, 255, 255, 255);          // 定义白色
  imagesetpixel ( $image, 100, 100, $white);
  imagepng ($image);
  imagedestroy ($image);
?>


也就是说,我们只要获取某个汉字的所有点的信息,我们就能够通过这个函数,输出那个汉字。

在文件chs16.fon里,保存的,是国标区位码表(国家标准信息交换用汉字编码基本字符集GB-2312)。它是汉字的点阵字库。(WIN98系统中,此文件在c:windowscommand下。如果你要把它放在UNIX系统下使用,请注意大小写。如果没有,你可以在文末找到链接。)
它是MSDOS时代的,但,好东西,还是应该拿出来一用的。

从chs16.fon里,我们可以读取汉字的点阵数据。每个汉字,都是由16×16个点构成的。笔划走过的地方,点的值为1,否则为0;每个点占用一个位,每8个点构成一个字节。那么,一个汉字,就需要(16×16÷8=32)字节。

下面这个实例,是为了说明字符点阵的表示方法。
这里,定义了一个8×8的矩阵,显示了一个字母C,白色的方块用0表示,黑色方块用1表示,那么,这八行图形的代码分别是:

点击查看原图 点击查看原图

二进制表示

十六进制表示

0

00000000

0x00

1

00111110

0x3E

2

01110000

0xE0

3

01110000

0xE0

4

01110000

0xE0

5

01110000

0xE0

6

00111110

0x3E

7

00000000

0x00

  
要输出这些点的话,就需要先画第一行,然后第二行、第三行……到最后一行。
用一个循环:
  for($hang=0;$hang<8;$hang++)
在每一行中,有八个格子,需要分别绘制,从第一个,然后第二个、第三个……到最后一个。
用一个循环:
  for($gezi=0;$gezi<8;$gezi++)
两个循环联列:
  for($hang=0;$hang<8;$hang++)
for($gezi=0;$gezi<8;$gezi++)
{ //在这里,我们就能输出点了。
      imagesetpixel ( $image, $gezi, $hang, $color);
}

但,我们如何知道到哪里去读某个汉字的点阵数据呢?

一般的字符,比如ASCII码,是用数字0--127(即二进制00000000到01111111)来表示,而中文,则是用两个高位为1的字节(100000000 100000000)表示。如:  半角字符"A",机内码为 (01000001)(它实际上是ASCII码值)。
下面,让我们打开"字符映射表"看看吧。如果你为了节省磁盘,没有安装,那就装一下,不大。如果不会安装,那你就接下去看我乱侃吧。
在字符映射表里,字体选择"楷体_GB2312",点击"特殊符号",这时,你可以看到国标区位码表,从字符(10110000 10100001)开始,一直到(10011111 11111111)。
    全角字符"A",机内码为:(10100011 11000001)(它实际是两个高位为1的ASCII码)。
    中文"啊"的机内码,是(10110000 10100001);
在GB-2312字符集中,"啊"在表中位置是第16区第1位,这个坐标(16,1),用二进制表示,就是(00010000,00000001)。这,就是"啊"的区位码。
请看:

中文字符:   啊
机内码:    (10110000 10100001)
区位码:    (00010000,00000001)
相差:      (10100000,10100000)

所以,
    区位码与机内码的换算公式为 【区位码】+(10100000 10100000)=【机内码】。即:
    区位码0 + (10100000) = 机内码0;
    区位码1 + (10100000) = 机内码1;
这样的话,点阵数据,就可以通过汉字"机内码"-> "区位码"进行索引、查找。

前面已经讲了一个汉字,在表中要占用32字节,所以,我们定义了一个含有32个元素的数组:
       $buffer=array(0,0,0,0,0,
                    0,0,0,0,0,
                    0,0,0,0,0,
                    0,0,0,0,0,
                    0,0,0,0,0,
                    0,0,0,0,0,
                    0,0);
    用来保存从字库读出的32个字节数据。

接下来的问题,某一个字符,到底保存在文件的什么位置呢?

由于一个汉字用了32个字节,而GB-2312区位码表表有94行、94列,那么,只要知道该字符在表中是第几个,再乘以32就行了。
所以定义偏移量:
        $offset=(94*($qh-1)+($wh-1))*32;
    $qh表示区(qu)、$wh表示位(wei);减1,是因为PHP从0开始计数。
位置找到,就只需要用fseek()函数定到码表的这个位置,然后读32字节到$buffer就行了。
另外,由于中文是由两个字节组成,而前面给出的点阵示例是8位,一个字节,所以,画点的代码要修改一下:
for($hang=0;$hang<16;$hang++)
for($j=0;$j<2;$j++)           //因为是两个字节,所以插入一个循环
for($gezi=0;$gezi<8;$gezi++)
{
       imagesetpixel ( $image, $gezi +8*$j, $hang , $color);
}

好,我们开始编程吧!


/*************************************
*     文件名:'draw1.0.inc.php
**    中文显示点阵输出   version 1.0
**    只提供简单的操作:输出默认大小的纯中文字符串到图片的坐标(0,0)上
**    更多功能,请见下一版本。
*
****************************************/
function draw($image,$string,$color)
{
   $fp=fopen("chs16.fon","rb");//二进制方式读点阵字库chs16.fon
   if (!feof($fp))//如果文件指针到了文件末尾,退出,不要忘记关闭文件
   {
      while($string)//当字符串不为0
      {
         $qh=ord(substr($string,0,1))-0xa0;
      $wh=ord(substr($string,1,2))-0xa0;
/* 这两行代码,其实是获取一个中文的机内码。
  substr($string,0,1);是从$string中获取第一个字节,然后,通过ord();将这个字符转换为整数。(由于PHP不支持无符号整数,所以没有这一步转换的话,你就只能得到一个0。)在转换为整数之后,就能进行计算了。机内码减去0xa0(10100000),就得到了区位码。
substr($string,1,2);是获取$string中的第二个字节。*/
         $offset=(94*($qh-1)+($wh-1))*32;
/*得到了汉字的区位值后,就开始计算偏移量了。*/
     fseek($fp,$offset,SEEK_SET);
/*在字库文件$fp中,将文件指针定位到偏移量。*/
         $buffer=preg_split('//', fread($fp,32), -1, PREG_SPLIT_NO_EMPTY);
/* fread($fp,32);是从$fp中读取32个字节数据,然后通过preg_split();分配到数组$buffer中。preg_split();是一个支持正则表达的函数。关于正则表达式,我正在学*中。为什么这样用,我也不知道。PHP手册里有本实例。*/
        for($i=0;$i<16;$i++)              //点阵的行数:16 列数也应该是16
       for($j=0;$j<2;$j++)             //因为是两个字节,那么,就要一个一个地画了
        for($k=0;$k<8;$k++)          //每个字节,都有8个点的数据
      if(((ord($buffer[$i*2+$j])>>(7-$k))&0x01))//如果这个点的值为1,输出;否则,没有
      {
         imagesetpixel($image,$x+8*$j+$k, $i, $color);
             }
      $string=substr($string,2); //中文由两个字节表示,所以,输出一个汉字后,就要去掉两个字节。
      $x=24; //一个汉字输出结束,空开一点,给下一个汉字。因为这个汉字是16×16点,那么,$x的值设为16,就够了。但,太挤了不是?
     }
  }
  fclose($fp);
 }

下面,我给出一个测试实例:


<?php
header ("Content-type: image/gif");
include 'draw1.0.inc.php';
$im = imagecreate (400, 300);
$black = imagecolorallocate ($im, 0, 0, 0);
$string="中文";
drawer($im,$string);
imagepng ($im);
imagedestroy ($im);
?>


对于这个函数,我们还可以进行扩充,以实现不同的效果。


相关附件1:chs16.fon 本地下载
相关附件2:代码实例打包下载

一个实时用户留言板留言数量统计表实例:
http://medlem.spray.se/letmegetone/messageboard/userinfo.htm

作者联系方式:
Homepage: http://medlem.spray.se/letmegetone
E-mail: [email protected]

注:本文章为原创文章,版权归文章作者与超越PHP网站所有,未经本站同意,禁止任何商业转载。非盈利网站及个人网站转载请注明出处,谢谢合作!