FreeBSD的Libc中GB18030的代码初探

2009-05-13 02:08:46来源:未知 阅读 ()

新老客户大回馈,云服务器低至5折


在“/usr/src/lib/libc/locale/gb18030.c”中实现了以下几个函数:

static size_t _GB18030_mbrtowc(wchar_t *, const char *,size_t, mbstate_t *);
static int _GB18030_mbsinit(const mbstate_t *);

static size_t _GB18030_wcrtomb(char *, wchar_t,mbstate_t *);



定义了一个结构体:

typedef struct {
     int    count;
     u_char bytes[4];
} _GB18030State;



在以前的日志当中提到过GB18030.c文件中的“_GB18030_init(_RuneLocale *rl)”函数,其中主要的功用就是把系统进行“宽字节多字节”的函数指针指向上面的那三个函数,用以根据locale加载对应的处理函数


1、_GB18030_mbsinit() 函数:

主要代码:

_GB18030_mbsinit(const mbstate_t *ps)
{
    return (ps == NULL || ((const _GB18030State *)ps)->count == 0);
}
很明显,这个函数所作的初始化就是设置_GB18030State的count成员为零,先可以把count理解成一个计数器,用来记录转换的字数!



2、_GB18030_mbrtowc() 函数:

主要代码:

_GB18030_mbrtowc(wchar_t * __restrict pwc, const char * __restrict s,size_t n, mbstate_t * __restrict ps)

/* pws:指向宽字符的指针,s:指向多字节字符的指针*/
{
     _GB18030State *gs;
     wchar_t wch;
     int ch, len, ocount;
     size_t ncopy;
     
     gs = (_GB18030State *)ps;
     if (gs->count count > sizeof(gs->bytes)) {
         errno = EINVAL;
         return ((size_t)-1);
     }

     if (s == NULL) {
         s = "";
         n = 1;
         pwc = NULL;
     }

     /*确定多字节字符的宽度*/
     ncopy = MIN(MIN(n, MB_CUR_MAX), sizeof(gs->bytes) - gs->count);
     memcpy(gs->bytes + gs->count, s, ncopy);
     ocount = gs->count;
     gs->count += ncopy;
     s = (char *)gs->bytes;
     n = gs->count;

     /* Incomplete multibyte sequence */
     if (n == 0)
        return ((size_t)-2);


/* Single byte:  [00-7f]
  * Two byte:  [81-fe][40-7e,80-fe]
  * Four byte:  [81-fe][30-39][81-fe][30-39]
  */
     ch = (unsigned char)*s++;

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:在FreeBSD 6上面怎么防DDOS攻击

下一篇:[整理]GB2312和GB18030