Mysql必读mysql 字符串长度计算实现代码(gb2312+utf8)

作者：VEPHP 时间 2017-09-28

《Mysql必读mysql 字符串长度计算实现代码(gb2312+utf8)》要点：
本文介绍了Mysql必读mysql 字符串长度计算实现代码(gb2312+utf8)，希望对您有用。如果有疑问，可以联系我们。

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员.下面简要的剖析一下PHP对中文字符串长度的处理：

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节.例：

$enStr = 'Hello,China!';
echo strlen($enStr); // 输出：12

而中文则不然,做中文网站一般会选择两种编码：gbk/gb2312或是utf-8.utf-8能兼容更多的字符,所以受到很多站长的喜爱.gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异.

gbk编码下每个中文字符所占字节为2,例：

$zhStr = '您好,中国!';
echo strlen($zhStr); // 输出：12

utf-8编码下每个中文字符所占字节为3,例：

$zhStr = '您好,中国!';
echo strlen($zhStr); // 输出：18

那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现.

这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串)：

代码如下:

 
$zhStr = '您好,中国!'; 
$str = 'Hello,中国!'; 

// 计算中文字符串长度 
function utf8_strlen($string = null) { 
// 将字符串分解为单元 
preg_match_all("/./us", $string, $match); 
// 返回单元个数 
return count($match[0]); 
} 
echo utf8_strlen($zhStr); // 输出：6 
echo utf8_strlen($str); // 输出：9 

utf8_strlen C 获得UTF8编码的字符串的长度

代码如下:

 
/* 
* 用于UTF8编码的程序 
* 获得字符串的长度,一个中文表示3个长度 
* itlearner注释 
*/ 
function utf8_strlen($str) { 
$count = 0; 
for($i = 0; $i < strlen($str); $i++){ 
$value = ord($str[$i]); 
if($value > 127) { 
$count++; 
if($value >= 192 && $value <= 223) $i++; 
elseif($value >= 224 && $value <= 239) $i = $i + 2; 
elseif($value >= 240 && $value <= 247) $i = $i + 3; 
else die('Not a UTF-8 compatible string'); 
} 
$count++; 
} 
return $count; 
} 

转载请注明本页网址：
http://www.vephp.com/jiaocheng/5305.html

标签：

PHP教程

WEB前端开发

数据库

WEB服务器

APP开发

LINUX学习

后端开发课程

前端开发课程

数据库课程

Mysql必读mysql 字符串长度计算实现代码(gb2312+utf8)

同类教程排行

特辑教程