中英文混和的字符串的ASCII与UNICODE编码与解码

栏目:建站技术 2020-10-30

//1:获取中英文混合字符的编码(ASCII码与UNICODE码)
$str = "官网制作:网巢网络";
foreach (math($str) as $key => $value) {
    if (preg_match('/^[x{4e00}-x{9fa5}]+$/u',$value)) {//中文,注意中文这里暂时不转换,因为无法通过chr函数来获取中文,
        $arr_chr[]=unicode_encode($value);
    } else {//英文
        $arr_chr[]=asc($value);
    }
}
//再将数组转换成字符串
$strs = implode(",", $arr_chr);


//2:将上面的字符串解析成原来的字符串
$arr_chr = explode(",", $strs);
foreach ($arr_chr as $key => $value) {
    if(is_numeric($value))//如果是数字将ASCII码转换成英文字符
    {
        echo chr($value);
    }else{//否则将UNICODE编码后的内容进行解码成汉字
        echo unicode_decode($value);
    }
}

//函数
//php将字符串分割成数组实现中文分词
function math($string,$code ='UTF-8'){
    if ($code == 'UTF-8') {
     $pa = "/[x01-x7f]|[xc2-xdf][x80-xbf]|xe0[xa0-xbf][x80-xbf]|[xe1-xef][x80-xbf][x80-xbf]|xf0[x90-xbf][x80-xbf][x80-xbf]|[xf1-xf7][x80-xbf][x80-xbf][x80-xbf]/";
    } else {
        $pa = "/[x01-x7f]|[xa1-xff][xa1-xff]/";
    }
    preg_match_all($pa, $string, $t_string);
    $math="";
    foreach($t_string[0] as $k=>$s){
        $math[]=$s;
    }
     return $math;
}
//转换成ascii码,注意其实中文是没有ascii码的,所以最好将中文转成UNICODE编码
function asc($s) {
  if(ord($s) < 128) return ord($s);
  //return current(unpack('N', "xffxff$s"));
}
//将中文进行UNICODE编码,编码后的内容格式:u56feu7247
function unicode_encode($name)  
{  
    $name = iconv('UTF-8', 'UCS-2', $name);
    $len = strlen($name);  
    $str = '';  
    for ($i = 0; $i < $len - 1; $i = $i + 2)  
    {  
        $c = $name[$i];  
        $c2 = $name[$i + 1];  
        if (ord($c) > 0)  
        {    // 两个字节的文字  
            $str .= 'u'.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);  
        }  
        else  
        {  
            $str .= $c2;  
        }  
    }  
    return $str;  
}
// 将UNICODE编码后的内容进行解码变成汉字
function unicode_decode($name)  
{  
    // 转换编码,将Unicode编码转换成可以浏览的utf-8编码  
    $pattern = '/([w]+)|(\u([w]{4}))/i';  
    preg_match_all($pattern, $name, $matches);  
    if (!empty($matches))  
    {  
        $name = '';  
        for ($j = 0; $j < count($matches[0]); $j++)  
        {  
            $str = $matches[0][$j];  
            if (strpos($str, '\u') === 0)  
            {  
                $code = base_convert(substr($str, 2, 2), 16, 10);  
                $code2 = base_convert(substr($str, 4), 16, 10);  
                $c = chr($code).chr($code2);  
                $c = iconv('UCS-2', 'UTF-8', $c);  
                $name .= $c;  
            }  
            else  
            {  
                $name .= $str;  
            }  
        }  
    }  
    return $name;  
}

相关阅读

bom头及不可见换行测试代码及文件

2024-04-42

&lt;?php//无bom头无换行$test1_content=file_get_contents(&#39;test1.txt&#39;);$test1_contenten_codestr=urlencode($test1_content);echo($test1_contenten_codestr);//12echo&#39;&lt;br/&gt;&#…

AJAX随机调用数组中不重复的元素

2020-10-1021

读以记事本中的网址,记事本里中有多个网址,每个一行,然后使用AJAX循环请求随机出来的部分不重复的网址setsrmObj=server.CreateObject(&quot;adodb.stream&quot;)srmObj.type=1srmObj.mode=3srmObj.opensrmObj.Position=0srmObj.LoadFromFile(…

ueditor与umeditor编辑器的各浏览器的问题汇总

2020-10-10127

ueditor的[1.4.3.3PHP版本]UTF-8版的存在的问题1:当编辑器还没有来得及提示“本地保存成功”的就提交表单的话,那么将无法获取编辑器中的内容2:当同一个脚本中有两个UE编辑器时,如果复制一段纯文字到编辑器中,被复制的文字的第一行只显示下面的部分,上面的一部分被隐藏起来,这个现象至少在火狐43.01版本一直到47.02这些版本是至少存在的,火…

360浏览器header的Location跳转无效的解决办法

2020-10-10404

在百度里搜索这个问题的答案,有的说是BOM头导致的问题,有的点是因为之前有输出语句导致的问题,有的话是Location和后面的:(冒号)之间有空格导致的问题,还有的话是因为没有加上exit()导致的问题,但是这几项都排除之外,用360浏览器8.1版本的仍然会有这种情况的发生,那么可以接着继续往下看如果用360浏览器8.1版本的打开“你的域名/admin/te…

为什么小程序的页面有二次跳转时会瞬间显示一下第一次的页面再跳…

2020-10-10418

为什么小程序的页面有二次跳转时会瞬间显示一下第一次的页面再跳转呢?navigateToredirectToswitchTabtabBar先来看示例代码并且在微信开发者工具上测试下面看示例代码共有三个页面,分别是indexproductshowcartindex的js与wxmlPage({/*跳转到商品详情*/toProductshow:function(ev…

跳转关系与规则不符要怎么办?

2022-04-4526

为了能够把这个问题解释清楚,这里我用实例来给大家分析一下跳转关系与规则不符的这个问题,一:先来看一下我的新旧url新旧url链接文件:gaiban.txt中的内容域名/productshow.php?id=29域名/sbzsshow.php?id=29域名/productshow.php?id=2域名/cpzsshow.php?id=78二:再来看一下pro…