将中文转换成Unicode -ASCII编码文字
//将中文转换成 收录百 这种格式的文字,可适配网站标题描述等内容.
$site['Title'] =mb_convert_encoding ($site['Title'], "HTML-ENTITIES", "UTF-8");
上面的函数可以讲中文 UTF-8转成 ASCII编码,如果将两个后面的参数颠倒过来,可以将ASCII 转成中文。
前些天采集了一些数据,对方的数据是ASCII,但是数据的编码又缺少了分号;
询问了CHAT GPT后,使用如下代码解决了:
/*----20231207增加数据格式处理---*/
$content = preg_replace('/(\d+)(?![\d;])/', '$1;', $content);//采集的编码文字数据增加分号
$content=mb_convert_encoding($content, "UTF-8", "HTML-ENTITIES"); //未知原编码,通过auto自动检测后,最后一个参数是ASCII 的意思,转换编码为utf-8汉字