马上注册,结交更多易友,享用更多功能,让你轻松玩转觅风论坛。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
基本都是把普通的单字节数字跟字母符号都没算进去,正常这些转成utf8也是单字符
还有就是一些特殊文字直接到字节集后也被当做uft8,也是考虑不全面
我不但把纯数字字母符号加进去,还有空格以及
低于0x20(空格)的字节,只保留判断09(tab) 0a 0d (这两个大家不陌生吧) 都当作是uft8
按正常来说,低于0x20的都算,但是我们一般是为了直接展示文本,除了上面3个可以直观看到,
其它的看到的都是□□□□□□ 所以去掉判断了
另外就是有的人喜欢在uft8最后加个{0},如果这种检测出来,返回值肯定是返回 长度-1 的,自己人工判断下
当,返回值=长度-1 且 最后一个字节是0时,可以当作是uft8
|
|