Java实现中文字符串与unicode互转工具类

网友投稿 259 2023-07-03

Java实现中文字符串与unicode互转工具类

本文实例为大家分享了java实现中文字符串与unicode互转的具体代码,供大家参考,具体内容如下

原理利用了java实现js的escape以及unescape函数。

/**

* 中文字符串和unicode互转工具类

*

* @author hkb

*/

public class UnicodeConvertUtils {

/**

* 实现js的escape函数

*

* @param input

* 待传入字符串

* @return

rnhtHpaEP*/

public static String escape(String input) {

int len = input.length();

int i;

char j;

StringBuffer result = new StringBuffer();

result.ensureCapacity(len * 6);

for (i = 0; i < len; i++) {

j = input.charAt(i);

if (Character.isDigit(j) || Character.isLowerCase(j) || Character.isUpperCase(j)) {

result.append(j);

} else if (j < 256) {

result.append("%");

if (j < 16) {

result.append("0");

}

result.append(Integer.toString(j, 16));

} else {

result.append("%u");

result.append(Integer.toString(j, 16));

}

}

return result.toString();

}

/**

* 实现js的unescape函数

*

* @param input

* 待传入字符串

* @return

*/

public static String unescape(String input) {

int len = input.length();

StringBuffer result = new StringBuffer();

result.ensureCapacity(len);

int lastPos = 0, pos = 0;

char ch;

while (lastPos < len) {

pos = input.indexOf("%", lastPos);

if (pos == lastPos) {

if (input.charAt(pos + 1) == 'u') {

ch = (char) Integer.parseInt(input.substring(pos + 2, pos + 6), 16);

result.append(ch);

lastPos = pos + 6;

} else {

ch = (char) Integer.parseInt(input.substring(pos + 1, pos + 3), 16);

result.append(ch);

lastPos = pos + 3;

}

} else {

if (pos == -1) {

result.append(input.substring(lastPos));

lastPos = len;

} else {

result.append(input.substring(lastPos, pos));

lastPos = pos;

}

}

}

return result.toString();

}

/**

* unicode转中文

*

* @param input

* 待传入字符串

* @return

*/

public static String toGb2312(String input) {

input = input.trim().replaceAll("(?i)\\\\u", "%u");

return unescape(input);

}

/**

* 中文字符串转unicode

*

* @param input

* 待传入字符串

* @return

*/

public static String toUnicode(String input) {

input = input.trim();

String output = escape(input).toLowerCase().replace("%u", "\\u");

return output.replaceAll("(?i)%7b", "{").replaceAll("(?i)%7d", "}").replaceAll("(?i)%3a", ":")

.replaceAll("(?i)%2c", ",").replaceAll("(?i)%27", "'").replaceAll("(?i)%22", "\"")

.replaceAll("(?i)%5b", "[").replaceAll("(?i)%5d", "]").replaceAll("(?i)%3D", "=")

.replaceAll("(?i)%20", " ").replaceAll("(?i)%3E", ">").replaceAll("(?i)%3C", "<")

.replaceAll("(?i)%3F", "?").replaceAll("(?i)%5c", "\\");

}

/**

* 测试

*

* @param args

*/

public static void main(String[] args) {

System.out.println(toUnicode("你好"));

System.out.println(toGb2312("\u4f60\u597d"));

// 等同于上面

System.out.println(toGb2312("\\u4f60\\u597d"));

}

}

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:java实现阿拉伯数字转汉字数字
下一篇:关于线程池你不得不知道的一些设置
相关文章

 发表评论

暂时没有评论,来抢沙发吧~