Java equivalent to unencode function in javascript to parse escaped unicode [duplicate]

Question

I've trouble parsing tweets which are represented as escaped unicode some found to be foreign language strings e.g \u064a\u0633\u0639\u062f\u0646\u064a

Judking · Accepted Answer · 2013-03-20 09:40:47Z

1

Using org.apache.commons.lang.StringEscapeUtils.

String s="\\u0048\\u0065\\u006C\\u006C\\u006F";
System.out.println(StringEscapeUtils.unescapeJava(s));

P.S. Oops, I didn't refresh this page before I post the answer, the comments above conveys the same thing.

answered Mar 20, 2013 at 9:40

Judking

6,41112 gold badges61 silver badges88 bronze badges

Sign up to request clarification or add additional context in comments.

Comments

Lakshmi · Accepted Answer · 2013-03-20 09:41:01Z

0

you can try str = org.apache.commons.lang.StringEscapeUtils.unescapeJava(str);

from apache commons

check http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringEscapeUtils.html

answered Mar 20, 2013 at 9:41

Lakshmi

2,2943 gold badges30 silver badges49 bronze badges

Collectives™ on Stack Overflow

Java equivalent to unencode function in javascript to parse escaped unicode [duplicate]

2 Answers 2

Comments

Comments

Linked

Hot Network Questions

Collectives™ on Stack Overflow

2 Answers 2

Comments

Comments

Linked

Related