]> zoso.dev Git - buffer.git/commitdiff
detect and handle utf16 non-BMP characters (surrogate pairs)
authorJesse Tane <jesse.tane@gmail.com>
Sun, 5 Jan 2014 22:39:42 +0000 (17:39 -0500)
committerJesse Tane <jesse.tane@gmail.com>
Sun, 5 Jan 2014 23:53:25 +0000 (18:53 -0500)
index.js

index f8ce47200cb9a090f89afe472b9e9b1b8fcd577d..c77d54a0ce1efdc47a8db370117c770e2032f637 100644 (file)
--- a/index.js
+++ b/index.js
@@ -920,14 +920,18 @@ function toHex (n) {
 
 function utf8ToBytes (str) {
   var byteArray = []
-  for (var i = 0; i < str.length; i++)
-    if (str.charCodeAt(i) <= 0x7F)
+  for (var i = 0; i < str.length; i++) {
+    var b = str.charCodeAt(i)
+    if (b <= 0x7F)
       byteArray.push(str.charCodeAt(i))
     else {
-      var h = encodeURIComponent(str.charAt(i)).substr(1).split('%')
+      var start = i
+      if (b >= 0xD800 && b <= 0xDFFF) i++
+      var h = encodeURIComponent(str.slice(start, i+1)).substr(1).split('%')
       for (var j = 0; j < h.length; j++)
         byteArray.push(parseInt(h[j], 16))
     }
+  }
   return byteArray
 }