utf-16

Diferencia entre UTF-8 y UTF-16?

¿Diferencia entre UTF - 8 y UTF-16? ¿Por qué necesitamos esto? MessageDigest md = MessageDigest.getInstance("SHA-256"); Str ... = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

¿Qué es un" par sustituto " en Java?

Estaba leyendo la documentación para StringBuffer, en particular el método reverse(). Esa documentación menciona algo sobre pares sustitutos. ¿Qué es una pareja sustituta en este contexto? ¿Y qué son los sustitutos bajos y altos ?

UTF-8, UTF-16 y UTF-32

¿Cuáles son las diferencias entre UTF-8, UTF-16 y UTF-32? Entiendo que todos almacenarán Unicode, y que cada uno usa un número diferente de bytes para representar un carácter. ¿Hay alguna ventaja en elegir uno sobre el otro?

¿Puedo hacer que git reconozca un archivo UTF-16 como texto?

Estoy rastreando un archivo de máquina virtual de PC Virtual (*.vmc) en git, y después de hacer un cambio git identificó el a ... Estoy usando git bajo Cygwin, con core.autocrlf establecido en false. Podría usar mSysGit o git bajo UNIX, si es necesario.

Longitud de cadena Java Unicode

Estoy tratando de obtener el conteo de cadena unicode y probé varias opciones. Parece un pequeño problema pero golpeado de un ... String str1 = new String("குமார்"); System.out.print(str1.length()); } } PS: Es el idioma tamil.

Diferencia entre el orden de bytes Big Endian y Little Endian

¿Cuál es la diferencia entre el orden de bytes Big Endian y Little Endian ? Ambos parecen estar relacionados con Unicode y UTF16. ¿Dónde exactamente usamos esto?

Convertir UTF-8 con BOM a UTF-8 sin BOM en Python

Dos preguntas aquí. Tengo un conjunto de archivos que suelen ser UTF-8 con BOM. Me gustaría convertirlos (idealmente en su lu ... modo 'rw' en lugar de 'r+'/'r+b', por lo que eventualmente debería volver a editar mi pregunta y eliminar la parte resuelta.

Unicode en C++11

He estado leyendo un poco sobre el tema de Unicode specifically específicamente, UTF-8 support (no) soporte en C++11, y esper ... ir, con un toque de amargura) parece que la propuesta de Puppy para este tipo de funcionalidad limitada no fue bien recibida.

Por qué does.net utiliza la codificación UTF16 para la cadena, pero utiliza utf8 como predeterminado para guardar archivos?

Desde aquí Esencialmente, string utiliza la forma de codificación de caracteres UTF-16 Pero al guardar vs StreamWrit ... n predeterminada para la cadena mientras que utf8 para guardar el archivo ? Gracias. p. s. Ya he leído el famoso artículo

Cómo resolver el error "no se puede cambiar la codificación" al insertar XML en SQL Server

Estoy tratando de insertar en la columna XML (SQL SERVER 2008 R2), pero el servidor se queja: Sistema.Datos.SqlClient.SQ ... mplo anterior, o simplemente no especifique el tipo: sqlcmd.Parameters.Add(new SqlParameter("ParamName", xmlValueToAdd));

Reemplazo de encabezado obsoleto

Un poco de primer plano: mi tarea requería convertir el archivo XML UTF-8 a UTF-16 (con el encabezado adecuado, por supuesto) ... (No me importa usar Boost en absoluto, pero aparte de eso, prefiero estar lo más cerca posible de la biblioteca estándar.)

UTF8 vs UTF16 vs char* frente a qué? ¡Que alguien me explique este desastre!

Me las he arreglado para ignorar en su mayoría todas estas cosas de caracteres multi-byte, pero ahora necesito hacer un poco ... izar mis aplicaciones? Qué tipos debo usar (uso. Net y C / C++, y necesito esta respuesta tanto para Unix como para Windows).

Utf8 general ci o utf8mb4 o ut?

Utf16 o utf32? Estoy tratando de almacenar contenido en muchos idiomas. Algunos de los idiomas utilizan fuentes de doble an ... seguro de qué tipo de base de datos debería usar. Cualquier información sobre las diferencias entre estos cuatro charsets...

¿Hay alguna razón para preferir UTF-16 sobre UTF-8?

Examinando los atributos de UTF-16 y UTF-8, no puedo encontrar ninguna razón para preferir UTF-16. Sin embargo, al revisar J ... n? EDITAR: Mientras tanto también he encontrado esta respuesta, que parece relevante y tiene algunos enlaces interesantes.

Unicode hell (en Windows) [cerrado]

Hoy me desperté y sentí que algo estaba terriblemente mal con mi código y cada biblioteca que he usado, y creo que tenía razó ... muchos expertos, esas personas no leen ningún blog al azar y valoro mucho su opinión. Así que gracias a todos por contribuir.

Cadenas de JavaScript-UTF-16 vs UCS-2?

He leído en algunos lugares que las cadenas JavaScript son UTF-16, y en otros lugares son UCS-2. Hice algunas búsquedas para ... a cualquiera que se encuentre con esto, asegúrese de revisar este enlace: Http://mathiasbynens.be/notes/javascript-encoding