utf

Diferencias de formato Unicode, UTF, ASCII, ANSI

¿Cuál es la diferencia entre el Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, y ANSI codificaciones? ¿De qué manera son útiles para los programadores?

Diferencia entre UTF-8 y UTF-16?

¿Diferencia entre UTF - 8 y UTF-16? ¿Por qué necesitamos esto? MessageDigest md = MessageDigest.getInstance("SHA-256"); Str ... = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

UTF-8, UTF-16 y UTF-32

¿Cuáles son las diferencias entre UTF-8, UTF-16 y UTF-32? Entiendo que todos almacenarán Unicode, y que cada uno usa un número diferente de bytes para representar un carácter. ¿Hay alguna ventaja en elegir uno sobre el otro?

¿Qué codificación abre los archivos CSV correctamente con Excel tanto en Mac como en Windows?

Tenemos una aplicación web que exporta archivos CSV que contienen caracteres extranjeros con UTF-8, sin BOM. Tanto los usuari ... tal. El separador de campo es coma, pero punto y coma no cambia cosa. ¿Hay alguna codificación que funcione en ambos mundos?

el personaje aparece en los archivos. Cómo eliminarlos?

Estoy comprimiendo archivos JavaScript y el compresor se queja de que mis archivos tienen  carácter en ellos. ¿Cómo puedo buscar estos caracteres y eliminarlos?

Codificación Unicode para literales de cadena en C++11

Después de una pregunta relacionada con , me gustaría preguntar sobre los nuevos tipos literales de caracteres y cadenas en ... gustaría obtener una imagen lo más completa posible de las nuevas funciones de codificación UTF y tipografía del nuevo C++11.

¿Cuántos caracteres se pueden asignar con Unicode?

Estoy pidiendo el recuento de todas las posibles combinaciones válidas en Unicode con explicación. Sé que un char puede ser c ... os bytes de continuación tienen restricciones a pesar de que el byte inicial de ese carácter borra cuánto tiempo debería ser.

ISO-8859-1 vs UTF-8?

¿Qué se debe usar y cuándo ? ¿o siempre es mejor usar UTF-8 siempre? o ISO-8859 - 1 todavía tiene importancia en condiciones ... lt;?xml version="1.0" encoding="UTF-8"?> O <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

¿Hay alguna forma en ruby 1.9 de eliminar secuencias de bytes inválidas de cadenas?

Supongamos que tiene una cadena como "€foo\xA0", codificada en UTF-8, ¿hay alguna forma de eliminar secuencias de bytes no vá ... TF-8', :undef => :replace, :replace => '') Que rinde "foo" Pero que también pierde el carácter multibyte válido €