unicode

Convertir una cadena Unicode en una cadena ASCII escapada

¿Cómo puedo convertir esta cadena: This string contains the Unicode character Pi(π) En una cadena ASCII escapada: This ... a0) Y viceversa? La codificación actual disponible en C# convierte el carácter π en "?". Necesito preservar ese carácter.

Uso de las funciones unicode() y encode () en Python

Tengo un problema con la codificación de la variable path y su inserción en la base de datos SQLite. Intenté resolverlo con ... códec 'ascii' no puede decodificar el byte 0xc5 en posición 32: ordinal no en rango (128) La versión de Python es 2.7.2

Longitudes de VARCHAR MySQL y UTF-8

En MySQL, si creo un nuevo campo VARCHAR(32) en una tabla UTF-8, ¿significa que puedo almacenar 32 bytes de datos en ese campo o 32 caracteres (multi-byte)?

Cómo contar caracteres en una cadena unicode en C

Digamos que tengo una cadena: char theString[] = "你们好āa"; Dado que mi codificación es utf-8, esta cadena tiene 12 bytes de ... Cómo puedo hacer el equivalente a la suscripción para que: theString[3] == "好" ¿Cómo puedo cortar, y gato tales cuerdas?

Por qué cambia el tamaño de esta cadena de Python en una conversión int fallida

Del tweet aquí : import sys x = 'ñ' print(sys.getsizeof(x)) int(x) #throws an error print(sys.getsizeof(x)) Obtenemos 74 ... ñ' y = 'ñ' int(x) print(sys.getsizeof(y)) 77! print(sys.getsizeof('ñ')) int('ñ') print(sys.getsizeof('ñ')) 74, luego 77.

¿Cómo puedo eliminar caracteres que no sean ASCII pero dejar períodos y espacios usando Python?

Estoy trabajando con a .archivo txt. Quiero una cadena del texto del archivo sin caracteres que no sean ASCII. Sin embargo, q ... ómo debo modificar onlyascii() para dejar espacios y puntos? Imagino que no es demasiado complicado pero no puedo entenderlo.

Longitud de cadena en bytes en JavaScript

En mi código JavaScript necesito redactar un mensaje al servidor en este formato: <size in bytes>CRLF <data>CRL ... ongitud en bytes de la cadena ЭЭХ! Naïve? en UTF-8 es de 15 bytes, pero algunos navegadores informan de 23 bytes en su lugar.

¿Debo usar caracteres acentuados en las URL?

Cuando uno crea contenido web en idiomas diferentes al inglés, surge el problema de las URL optimizadas para motores de búsqu ... original, pero me gustaría conocer sus opiniones sobre el uso de URL acentuadas como identificadores de documentos primarios.

Diferencia entre MBCS y UTF-8 en Windows

Estoy leyendo sobre el conjunto de caracteres y las codificaciones en Windows. Noté que hay dos indicadores de compilador en ... codificado con diferentes codificaciones como UTF - 8 y UTF-16. ¿Puede alguien arrojar algo más de luz sobre esta confusión?

¿Por qué el emoji de corazón rojo requiere dos puntos de código, pero los otros corazones de color requieren uno?

Parece que el emoji de corazón rojo (❤️) "\u2764\uFE0F" requiere dos puntos de código Unicode, específicamente Corazón Negro Pesado seguido de un Selector de variación . Sin embargo, azul

Cómo mostrar caracteres UTF-8 en phpMyAdmin?

Tengo mi base de datos correctamente configurada en UTF-8 y estoy tratando con una base de datos que contiene caracteres japo ... ara insertar datos en la base de datos. Voy a abrir una recompensa por esta pregunta, ya que realmente quiero resolver esto.

Caracteres válidos en un nombre de clase Java

¿Qué caracteres son válidos en un nombre de clase Java? ¿Qué otras reglas rigen los nombres de clases Java (por ejemplo, los nombres de clases Java no pueden comenzar con un número)?

Datos SQLite, python, unicode y no utf

Comencé tratando de almacenar cadenas en sqlite usando python, y recibí el mensaje: Sqlite3.Error de programación: Debe ... encodingDemo(x) Muchas gracias por las respuestas a continuación y especialmente a @John Machin por responder tan a fondo.

Ruby 1.9: ¿cómo puedo usar correctamente cadenas multibyte upcase y downcase?

Así que matz tomó la decisión de mantener upcase y downcase limitado a /[A-Z]/i en ruby 1.9.1. ActiveSupport::Multibyte dura ... también probé con ActiveSupport de la corriente master, 2-3-* y 3-0-unstable rails ramifica en GitHub. Los mismos resultados.

Cómo hacer una cadena unicode con python3

Usé esto: u = unicode(text, 'utf-8') Pero obteniendo un error con Python 3 (or... tal vez me olvidé de incluir algo): NameError: global name 'unicode' is not defined Gracias.

¿Cómo se cambia la codificación de caracteres de una base de datos postgres?

Tengo una base de datos que se configuró con el conjunto de caracteres predeterminado SQL_ASCII. Quiero cambiarlo a UNICODE. ¿Hay una manera fácil de hacer eso?

¿Cuándo debemos usar NVARCHAR / NCHAR en lugar de VARCHAR/CHAR en SQL Server?

¿Hay una regla cuando debemos usar los tipos Unicode? He visto que la mayoría de las lenguas europeas (Alemán, Italiano, ... sugiere aqui ¿Cuáles son las principales diferencias de rendimiento entre los tipos de datos varchar y nvarchar SQL Server?

Expresiones regulares de Python que coinciden con propiedades Unicode

Perl y algunos otros motores de expresiones regulares actuales admiten propiedades Unicode, como la categoría, en una expresi ... alguien al tanto de una buena estrategia para conseguir un efecto similar? Las soluciones de cosecha propia son bienvenidas.

Obtener el valor unicode de un carácter

¿Hay alguna manera en Java para que pueda obtener el equivalente Unicode de cualquier carácter? por ejemplo, Supongamos un método getUnicode(char c). Una llamada getUnicode('÷') debe devolver \u00f7.

¿Una manera fácil de eliminar acentos de una cadena Unicode? [duplicar]

Esta pregunta ya tiene una respuesta aquí: ¿Hay alguna manera de deshacerse de los acentos y convertir u ... gEncoding allowLossyConversion:YES]; NSString *newStr = [[NSString alloc] initWithData:data encoding:NSASCIIStringEncoding];