unicode

Cómo convertir una cadena con codificación Unicode a una cadena de letras

Tengo una cadena con codificación Unicode, \uXXXX, y quiero convertirla en una letra regular ( UTF-8). Por ejemplo: String ... on codificación Unicode, y cuando busco los archivos, no puedo encontrarlos, ya que busca un archivo con \uXXXX en su nombre.

¿Por qué Java permite caracteres unicode escapados en el código fuente?

I recientemente aprendí que Unicode está permitido dentro del código fuente de Java no solo como caracteres Unicode (por ej ... son algunos " pros "de esta característica que le han permitido permanecer una parte de Java, a pesar de sus muchos"contras"?

¿Las direcciones de correo electrónico pueden contener caracteres no alfanuméricos?

Estoy construyendo un sitio web usando `Django. El sitio web podría tener usuarios importantes de países de habla no inglesa. ... ¿Se les permite contener alfabetos no ingleses como "é" o "ü"? ¿ Pueden contener chino o japonés o otros caracteres Unicode?

¿Cómo consigo str.traducir para trabajar con cadenas Unicode?

Tengo el siguiente código: import string def translate_non_alphanumerics(to_translate, translate_to='_'): not_letters_or ... Unicode" en los documentos Python 2.6.2 para el str.método translate (). ¿Cómo hago que esto funcione para cadenas Unicode?

Python StringIO reemplazo que funciona con bytes en lugar de cadenas?

¿Hay algún reemplazo para la clase python StringIO, una que funcione con bytes en lugar de cadenas? Puede que no sea obvio, pero si utilizó StringIO para procesar datos binarios, no tendrá suerte con Python 2.7 o posterior.

Uso de Unicode en el código fuente de C++

¿Cuál es la codificación estándar del código fuente de C++? ¿El estándar C++ dice algo al respecto? ¿Puedo escribir código f ... 6 bits o como se llame.) Además, ¿puedo usar Unicode para cadenas? Por ejemplo: Wstring str=L"Strange chars: â Țđ ě €€";

Obtenga una lista de todas las codificaciones a las que Python puede codificar

Estoy escribiendo un script que intentará codificar bytes en muchas codificaciones diferentes en Python 2.6. ¿Hay alguna mane ... (encodinglist(), 2): try: unicode_string = my_unicode_character.encode(encoding1).decode(encoding2) except: pass

¿Cuántos caracteres se pueden asignar con Unicode?

Estoy pidiendo el recuento de todas las posibles combinaciones válidas en Unicode con explicación. Sé que un char puede ser c ... os bytes de continuación tienen restricciones a pesar de que el byte inicial de ese carácter borra cuánto tiempo debería ser.

Cadena de Python a unicode [duplicar]

Posible Duplicado:¿Cómo trato una cadena ASCII como unicode y desescape los caracteres escapados en ella en python?Cómo co ... gt;>> print unicode(a) Hello\u2026 >>> Así que claramente unicode(a) no es el respuesta. Entonces, ¿qué es?

Reparación de codificación UTF8 rota

Estoy en el proceso de arreglar alguna codificación UTF8 incorrecta. Actualmente estoy usando PHP 5 y MySQL En mi base de d ... de función que me ayudará a mapear las instancias deƒ ® ,ƒ ,¼¼ y otras similares a sus caracteres UTF8 acentuados adecuados.

Java regex para soporte Unicode?

Para hacer coincidir la A con la Z, usaremos expresiones regulares: [a-Za-z] ¿Cómo permitir que la expresión regular coincida con los caracteres utf8 introducidos por el usuario? Por ejemplo palabras chinas como {

Python DictWriter escribiendo archivos CSV codificados en UTF-8

Tengo una lista de diccionarios que contienen cadenas unicode. csv.DictWriter puede escribir una lista de diccionarios en ... io de ella, para atrapar los diccionarios desmontados y codificarlos antes de que los escriba en el archivo? No lo entiendo.

¿Cómo comparo una cadena Unicode que tiene diferentes bytes, pero el mismo valor?

Estoy comparando cadenas Unicode entre objetos JSON. Tienen el mismo valor: a = '人口じんこうに膾炙かいしゃする' b = '人口じんこうに膾炙かいしゃする' P ... 3\u3053\u3046\u306b\u81be\uf9fb\u304b\u3044\u3057\u3083\u3059\u308b' ¿Cómo puedo comparar dos cadenas Unicode en su valor?

Diferencia entre el orden de bytes Big Endian y Little Endian

¿Cuál es la diferencia entre el orden de bytes Big Endian y Little Endian ? Ambos parecen estar relacionados con Unicode y UTF16. ¿Dónde exactamente usamos esto?

¿Hay un glifo Unicode que parezca un icono de "llave"? [cerrado]

Unicode tiene un millón de glifos similares a iconos, pero no siempre son fáciles de buscar, ya que no siempre sé cómo se ven ... una "llave"? ¿O hay un símbolo que se usa en círculos de base de datos para significar "clave primaria", que es en Unicode?

Python UnicodeDecodeError - ¿Estoy entendiendo mal la codificación?

¿Alguna idea de por qué esto no está funcionando? Realmente pensé que 'ignorar' haría lo correcto. >>> 'add \x93M ... e input>", line 1, in ? UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 4: ordinal not in range(128)

Convertir CString en const char*

¿Cómo convertir de CString a const char* en mi aplicación MFC Unicode?

Reducción de acento programático en JavaScript (también conocido como normalización de texto o desacentalización)

Necesito comparar 2 cadenas como iguales como estas: Lubeck = = Lübeck En JavaScript. ¿Por qué? Bueno, tengo un campo ... cruel, sus ediciones enloquecieron una respuesta wiki de la comunidad, así que no estoy seguro de si obtendrá la recompensa!)

¿UTF-8 puede contener cero bytes?

¿Puede la cadena UTF-8 contener zerobytes? Voy a enviarlo a través del protocolo ascii de texto plano, ¿debería codificarlo con algo como base64?