unicode

Guardar textos utf-8 en json.volcados como UTF8, no como secuencia de escape u

Código de ejemplo: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_strin ... cii=False, encoding='utf8') >>> print json.loads(s)['1'] ברי צקלה >>> print json.loads(s)['2'] ××¨× ×¦×§××

Cómo convertir wstring en cadena?

La pregunta es cómo convertir wstring a string? Tengo el siguiente ejemplo: #include <string> #include <iostream& ... Hello std::stringstream = 0x860283c Por lo tanto, el stringstream no se puede usar para convertir wstring en cadena.

Reemplazar caracteres no ASCII con un solo espacio

Necesito reemplazar todos los caracteres no ASCII (\x00-\x7F) con un espacio. Me sorprende que esto no sea del todo fácil en ... mplazo como se opuso a a pelar, y además de la dirección de todos los caracteres que no son ascii no un carácter específico.

¿Escribir texto Unicode en un archivo de texto?

Estoy extrayendo datos de un documento de Google, procesándolos y escribiéndolos en un archivo (que eventualmente pegaré en u ... o de texto real, veo muchos símbolos como: Qur‚Äôan ¿Tal vez necesito escribir en algo que no sea un archivo de texto?

¿Cómo puedo comprobar si una cadena es unicode o ascii?

¿Qué tengo que hacer en Python para averiguar qué codificación?

Unicode (UTF-8) lectura y escritura en archivos en Python

Estoy teniendo algún fallo cerebral en la comprensión de la lectura y escritura de texto en un archivo (Python 2.4). # The s ... 1n"' >>> print >> file('f3','w'), simplejson.dumps(ss) >>> simplejson.load(open('f3')) u'Capit\xe1n'

UnicodeDecodeError, byte de continuación no válido

¿Por qué falla el siguiente elemento? ¿y por qué tiene éxito con el códec" latin-1"? o = "a test of \xe9 char" #I want this ... code(input, errors, True) UnicodeDecodeError: 'utf8' codec can't decode byte 0xe9 in position 10: invalid continuation byte

¿Cuál es la diferencia entre codificar/decodificar?

Nunca he estado seguro de entender la diferencia entre str/unicode decodificar y codificar. Sé que str().decode() es para cu ... respuestas dan información sobre lo que .encode hace en una cadena, pero nadie parece saber lo que .decode hace para unicode.

¿Para qué sirve el snowman param en Ruby on Rails 3 forms?

En Ruby on Rails 3 (actualmente usando Beta 4), veo que al usar los ayudantes form_tag o form_for hay un campo oculto llamado _snowman con el valor de Unic (Unicode \x9731) apareciendo. Entonces, ¿para qué es esto?

¿Cómo comprobar si una cadena en Python está en ASCII?

Quiero comprobar si una cadena está en ASCII o no. Soy consciente de ord(), sin embargo cuando intento ord('é'), he TypeErro ... es causada por la forma en que construí Python (como se explica en ord()'s documentation). ¿Hay otra manera de comprobar?

Diferencias de formato Unicode, UTF, ASCII, ANSI

¿Cuál es la diferencia entre el Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, y ANSI codificaciones? ¿De qué manera son útiles para los programadores?

¿Hay un símbolo de glifo Unicode para representar "Búsqueda" [cerrado]

Unicode tiene un millón de glifos similares a iconos, pero son muy difíciles de buscar. ¿Hay un glifo Unicode que parezca un "Binocular" o una "lupa"? ¿O hay un símbolo que se utiliza para significar "Búsqueda", que está en Unicode?

UnicodeDecodeError al leer un archivo CSV en Pandas con Python

Estoy ejecutando un programa que está procesando 30.000 archivos similares. Un número aleatorio de ellos se detiene y produce ... n de estos archivos todos vienen del mismo lugar. ¿Cuál es la mejor manera de corregir esto para proceder con la importación?

Diferencia entre BYTE y CHAR en tipos de datos de columna

En Oracle, ¿cuál es la diferencia entre: CREATE TABLE CLIENT ( NAME VARCHAR2(11 BYTE), ID_CLIENT NUMBER ) Y CREATE TABLE CLIENT ( NAME VARCHAR2(11 CHAR), -- or even VARCHAR2(11) ID_CLIENT NUMBER )

¿Qué hacen exactamente las banderas de cadena" u "y" r", y qué son los literales de cadena sin procesar?

Mientras hacía esta pregunta, me di cuenta de que no sabía mucho sobre cadenas sin procesar. Para alguien que dice ser entre ... cierto, si su sistema y su conjunto de caracteres de editor de texto están configurados en UTF-8, ¿u'' realmente hace algo?

Cómo convertir una cadena a utf-8 en Python

Tengo un navegador que envía caracteres utf-8 a mi servidor Python, pero cuando lo recupero de la cadena de consulta, la codi ... La cadena pasada desde la web ya está codificada en UTF-8, solo quiero hacer que Python la trate como UTF-8 y no como ASCII.

Diferencia entre Char.IsDigit() y Char.IsNumber() en C#

¿Cuál es la diferencia entre Char.IsDigit() y Char.IsNumber() en C#?

Diferencia entre UTF-8 y UTF-16?

¿Diferencia entre UTF - 8 y UTF-16? ¿Por qué necesitamos esto? MessageDigest md = MessageDigest.getInstance("SHA-256"); Str ... = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

Error de MySQL "valor de cadena incorrecto" al guardar cadena unicode en Django

Recibí un mensaje de error extraño cuando intenté guardar first_name, last_name en el modelo auth_user de Django. Ejemplos f ... -4 ¿Significa que unicode char tiene maxlen de 4 bytes en PostgreSQL pero 3 bytes en MySQL que causaron el error anterior?

(grep) Regex para que coincida con caracteres no ASCII?

En Linux, tengo un directorio con muchos archivos. Algunos de ellos tienen caracteres no ASCII, pero todos son válidos UTF-8. ... , como Perl, sed, AWK, etc. Sin embargo, ¿hay una expresión regular para 'cualquier carácter que no sea un carácter ASCII'?