utf-8

Escribir cadena UTF-8 en MySQL con Python

Estoy tratando de enviar los datos de la cuenta de usuario de un Active Directory a nuestro servidor MySQL. Esto funciona per ... usando PHP directamente. Información adicional: Estoy usando MySQLdb; La codificación de tabla y columna es utf8_general_ci

Codificación de Windows-1252 a UTF-8

He copiado ciertos archivos de una máquina Windows a una máquina Linux. Por lo tanto, todos los archivos codificados de Windo ... e myfile.txt es en realidad windows-1252 codificado y no UTF-8 codificado. De lo contrario, creo que esto dañaría el archivo.

¿Cómo comprobar si la letra es superior o inferior en PHP?

Tengo textos en UTF-8 con caracteres diacríticos también, y me gustaría comprobar si la primera letra de este texto es mayúscula o minúscula. Cómo hacer esto?

¿Cómo puedo evitar poner el comentario magic encoding encima de cada archivo UTF-8 en Ruby 1.9?

Tengo un proyecto Rails con muchas cadenas cirílicas. Funcionó bien en Ruby 1.8, pero Ruby 1.9 asume que los archivos fuent ... mente la directiva encoding: UTF-8 en los archivos Ruby 1.9" que añade automáticamente la directiva encoding si es necesaria.

Javascript: Cadena Unicode a hexadecimal

Estoy tratando de convertir una cadena unicode a una representación hexadecimal en javascript. Esto es lo que tengo: funct ... a en caracteres unicode, como el chino; Entrada: 漢字 Salida: ªo " [W ¿Alguna idea? Se puede hacer esto en javascript?

¿Cuál es la expresión regular para extraer todos los emojis de una cadena?

Tengo una cadena codificada en UTF-8. Por ejemplo: Thats a nice joke

Adivinar la codificación del texto representado como byte [] en Java

Dada una matriz de bytes que representan texto en alguna codificación desconocida (generalmente UTF-8 o ISO-8859-1, pero no n ... etección obviamente no será 100% correcto. Si el algoritmo es correcto en más del 80% de los casos es bueno suficientemente.

¿Qué es un conjunto de caracteres multibyte?

¿El término multibyte se refiere a un conjunto de caracteres cuyos caracteres pueden - pero no tienen que ser - más anchos q ... s que 1 byte (por ejemplo, UTF-16) ? En otras palabras: ¿Qué significa si alguien habla de conjuntos de caracteres multibyte?

preg match y UTF-8 en PHP

Estoy tratando de buscar una cadena codificada en UTF8 usando preg_match. preg_match('/H/u', "\xC2\xA1Hola!", $a_matches, P ... _encoding = UTF-8 mbstring.http_input = pass mbstring.http_output = pass mbstring.encoding_translation = Off ¿Alguna idea?

Cómo convertir cadena UTF8 a matriz de bytes?

La función .charCodeAt regresa con el código unicode del carácter. Pero me gustaría obtener la matriz de bytes en su lugar. L ... carácter se almacena en dos o más bytes. var arr=[]; for(var i=0; i<str.length; i++) { arr.push(str.charCodeAt(i)) }

¿Cómo cambiar todas las tablas de mi base de datos al conjunto de caracteres UTF8?

Mi base de datos no está en UTF8, y me gustaría convertir todas las tablas a UTF8, ¿cómo puedo hacer esto?

Uso de caracteres utf-8 en una plantilla Jinja2

Estoy tratando de usar caracteres utf-8 al renderizar una plantilla con Jinja2. Así es como se ve mi plantilla: <!DOCTYP ... n me aseguré de que mi plantilla sea un archivo UTF-8, pero no hizo ninguna diferencia. ¿Alguna idea sobre cómo hacer esto?

Utf8 general ci o utf8mb4 o ut?

Utf16 o utf32? Estoy tratando de almacenar contenido en muchos idiomas. Algunos de los idiomas utilizan fuentes de doble an ... seguro de qué tipo de base de datos debería usar. Cualquier información sobre las diferencias entre estos cuatro charsets...

¿Es necesario" SET CHARACTER SET utf8"?

Estoy reescribiendo nuestra clase de base de datos (basada en PDO), y me quedé atascado en esto. Se me ha enseñado a usar SET ... quiero usar el parámetro PDO::MYSQL_ATTR_INIT_COMMAND, pero solo admite una consulta. ¿Es necesario SET CHARACTER SET utf8?

¿Cuál es la diferencia entre EM Dash #151; y #8212;?

Tengo un archivo ASCII que contiene un guion EM (- o &mdash; en HTML). El valor hexadecimal es 0x97. Cuando pasamos este ... ía que estas aplicaciones convirtieran estos caracteres de manera diferente? Es quizás una configuración de página de código?

unicode() vs str.decode () para una cadena de bytes codificada en utf8 (python 2.x)

¿Hay alguna razón para preferir unicode(somestring, 'utf8') en lugar de somestring.decode('utf8')? Mi único pensamiento es que .decode() es un método enlazado para que python pueda resolverlo de manera más eficiente, pero corrígeme si me equivoco.

Objeto Java BufferedWriter con utf-8

Tengo el siguiente código y quiero que el outputstream use utf-8. Básicamente tengo caracteres como é que aparecen como & ... Location + "Output.xml")); ¿Es posible definir este objeto como UTF-8 sin tener que usar el OutputStreamWriter? Gracias,

solicitud.getQueryString () parece necesitar alguna codificación

Tengo algún problema con UTF-8. Mi cliente (realizado en GWT) hace una solicitud a mi servlet, con algunos parámetros en la U ... ttp://localhost:8080/servlet?param=cos%C3%AC ¿Qué puedo hacer para configurar correctamente la codificación de caracteres?

¿Hay alguna razón para preferir UTF-16 sobre UTF-8?

Examinando los atributos de UTF-16 y UTF-8, no puedo encontrar ninguna razón para preferir UTF-16. Sin embargo, al revisar J ... n? EDITAR: Mientras tanto también he encontrado esta respuesta, que parece relevante y tiene algunos enlaces interesantes.

Rango de caracteres UTF-8 en C++11 Regex

Esta pregunta es una extensión de ¿Funcionan las expresiones regulares de C++11 con cadenas UTF-8? #include <regex> ... na manera, [a-z]{1} y [a-z]+ coincide con a, pero solo [一-龠々〆ヵヶ]+ coincide con cualquiera de los caracteres, no [一-龠々〆ヵヶ]{1}.