utf-8

ASCII vs Unicode + UTF-8

Estaba leyendo 'El Mínimo Absoluto' de Joel Spolsky sobre la codificación de caracteres. Tengo entendido que ASCII es un esqu ... os tiempos modernos, usamos Unicode como el esquema de punto de código y UTF-8 como el esquema de codificación. ¿Es correcto?

Método Swift 3 para crear datos codificados en utf8 a partir de una cadena

Sé que hay un montón de preguntas pre Swift3 con respecto a las cosas NSData. Tengo curiosidad por saber cómo pasar de un Swi ... let unterminatedData = Data(bytes: Array(input.utf8)) Tener que hacer la construcción intermedia Array() parece incorrecto.

UTF - 8 en Windows

¿Cómo configuro la página de códigos a UTF-8 en un programa de Windows C? Tengo una biblioteca de terceros que usa fopen ... en UTF-8, sin embargo, la documentación de MSDN para _setmbcp indica que UTF-8 no es compatible. Cómo ¿puedo evitar esto?

UTF - 8 problemas al leer un archivo CSV con fgetcsv

Intento leer un CSV y hacer eco del contenido. Pero el contenido muestra los caracteres incorrectos. Mäx Müstermänn - > ... , file_get_contents("specialchars.csv"))), ';')) Me da Array ( [0] => Mäx [1] => Müstermänn ) , ¿Qué significa?

Número de celdas de caracteres utilizadas por la cadena

Tengo un programa que genera una tabla textual usando cadenas UTF-8, y necesito medir el número de celdas de caracteres monoe ... s utilizadas por una cadena para poder alinearla correctamente. Si es posible, me gustaría hacer esto con funciones estándar.

Cómo obtener ncurses para generar caracteres unicode del plano astral

Tengo la siguiente pieza de código extremadamente simple, que se supone que debe generar (entre otras cosas), tres caracteres ... side of ncurses */ printf("%s\n",buffer); return 0; } El printf final muestra todos los caracteres como esperaba "

Decodificar un encabezado de correo electrónico UTF8

Tengo un asunto de correo electrónico del formulario: =?utf-8?B?T3.....?= El cuerpo del correo electrónico está codificad ... icar el correo electrónico. ¿Cuál es el significado de=?delimitador utf-8 y ¿cómo puedo extraer información de esta cadena?

Script Python para convertir de UTF-8 a ASCII [duplicar]

Esta pregunta ya tiene una respuesta aquí: Convertir Unicode a ASCII sin errores en Python ... gnorar el error con el parámetro ignorar en el método encode. Pero parece que no. Estoy abierto a otras formas de convertir.

Lectura de caracteres utf-8 desde un archivo gzip en python

Estoy tratando de leer un archivo gunzipped (.gz) en python y estoy teniendo algunos problemas. Utilicé el módulo gzip para ... : parsed = string.split(line, u'\u0001') #do some things... line = f.readline() for en in engines: print(en)

¿Cómo puedo determinar la longitud de bytes de una cadena codificada en utf-8 en Python?

Estoy trabajando con cargas de Amazon S3 y tengo problemas con los nombres de las claves que son demasiado largos. S3 limita ... o estoy interesado en la longitud de los caracteres... más bien la longitud real de bytes utilizada para almacenar la cadena.

Cómo eliminar acentos en MySQL?

Acabo de recopilar una base de datos de 1 millón de nombres de lugares. Voy a usarlo en un widget de autocompletar para busca ... án en blanco, por lo que quiero escribir una consulta para completarlos. ¿Es esto posible en MySQL directo? Si es así, ¿cómo?

json encode () ¿cadenas no utf-8?

Así que tengo una matriz de cadenas, y todas las cadenas están utilizando la codificación ANSI predeterminada del sistema y s ... ar de tener que usar utf8_encode () en todas mis cadenas y terminar con cosas como "\u0082"? ¿O es el estándar para json?

Problema de codificación UTF8 - Con buenos ejemplos

Tengo el siguiente problema de codificación de caracteres, de alguna manera he logrado guardar datos con diferente codificaci ... echo "<br />"; 23|24|Cond� Nast Publications 23|21|Cond� Nast Publications 16|20|France Télécom 16|14|France Télécom

Cómo cifrar datos en una cadena UTF-8 usando OpenSSL:: Cipher?

En una aplicación Rails 3.0 (Ruby 1.9.2) estoy tratando de cifrar algunos datos usando algo como esto: cipher = OpenSSL::Ci ... 'utf-8' Encoding::UndefinedConversionError: "\xF7" from ASCII-8BIT to UTF-8 ¿Cómo puedo obtener una cadena cifrada UTF-8?

& nbsp causa un error de validación HTML5

Estoy en el proceso de aplicar un enfoque "HTML4.5" a un sitio estricto XHTML1.0 existente. La idea es cambiar el doctype y a ... etapa. Debo reemplazar &nbsp; con algo? Si es así, ¿qué? Mi conjunto de caracteres en este sitio en particular es UTF-8.

C++ & Boost: codificar / decodificar UTF-8

Estoy tratando de hacer una tarea muy simple: tomar un wstring unicode-aware y convertirlo a un string, codificado como bytes ... algo en ese espíritu... pero a mi entender, debería ser posible con Boost. Un código de ejemplo sería muy apreciado! Gracias

application / x-www-form-urlencoded and charset= "utf-8"?

¿Es costumbre omitir ;charset="utf-8" cuando el Content-type es application/x-www-form-urlencoded? En particular, cuando se ... age: en-US,en;q=0.8 ¿Cuál es la convención para especificar cómo se codifican los valores de los parámetros de formulario?

Cambiar el Sistema de Codificación Predeterminado de Emacs

Mi problema se debe a que Emacs inserta los encabezados del sistema de codificación en archivos fuente que contienen caracter ... n tiene alguna idea? EDITAR: Creo que este problema está específicamente relacionado con ruby-mode. Aún no puedo apagarlo.

Cómo omitir caracteres no válidos en un archivo XML usando PHP

Estoy tratando de analizar un archivo XML usando PHP, pero recibo un mensaje de error: Error del analizador: Char 0x0 fu ... riguar qué hace que el análisis de archivos xml falle. PS es un enorme archivo xml de más de 100M, se hace error de análisis?

Recortar espacios en blanco unicode en PHP 5.2

¿Cómo puedo recortar un string(6) " page", donde el primer espacio en blanco es un espacio 0xc2a0 que no se rompe? He inten ... ar estos caracteres de forma fiable? Parecen estar convertidos a espacios "normales", lo que hace que sea difícil de depurar.