utf-8

Almacenar una cadena como UTF8 en C#

Estoy haciendo mucha manipulación de cadenas en C#, y realmente necesito que las cadenas se almacenen un byte por carácter. E ... Sistema.Cadena de almacenamiento interno de datos como UTF8 que no he notado, o de alguna otra manera alrededor del problema?

Análisis CSV de Ruby / Rails, secuencia de bytes no válida en UTF-8

Estoy tratando de analizar un archivo CSV generado a partir de una hoja de cálculo de Excel. Aquí está mi código require 'c ... 8859-1 (Latin-1) y no en UTF-8 Puede alguien ayudarme con una solución para este problema, por favor Gracias de antemano.

¿Cómo leer archivos de texto con codificación ANSI y letras no inglesas?

Tengo un archivo que contiene caracteres no ingleses y se guardó en codificación ANSI usando una página de código no inglesa. ... emano, lo cual no es posible. sr=new StreamReader(@"C:\APPLICATIONS.xml",Encoding.GetEncoding(1252)); ags = sr.ReadToEnd();

UTF8 vs UTF16 vs char* frente a qué? ¡Que alguien me explique este desastre!

Me las he arreglado para ignorar en su mayoría todas estas cosas de caracteres multi-byte, pero ahora necesito hacer un poco ... izar mis aplicaciones? Qué tipos debo usar (uso. Net y C / C++, y necesito esta respuesta tanto para Unix como para Windows).

Calcular la longitud en UTF-8 de la cadena Java sin codificarla

¿Alguien sabe si la biblioteca Java estándar (cualquier versión) proporciona un medio para calcular la longitud de la codifi ... string".getBytes("UTF-8").length Necesito calcular un prefijo de longitud para mensajes serializados potencialmente largos.

Forzar la codificación vectorial de caracteres de "desconocido" a "UTF-8" en R

Tengo un problema con codificación inconsistente del vector de caracteres en R. El archivo de texto del que leo una tabla ... loaded via a namespace (and not attached): [1] plyr_1.8.1 Rcpp_0.11.1 reshape2_1.2.2 stringr_0.6.2 tools_3.0.3

Ruby on Rails 3, codificaciones de caracteres incompatibles: UTF-8 y ASCII-8BIT con i18n

Tengo algunos problemas con el par de Rails 3.0.1, Ruby 1.9.2 y mi localización de sitio web. El problema es bastante simple ... una manera de utilizar mis archivos de traducción UTF-8. Hizo algunos ¿sabe cómo hacer que funcione ? Gracias por su ayuda.

Sustitución de caracteres acentuados por caracteres ascii simples [duplicar]

Esta pregunta ya tiene una respuesta aquí: ¿Reemplazar eficientemente todos los caracteres acentuados en ... os con su equivalente "simple", por ejemplo, turn á, á en a, y ç en c, etc. Hay una manera fácil de hacer esto en javascript?

Cómo iterar cadena UTF-8 en PHP?

¿Cómo iterar una cadena UTF-8 carácter por carácter usando indexación? Cuando se accede a una cadena UTF-8 con el operador ... 1, 1) = "ą" mb_substr($str, 2, 1) = "t" ¿Hay otra forma de interceder la cadena carácter por carácter sin usar mb_substr?

Unicode en PDF

Mi programa genera documentos PDF relativamente simples a petición, pero estoy teniendo problemas con los caracteres unicode, ... a lección es, cuando se enfrentan a algo que parece inútilmente difícil, buscar a alguien que sabe más al respecto que usted.

Bytes en una cadena Python unicode

En Python 2, las cadenas Unicode pueden contener tanto unicode como bytes: a = u'\u0420\u0443\u0441\u0441\u043a\u0438\u0439 ... ebido a su uso de eval, repr, y luego regex'ing adicional de la representación de cadena unicode. ¿Hay una manera más limpia?

Hacer que git diff muestre correctamente los caracteres codificados en UTF8

Tengo un archivo con caracteres suecos en él (åäö) codificado con UTF8. Si Yo cat el archivo se muestra bien, pero si lo hag ... lucionarse en la versión 1.7.10 de git. Tengo versión 1.8.1.2 ¿Qué puedo hacer para que git diff muestre correctamente åäö?

Detección de caracteres rotos utf8 en MySQL

Tengo una base de datos con un montón de caracteres utf8 rotos repartidos en varias tablas. La lista de personajes no es muy ... ñ = ñ á = Á ¿Alguna idea de cómo hacer que esta SELECCIÓN funcione según lo previsto? (una búsqueda binaria o algo así)

Si el código fuente se guarda en formato UTF-8

¿Qué importancia tiene guardar el código fuente en formato UTF-8? Eclipse en Windows utiliza la codificación de caracteres ... Para encontrar la mejor práctica, cuando pregunte por qué deberíamos usar UTF-8, tengo una buena respuesta, ahora mismo no.

Forzar cadenas a UTF-8 desde cualquier codificación

En mi aplicación rails estoy trabajando con feeds RSS de todo el mundo, y algunos feeds tienen enlaces que no están en UTF-8. ... a usarlos en otras partes de la aplicación, deben estar en UTF-8. ¿Cómo puedo detectar la codificación y convertir a UTF-8?

Python - ¿Cómo enviar e-mail a utf-8?

Cómo enviar utf8 e-mail por favor? import sys import smtplib import email import re from email.mime.multipart import MIMEM ... odeEncodeError: 'ascii' codec > > can't encode character '\u011b' in > position 385: ordinal not in > range(128)

Forzar a XDocument a escribir en Cadena con codificación UTF-8

Quiero poder escribir XML en una cadena con la declaración y con codificación UTF-8. Esto parece muy difícil de lograr. He ... .Flush(); StreamReader sr = new StreamReader(ms); ms.Seek(0, SeekOrigin.Begin); String blah = sr.ReadToEnd(); }

Rails 3 caracteres multibyte inválidos (US-ASCII)

He encontrado un post similar aquí pero no puedo resolver el problema de todos modos. Tengo esto /home/fra/siti/Pensiero/ ... da charachter "e" con el acento como "è é " Traté de poner comentario mágico # coding: utf-8 pero no funciona Alguna idea?

Python-detecta charset y convierte a utf-8 [duplicar]

Esta pregunta ya tiene una respuesta aquí: Determinar la codificación del texto en Python ... uario etiquetas IPTC y no tienen codificación conocida. Necesito detectarlo y luego cambiarlo a utf-8. Alguien puede ayudar?

Cómo hacer que python 3 print () utf8

¿Cómo puedo convertir python 3 (3.1) print("Some text") en stdout en UTF-8, o cómo generar bytes raw? Test.py TestText = ... imprime muy bien ü (en UTF-8, [xC3][xBC]) y sin errores:) Ahora estoy buscando tal vez una mejor solución si hay alguna...