carácter regex unicode en vim


Estoy siendo un idiota.

Alguien cortó y pegó un poco de texto de microsoft Word en mis encantadores archivos html.

Ahora tengo estos caracteres unicode en lugar de símbolos de comillas regulares, (es decir, las comillas aparecen como en el texto)

Quiero hacer un reemplazo de expresiones regulares, pero estoy teniendo problemas para seleccionarlos.

:%s/\u92/'/g
:%s/\u5C/'/g
:%s/\x92/'/g
:%s/\x5C/'/g

...todos fallan. Mi google-fu me ha fallado.

Author: Michael Dunn, 2010-06-10

1 answers

Desde :help regexp (ligeramente editado), necesita usar una sintaxis específica para seleccionar caracteres unicode con una expresión regular en Vim:

\%u match specified multibyte character (eg \%u20ac)

Es decir, para buscar el carácter unicode con código hexadecimal 20AC, ingrese esto en su patrón de búsqueda:

\%u20ac

La tabla completa de patrones de búsqueda de caracteres incluye algunas opciones adicionales:

\%d match specified decimal character (eg \%d123)
\%x match specified hex character (eg \%x2a)
\%o match specified octal character (eg \%o040)
\%u match specified multibyte character (eg \%u20ac)
\%U match specified large multibyte character (eg \%U12345678)
 56
Author: michaelmichael,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-18 03:43:13