text-mining

¿Qué es "entropía y ganancia de información"?

Estoy leyendo este libro (NLTK) y es confuso. La entropía se define como : La entropía es la suma de la probabilidad ... edo aplicar entropía y entropía máxima en términos de minería de texto? ¿Puede alguien darme un ejemplo sencillo (visual)?

¿Qué es el formato de datos CONL?

Soy nuevo en la minería de texto. Estoy usando un jar de código abierto (Parser Mate) que me da salida en un formato de CoNDL ... to de datos CONL. ¿Puede alguien ayudarme a entender el formato de datos de CONL?? Cualquier tipo de consejo sería apreciado.

Detectar lenguaje de texto en R

En R tengo una lista de tweets y me gustaría mantener solo los que están en inglés. Me pregunto si alguno de ustedes conoce un paquete R que proporciona una forma sencilla de identificar el lenguaje de una cadena. Saludos, z

¿Hay API para análisis de texto/minería en Java? [cerrado]

Quiero saber si hay una API para hacer análisis de texto en Java. Algo que puede extraer todas las palabras en un texto, pala ... Hay API para el análisis de texto en Java? EDIT: Text-mining, quiero minar el texto. Una API para Java que proporciona esto.