missing-data

Elimine filas con todos o algunos NAS (valores faltantes) en los datos.marco

Me gustaría eliminar las líneas en este marco de datos que: A) contiene NA s en todas las columnas. A continuación se muest ... ENSG00000199674 0 2 2 2 2 4 ENSG00000207604 0 NA NA 1 2 6 ENSG00000221312 0 1 2 3 2

Forma elegante de reportar valores faltantes en un dato.marco

Aquí hay un pequeño fragmento de código que escribí para reportar variables con valores faltantes de un marco de datos. Esto ... con datos.marcos con docenas a cientos de variables, por lo que es clave que solo reportemos variables con valores faltantes.

str.format() eleva KeyError

El siguiente código plantea una excepción KeyError: addr_list_formatted = [] addr_list_idx = 0 for addr in addr_list: # ad ... amedir" "str" "address" "{1}" } """.format(addr_list_idx, addr)) ¿Por qué? Estoy usando Python 3.1.

python format string argumentos con nombre no utilizados

Digamos que tengo: action = '{bond}, {james} {bond}'.format(bond='bond', james='james') Esta salida wil: 'bond, james b ... jelo solo (pero analice otros) compare la cadena de formato con los argumentos con nombre disponibles, si faltan, agregue

Eliminar filas con valores en blanco en una columna en particular

Estoy trabajando en un conjunto de datos grande, con algunas filas con NAs y otras con espacios en blanco: df <- data.fr ... - df[-which(is.na(df$start_pc)), ] ... para eliminar el NAs - ¿hay un comando similar para eliminar los espacios en blanco?

¿Cuál es la diferencia entre y NA?

Tengo un factor llamado HUMO con niveles "Y" y "N". Los valores faltantes fueron reemplazados por NA (desde el nivel inicial ... mo esto: head(SMOKE) N N <NA> Y Y N Levels: Y N ¿Por qué se muestra R NA como <NA>? ¿Y hay alguna diferencia?

Cómo minúsculas una columna de cadena de python dataframe si tiene valores faltantes?

El siguiente código no funciona. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x'] ... bo ajustarlo para obtener xLower = ['uno','dos',np.nan]? La eficiencia es importante ya que el marco de datos real es enorme.

Insertar filas para fechas/horas faltantes

Soy nuevo en R pero he recurrido a él para resolver un problema con un conjunto de datos grande que estoy tratando de procesa ... cualquier ayuda sería muy apreciada. Hasta ahora he instalado chron y zoo, ya que parece que podrían ser utilidad. Gracias!

Reemplazar los valores faltantes con la media de la columna

No estoy seguro de cómo hacer un bucle sobre cada columna para reemplazar los valores NA con la media de la columna. Cuando e ... [is.na(data[i])] <- round(mean(data[i], na.rm = TRUE)) } Los valores no se sustituyen. ¿Puede alguien ayudarme con esto?

Valores faltantes en scikits machine learning

¿Es posible que falten valores en scikit-learn ? ¿Cómo deben estar representados? No pude encontrar ninguna documentación sobre eso.

Python, Pandas: Devuelve solo aquellas filas que tienen valores faltantes

Mientras se trabaja en Pandas en Python... Estoy trabajando con un conjunto de datos que contiene algunos valores faltantes, ... ineficiente "mira para ver qué índice no está en el dataframe sin los valores faltantes, luego haz un df con esos índices.")

Sustitución del NAs en R por el valor más cercano

Estoy buscando algo similar a na.locf() en el paquete zoo, pero en lugar de usar siempre el valor anterior no-NA me gustaría ... resulta que vamos en una dirección diferente en conjunto, pero esto seguía siendo una discusión interesante. Gracias a todos!