dataframe

Crear datos vacíos.marco

Estoy tratando de inicializar un dato.marco sin filas. Básicamente, quiero especificar los tipos de datos para cada columna y ... es de columna que quería, pero también crea una fila inútil que luego debe eliminarse. ¿Hay una mejor manera de hacer esto?

Convertir lista de diccionarios a Dataframe

Tengo una lista de diccionarios como este: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', ' ... ución que pude encontrar. ¿Cómo puedo convertir la lista de diccionarios en un marco de datos pandas como se muestra arriba?

Selección de varias columnas en un marco de datos pandas

Tengo datos en diferentes columnas pero no se como extraerlos para guardarlos en otra variable. index a b c 1 2 ... ' ¿y guardarlo en df1? Lo intenté df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Ninguno parece funcionar. (Edición menor)

Barajar filas de DataFrame

Tengo el siguiente DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 ... s siguen siendo las mismas. No se si estoy explicando esto claramente. Dejar yo sé si no lo hago. ¿Cómo puedo lograr esto?

R-list to data frame

Tengo una lista anidada de datos. Su longitud es 132 y cada elemento es una lista de longitud 20. ¿Hay una forma rápida de co ... ay algunos datos de muestra para trabajar con: l <- replicate( 132, list(sample(letters, 20)), simplify = FALSE )

Convertir un objeto Pandas GroupBy a DataFrame

Estoy empezando con datos de entrada como este df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory ... eattle 1 1 No puedo ver cómo lograr esto en la documentación de los pandas. Cualquier sugerencia sería bienvenida.

La diferencia entre bracket [] y double bracket [[]] para acceder a los elementos de una lista o dataframe

R proporciona dos métodos diferentes para acceder a los elementos de una lista o datos.frame - los operadores [] y [[]]. ¿Cuál es la diferencia entre los dos? En qué situaciones debo usar uno sobre el otro?

Convertir dict de Python en un dataframe

Tengo un diccionario Python como el siguiente: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11 ... un objeto de serie, pero esto no parece mantener la relación entre las columnas: s = Series(my_dict,index=my_dict.keys())

Extracción de columnas específicas de un marco de datos

Tengo un marco de datos R con 6 columnas, y quiero crear un nuevo marco de datos que solo tenga tres de las columnas. Suponi ... , y E, este es el único comando que puedo averiguar: data.frame(df$A,df$B,df$E) Hay una forma más compacta de hacer esto?

Adición de una nueva columna al DataFrame existente en Python pandas

Tengo el siguiente DataFrame indexado con columnas y filas nombradas con números no continuos: a b ... end, merge, pero no obtuve el resultado que quería, solo errores a lo sumo. ¿Cómo puedo añadir column e al ejemplo anterior?

Soltar columnas del marco de datos por nombre

Tengo un número de columnas que me gustaría eliminar de un marco de datos. Sé que podemos eliminarlos individualmente usando ... iables pueda cambiar. Dado lo poderoso que es R, pensé que podría haber una mejor manera de dejar caer cada columna por una.

Lectura rápida de tablas muy grandes como dataframes

Tengo tablas muy grandes (30 millones de filas) que me gustaría cargar como dataframes en R. read.table() tiene muchas caract ... =0,maxtime=0)))) ¿Hay una mejor manera de hacer esto? ¿O muy posiblemente un enfoque completamente diferente al problema?

¿Cómo obtengo el recuento de filas de un dataframe de Pandas?

Estoy tratando de obtener el número de filas de dataframe df con Pandas, y aquí está mi código. Método 1: total_rows = df. ... con la respuesta dada por @root la mejor manera (la más rápida) de comprobar la longitud del df es llamar: df.shape[0]

Convertir tipo de columna DataFrame de string a datetime

¿Cómo puedo convertir una columna de cadenas DataFrame (en formato dd/mm/aaaa) a datetimes?

Dividir la columna de cadena de marco de datos en varias columnas

Me gustaría tomar datos del formulario before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr ... _2" [[3]] [1] "foo" "bar" [[4]] [1] "foo" "bar_2" Gracias por cualquier sugerencia. No he terminado listas R justo aun.

Construir pandas DataFrame a partir de valores en variables da " ValueError: Si usa todos los valores escalares, debe pasar un índice"

Esta puede ser una pregunta simple, pero no puedo averiguar cómo hacer esto. Digamos que tengo dos variables como sigue. a = ... índice He intentado esto también: df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() Esto da el mismo mensaje de error.

Cómo almacenar un dataframe usando Pandas

Ahora mismo estoy importando un CSV bastante grande como un dataframe cada vez que corro el script. ¿Hay una buena solución p ... e constantemente disponible entre ejecuciones para que no tenga que pasar todo ese tiempo esperando que se ejecute el script?

Título o nombre de la columna del índice Pandas

¿Cómo obtengo el nombre de la columna de índice en python pandas? Aquí hay un ejemplo de dataframe: Column 1 ... Ducks"]} df = pd.DataFrame(data) df.index = df["Index Title"] del df["Index Title"] print df Alguien sabe cómo hacer esto?

Cómo comprobar si existe una columna en Pandas

¿Hay alguna forma de comprobar si existe una columna en un DataFrame de Pandas? Supongamos que tengo el siguiente DataFrame ... A'] + df['C'] Pero primero quiero ver si df['A'] existe, y si no, quiero calcular df['sum'] = df['B'] + df['C'] en su lugar.

¿Cómo hago una lista de marcos de datos?

¿Cómo hago una lista de marcos de datos y cómo puedo acceder a cada uno de esos marcos de datos de la lista? Por ejemplo, ¿ ... me(y1 = c(1, 2, 3), y2 = c(4, 5, 6)) d2 <- data.frame(y1 = c(3, 2, 1), y2 = c(6, 5, 4))