import pandas as pd
data = {
"Title": ("Blade Runner", "2001: a space odyssey", "Alien"),
"Year": (1982, 1968, 1979),
"MPA Rating": ("R","G","R")
}
df = pd.DataFrame(data)
Aplicativos que usam dataframes
Como mencionei anteriormente, quase todas as bibliotecas ou estruturas de ciência de dados suportam algum tipo de estrutura semelhante a um dataframe. A linguagem R é geralmente creditada por popularizar o conceito de dataframe (embora já existisse em outras formas antes disso). Spark, uma das primeiras plataformas amplamente populares para processamento de dados em escala, possui seu próprio sistema de dataframe. A biblioteca de dados Pandas para Python e sua prima Polars, com velocidade otimizada, oferecem dataframes. E o banco de dados analítico DuckDB combina as conveniências dos dataframes com o poder de um sistema de banco de dados completo.
Vale a pena notar que o aplicativo em questão pode suportar formatos de dados de dataframe específicos para esse aplicativo. Por exemplo, Pandas fornece tipos de dados para estruturas de dados esparsas em um dataframe. Por outro lado, o Spark não possui um tipo de dados esparsos explícito, portanto, qualquer dado de formato esparso precisa de uma etapa de conversão adicional para ser usado em um dataframe do Spark.
Para esse fim, embora algumas bibliotecas com dataframes sejam mais populares, não existe uma versão definitiva de um dataframe. Eles são um conceito implementado por muitas aplicações diferentes. Cada implementação de um dataframe é livre para fazer as coisas de maneira diferente, e algumas implementações de dataframe também variam nos detalhes do usuário final.