DataFrames.jl パッケージ

DataFramesパッケージはJuliaパッケージ・システムから入手でき、次のコマンドを使用してインストールできる。

julia> using Pkg

julia> Pkg.add("DataFrames")

DataFrame型のオブジェクトは、データテーブルを一連のベクトルとして表し、それぞれが列または変数に対応する。DataFrameを構築する最も簡単な方法は、キーワード引数またはペアを使用してカラムベクトルを渡すことである。

julia> using DataFrames

julia> df = DataFrame(No = 1:3, Name = ["Sana", "Kokona", "Neo"])
3×2 DataFrame
│ Row │ No    │ Name   │
│     │ Int64 │ String │
├─────┼───────┼────────┤
│ 1   │ 1     │ Sana   │
│ 2   │ 2     │ Kokona │
│ 3   │ 3     │ Neo    │

julia>

カラムはデータフレーム経由で直接アクセスできる。

julia> df.Name
3-element Array{String,1}:
"Sana"
"Kokona"
"Neo"

julia> df."Name"
3-element Array{String,1}:
"Sana"
"Kokona"
"Neo"

julia>

リテラル名ではなく、カラムの名前を保持する変数を渡すこともできる。

julia> col = "Name"
"Name"

julia> df[!, col]
3-element Array{String,1}:
"Sana"
"Kokona"
"Neo"

julia> df[:, col]
3-element Array{String,1}:
"Sana"
"Kokona"
"Neo"

julia>

カラム名は、names関数を使用して文字列として取得できる。

julia> names(df)
2-element Array{String,1}:
"No"
"Name"

julia>

空のデータフレームから開始して、1つずつ列を追加することもできる。

julia> df = DataFrame()
0×0 DataFrame


julia> df.No = 1:3
1:3

julia> df.Name = ["Sana", "Kokona", "Neo"]
3-element Array{String,1}:
"Sana"
"Kokona"
"Neo"

julia> df
3×2 DataFrame
│ Row │ No    │ Name   │
│     │ Int64 │ String │
├─────┼───────┼────────┤
│ 1   │ 1     │ Sana   │
│ 2   │ 2     │ Kokona │
│ 3   │ 3     │ Neo    │

julia>

size()

データフレームの行と列の数は、size関数を使用して確認できる。

julia> size(df)
(3, 2)

julia> size(df, 1)
3

julia> size(df, 2)
2

julia>