Pandas DataFrame: Panduan Detail Lengkap – Codewithaden

Pandas DataFrame adalah salah satu struktur ini yang membantu kita melakukan perhitungan matematika dengan sangat cepat. Bingkai data adalah struktur data dua dimensi. Misalnya, data diselaraskan dengan cara tabular dalam baris dan kolom.

Panda Perpustakaan adalah paket python populer untuk ilmu data dan pembelajaran mesin. Ini menawarkan struktur data yang dominan, ekspresif, dan fleksibel yang membuat manipulasi data dan analisis menjadi mudah, di antara banyak hal lainnya.

Apa itu Pandas DataFrame?

Pandas DataFrame adalah struktur data tabular dua dimensi-mutable, yang berpotensi komposit dengan sumbu berlabel (baris dan kolom). DataFrame dapat berisi tipe data data berikut.

  1. Seri PANDAS: Array berlabel satu dimensi yang mampu menahan tipe data apa pun dengan label atau indeks sumbu. Contoh objek seri adalah satu kolom dari DataFrame.
  2. Ndarray numpy, yang bisa menjadi catatan atau struktur.
  3. Dua dimensi ndarray menggunakan Numpy
  4. Kamus Ndarray satu dimensi, Daftar , Kamus , atau Seri

Cara membuat basis data pandas

Untuk membuat DataFrame PANDAS, gunakan Pandas.DataFrame () konstruktor.

pandas.DataFrame( data, index, columns, dtype, copy) 

Itu data Parameter mengambil formulir seperti ndarray, seri, peta, daftar, dikt, konstanta, dan dataframe lainnya.

Untuk label baris, indeks Parameter untuk bingkai yang dihasilkan adalah np.Arange default opsional (n) jika tidak ada indeks yang diteruskan ke fungsi.

Untuk kolom Label, sintaks default opsional adalah: np.arrange (n). Ini hanya benar jika tidak ada indeks yang dilewati.

Itu dtype adalah tipe data dari setiap kolom.

Itu salinan Parameter adalah untuk menyalin data jika standarnya salah.

Buat DataFrame kosong di Python

Ke membuat kosong DataFrame di Panda , menggunakan PD.DataFrame () fungsi tanpa argumen apa pun.

Mari kita lihat contoh berikut.

# app.py

import pandas as pd
df1 = pd.DataFrame()
print(df1) 

Lihat output di bawah ini.

Python

Buat DataFrame dari Ndarrays

Mari kita buat DataFrame dari Numpy Ndarrays.

# app.py

import pandas as pd
import numpy as np

data = np.array([18, 19, 21])
df1 = pd.DataFrame(data, index=[1, 2, 3])
print(df1) 

Dalam contoh di atas, kami telah membuat data dari Numpy Ndarray dan kemudian meneruskannya ke fungsi DataFrame untuk membangun DataFrame

Lihat outputnya.

Create

Mari kita tambahkan kolom untuk membuat tabel lengkap di DataFrame. Lihat contoh di bawah ini.

# app.py

import pandas as pd
import numpy as np

data = np.array([['Game Of Thrones', 'HBO'], 
                ['Stranger Things', 'Netflix'],
                ['Casual', 'Hulu']])
df1 = pd.DataFrame(data, index=[1, 2, 3], columns=['Show Name', 'Streaming Service'])
print(df1) 

Oke, jadi kami telah menambahkan dua kolom, Nama menunjukkan, dan Layanan streaming.

Lihat outputnya.

How

Buat DataFrame dari Kamus

Mari kita buat basis data menggunakan kamus.

# app.py

import pandas as pd
import numpy as np

data = {'Show Name': ['GameOfThrones', 'StrangerThings', 'Casual'], 
        'Streaming Service': ['HBO', 'Netflix', 'Hulu']}
df1 = pd.DataFrame(data)
print(df1) 

Lihat output di bawah ini.

Create

Buat DataFrame dari serial ini

Mari kita buat basis data dari seri.

# app.py

import pandas as pd
import numpy as np

data = {'name' : 'krunal', 'website' : 'appdividend.com', 'role' : 'author'}
series = pd.Series(data)
df1 = pd.DataFrame(series)
print(df1) 

Lihat output di bawah ini.

Create

Menambahkan kolom ke DataFrame Anda

Mari kita ambil contoh di mana kita dapat menambahkan kolom ke DataFrame.

# app.py

import pandas as pd
import numpy as np

data = {'age': [18, 19, 21], 'name': ['krunal', 'ankit', 'tejash']}
df1 = pd.DataFrame(data, index=[1, 2, 3])
print('Before column added')
print(df1)
df1['education'] = ['BE', 'MCA', 'MBA']
print('After column added')
print(df1) 

Dalam contoh di atas, kami telah menambahkan satu kolom lagi yang disebut pendidikan .

Lihat output di bawah ini.

Adding

Menghapus kolom ke DataFrame Anda

Lihat contoh berikut di mana kami telah menghapus satu kolom dari DataFrame.

# app.py

import pandas as pd
import numpy as np

data = {'age': [18, 19, 21], 
        'name': ['krunal', 'ankit', 'tejash'],
        'education': ['BE', 'MCA', 'MBA']
        }
df1 = pd.DataFrame(data, index=[1, 2, 3])
print('After column deleted')
del df1['education']
print(df1) 

Kami telah menghapus pendidikan menggunakan kolom del fungsi dalam contoh di atas.

Lihat output di bawah ini.

Removing

Menambahkan Baris ke DataFrame Anda

Kita dapat menambahkan baris baru ke dataframe menggunakan menambahkan() fungsi.

Fungsi append () akan menambahkan baris di akhir. Mari kita lihat contoh berikut.

# app.py

import pandas as pd
import numpy as np

data = {'age': [18, 19, 21], 
        'name': ['krunal', 'ankit', 'tejash'],
        'education': ['BE', 'MCA', 'MBA']
        }
df1 = pd.DataFrame(data, index=[1, 2, 3])
print('Before row added')
print(df1)

data2 = {'age': 22, 'name': 'rushabh', 'education': 'CA'}
df2 = pd.DataFrame(data2, index=[4])
print('After row added')
dfAdd = df1.append(df2)
print(dfAdd) 

Dalam contoh di atas, kami telah mendefinisikan DF1 DataFrame dan DF2 DataFrame

Tujuan kami adalah menambahkan baris ke DataFrame pertama.

Untuk konteks yang ditambahkan, setiap bingkai data di sini berfungsi sebagai baris. Jadi kita dapat menambahkan DataFrame ke DataFrame lain yang dihitung sebagai baris tambahan ke baris lain.

Jadi, untuk menambahkan baris, kita perlu menambahkan DataFrame ke DataFrame lain.

DataFrame yang dihasilkan adalah penambahan kedua DataFrames. Dalam contoh di atas, dfadd adalah DataFrame terakhir yang merupakan penambahan dari DataR Rame sebelumnya.

Lihat output di bawah ini.

Adding

Menghapus Baris ke DataFrame Anda

Kami dapat menghapus baris menggunakan label indeks atau drop rows dari DataFrame. Jika label digandakan, maka beberapa baris akan dijatuhkan.

Mari kita lihat contoh di mana kita menjatuhkan baris menggunakan indeks.

# app.py

import pandas as pd
import numpy as np

data = {'age': [18, 19, 21], 
        'name': ['krunal', 'ankit', 'tejash'],
        'education': ['BE', 'MCA', 'MBA']
        }
df1 = pd.DataFrame(data, index=[1, 2, 3])
print('Before row deleted')
print(df1)
print('After row deleted')
df2 = df1.drop(2)
print(df2)
 

Dalam contoh di atas, kami menghapus baris yang indeksnya 2.

Lihat output di bawah ini.

Deleting

Itu untuk tutorial ini.

Artikel ini berasal dari website Winpoin, dan kemudian diterjemahkan ke bahasa indonesia, baca artikel asli disini

Leave a Reply

Your email address will not be published. Required fields are marked *