Pandas DataFrame Transform: Panduan Lengkap – Codewithaden

Metode PANDAS DataFrame Transform () memanggil fungsi pada dirinya sendiri, menghasilkan DataFrame dengan nilai -nilai yang ditransformasikan yang memiliki panjang sumbu yang sama pada bingkai data awal. Fungsi transform () sangat berguna saat Anda ingin memanipulasi baris atau kolom.

Pandas DataFrame Transform

Pandas DataFrame Transform () adalah metode inbuilt yang menyebut fungsi yang memproduksi sendiri a DataFrame dengan nilai yang diubah, dan itu memiliki panjang sumbu yang sama dengan diri sendiri. Transformasi adalah operasi yang digunakan bersamaan dengan a groupby Metode (yang merupakan salah satu operasi paling berguna dalam panda).

Hampir, pengguna panda kemungkinan telah menggunakan agregat, Saring , atau berlaku dengan groupby t o Ringkas data. Namun, metode Transform () sedikit lebih menantang untuk dipahami, terutama berasal dari dunia Excel.

Untuk mengimpor dan membaca file Excel di Python, gunakan Panda read_excel () metode. Fungsi read_excel () adalah membaca data lembar excel ke objek DataFrame. Itu diwakili dalam tampilan tabel dua dimensi.

Pandas Transform vs. Pandas Agregat

Sementara agregasi harus mengembalikan versi data yang dikurangi, transformasi dapat mengembalikan beberapa versi transformasi dari data lengkap untuk bergabung kembali.

Untuk transformasi seperti itu, output adalah bentuk yang sama dengan input. Contoh umum adalah memusatkan data dengan mengurangi rata-rata kelompok-bijaksana.

Perbedaan antara Fungsi Terapkan dan Transformasi

Fungsi Apply () mengirimkan salinan lengkap dari DataFrame untuk dikerjakan sehingga kami dapat memanipulasi semua baris atau kolom secara bersamaan.

Fungsi transform () memanipulasi satu baris atau kolom berdasarkan nilai sumbu dan tidak memanipulasi seluruh data. Jadi, kita dapat menggunakan fungsi apply () atau transform () tergantung pada persyaratan.

Mari kita lihat sintaks metode df.transform ().

Sintaksis

DataFrame.transform(func, axis=0, *args, **kwargs)
 

Parameter

Ini memiliki empat parameter, yang secara singkat didefinisikan di bawah ini.

  1. fungsi : Ini adalah fungsi, string, daftar, atau kamus. Ini adalah fungsi yang digunakan untuk mengubah data.
  2. sumbu : Dibutuhkan 0 atau 1. jika 0 (juga disebut ‘indeks’) mereka fungsi diterapkan untuk setiap kolom. Jika 1 (juga disebut ‘kolom’), maka fungsi diterapkan untuk setiap baris.
  3. *args : Ini adalah argumen posisi yang diteruskan ke fungsi.
  4. ** kwargs : Ini adalah argumen kata kunci yang harus dilewati untuk berfungsi.

Nilai pengembalian

Fungsi Transform () mengembalikan DataFrame yang diubah.

Contoh program di pandas.dataframe.transform ()

Tulis program untuk menunjukkan karya pandaframe.transform ().

import pandas as pd
df = pd.DataFrame({"A": [3, 4, 5, 6, 7],
                   "B": [8, 9, 10, 11, 12],
                   "C": [13, 64, 74, 23, 76],
                   "D": [53, 35, 64, 76, 85]})

print(df)
resultdf = df.transform(func=lambda x: x + 2)
print("\nDataFrame after being transformed:\n")
print("\n", resultdf)
 

Keluaran

  A   B   C   D
0  3   8  13  53
1  4   9  64  35
2  5  10  74  64
3  6  11  23  76
4  7  12  76  85

DataFrame after being transformed:


    A   B   C   D
0  5  10  15  55
1  6  11  66  37
2  7  12  76  66
3  8  13  25  78
4  9  14  78  87 

Dalam kode di atas, kami telah melihat bahwa kami telah membuat dataframe, lalu Mengubah DataFrame dengan menambahkan 2 ke setiap elemen DataFrame dan mencetak DataFrame yang diubah.

Tulis program untuk melipatgandakan setiap elemen DataFrame dengan 5 dan kemudian cetak DataFrame yang dihasilkan.

Lihat kode berikut.

import pandas as pd

df = pd.DataFrame({"A": [3, 4, 5, 6, 7],
                   "B": [8, 9, 10, 11, 12],
                   "C": [13, 64, 74, 23, 76],
                   "D": [53, 35, 64, 76, 85]})

print(df)
resultdf = df.transform(func=lambda x: x*5)
print("\nDataFrame after being transformed:\n")
print("\n", resultdf) 

Keluaran

A   B   C   D
0  3   8  13  53
1  4   9  64  35
2  5  10  74  64
3  6  11  23  76
4  7  12  76  85

DataFrame after being transformed:


     A   B    C    D
0  15  40   65  265
1  20  45  320  175
2  25  50  370  320
3  30  55  115  380
4  35  60  380  425 

Dalam contoh di atas, kita telah melihat bahwa kita telah membuat dataframe, lalu t Ransformed DataFrame dengan mengalikan setiap elemen dengan 5 dari DataFrame dan mencetak DataFrame yang diubah.

Pandas DataFrame dan Numpy

Mari kita buat DataFrame dari array Numpy dan gunakan fungsi Transform ().

import pandas as pd
import numpy as np

df = pd.DataFrame(
    np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]), columns=['a', 'b', 'c'])

print(df)
resultdf = df.transform(func=lambda x: x*5)
print("\nDataFrame after being transformed:\n")
print("\n", resultdf) 

Keluaran

 a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

DataFrame after being transformed:


     a   b   c
0   5  10  15
1  20  25  30
2  35  40  45 

Kesimpulan

Fungsi DataFrame.Transform () mengembalikan DataFrame yang diproduksi sendiri dengan nilai yang ditransformasikan setelah menerapkan fungsi yang ditentukan dalam parameternya. Dataframe output ini memiliki panjang yang sama dengan DataFrame yang dilewati.

Lihat juga

Pandas DataFrame Rank ()

Pandas DataFrame merge ()

Pandas DataFrame Fillna ()

Pandas DataFrame append ()

Pandas DataFrame Apply ()

Artikel ini berasal dari website Winpoin, dan kemudian diterjemahkan ke bahasa indonesia, baca artikel asli disini

Leave a Reply

Your email address will not be published. Required fields are marked *