Kok Pandas memproses datasetnya lambat banget ya? Bisa ngga sih ada alternatif yang lebih cepat? Kalian bisa loh coba Polars.

Kelebihan-Kelebihan dari Polars:

  1. Lebih cepat dibandingkan Pandas
  2. Jarang terjadinya memory error
  3. Mudah digunakan
    – Cara penggunaaanya mirip dengan pandas. Oleh karena itu, akan mudah untuk kita beradaptasi.

Cara Install Polars

Kita tinggal meng-install-nya menggunakan pip seperti gambar di bawah

Pada artikel ini versi-versi yang digunakan adalah:

  • Python 3.10.0
  • Polars 0.10.16
  • Pyarrow 6.0.0
  • Visual Studio Code 1.62.0

Cara Menggunakan

1. Import

2. Membuat DataFrame

Terlihat pada gambar di atas, DataFrame tidak terlalu berbeda dari Pandas kecuali data type yang terlihat di atas tabel dan tidak adanya no indeks. Perlu diketahui juga read_csv dan to_csv juga tersedi di Polars.

3. Shape, Height, dan Width

4. Memanggil baris dan kolom

Pada Polars juga terdapat fungsi head()

5. Menambahkan Kolom

6. Mengganti nama kolom

7. Menghapus Kolom

8. Mengubah Menjadi Pandas dan Numpy

9. Menyesuaikan Jumlah Baris dan Kolom yang akan Ditampilkan

10. Pengelompokkan

Describe

Groupby

Window Function

Nilai maksimum dan rata-rata dari masing-masing window

11. Filter dan Sorting

Perbandingan Kecepatan Pandas dan Polars

Kecepatan Pandas dan Polars dapat kita bandingkan berdasarkan kecepatan melakukan groupby, join, sorting dan filter. Hasil perbandingan tersebut dapat dilihat di tabel di bawah ini:

Dapat dilihat perbedaan yang siginifikan antara Pandas dan Polars

Last modified: November 18, 2021

Author

Comments

Write a Reply or Comment

Your email address will not be published.