Kok Pandas memproses datasetnya lambat banget ya? Bisa ngga sih ada alternatif yang lebih cepat? Kalian bisa loh coba Polars.
Kelebihan-Kelebihan dari Polars:
- Lebih cepat dibandingkan Pandas
- Jarang terjadinya memory error
- Mudah digunakan
– Cara penggunaaanya mirip dengan pandas. Oleh karena itu, akan mudah untuk kita beradaptasi.
Cara Install Polars
Kita tinggal meng-install-nya menggunakan pip seperti gambar di bawah
Pada artikel ini versi-versi yang digunakan adalah:
- Python 3.10.0
- Polars 0.10.16
- Pyarrow 6.0.0
- Visual Studio Code 1.62.0
Cara Menggunakan
1. Import
2. Membuat DataFrame
Terlihat pada gambar di atas, DataFrame tidak terlalu berbeda dari Pandas kecuali data type yang terlihat di atas tabel dan tidak adanya no indeks. Perlu diketahui juga read_csv dan to_csv juga tersedi di Polars.
3. Shape, Height, dan Width
4. Memanggil baris dan kolom
5. Menambahkan Kolom
6. Mengganti nama kolom
7. Menghapus Kolom
8. Mengubah Menjadi Pandas dan Numpy
9. Menyesuaikan Jumlah Baris dan Kolom yang akan Ditampilkan
10. Pengelompokkan
Describe
Groupby
Window Function
11. Filter dan Sorting
Perbandingan Kecepatan Pandas dan Polars
Kecepatan Pandas dan Polars dapat kita bandingkan berdasarkan kecepatan melakukan groupby, join, sorting dan filter. Hasil perbandingan tersebut dapat dilihat di tabel di bawah ini:
Comments