NumPy ve Pandas Kullanarak Veri Çerçeveleri Oluşturma

Adı : NumPy ve Pandas Kullanarak Veri Çerçeveleri Oluşturma

NumPy ve Pandas, Python dilinde güçlü veri analizi platformlarıdır ve veri çerçeveleri oluşturmak için kullanışlı birçok araç sağlarlar. Bir veri çerçevesi, bir dizi veri ile ilişkili sütunlar içeren bir tablodur ve verileri organize etmek, analiz etmek ve görselleştirmek için kullanılır.

NumPy Basit Veri Çerçeveleri

NumPy, yüksek düzeyde sayısal hesaplamalar için tasarlanmış bir Python kütüphanesidir. Bununla birlikte, basit veri çerçeveleri de oluşturabilirsiniz. NumPy, tek tip veriyi (örneğin, tamsayılar ve kayan noktalı sayılar) içeren çok boyutlu dizilere odaklanan bir kütüphanedir. Bu tür dizilerin her bir öğesi aynı veri türündedir ve NumPy, daha fazla veri çeşidi içeren veri yapılarını karşılayacak ekstra bir veri yapısı sunmaz.

NumPy ile veri çerçevesi oluşturmak için, önce verileri NumPy dizisine aktarmanız gerekir. Örneğin, aşağıdaki NumPy dizisi, tek tip veri tutar ve iki boyutlu bir tablo biçiminde düzenlenmiştir:

```
import numpy as np

data = np.array([[10, 20, 30], [40, 50, 60], [70, 80, 90]])

print(data)
```

Bu dizide, veriler üç satıra ve üç sütuna sahip bir tabloda düzenlenmiştir. Bir NumPy dizisini bir veri çerçevesine dönüştürmek için, numpy.ndarray objesi yani Numpy dizileri Pandas veri çerçeveleri ile uyumlu hale getirilmeli ve pandas.DataFrame sınıfı kullanarak bir DataFrame oluşturmak mümkündür. Bunu yapmak için, aşağıdaki gibi DataFrame() fonksiyonunu kullanabilirsiniz. İlk argüman, dönüştürülecek diziye atıfta bulunurken, sütun başlıkları için bir dizi argüman da iletebilirsiniz:

```
import pandas as pd

df = pd.DataFrame(data, columns=['col1', 'col2', 'col3'])

print(df)
```

Bu, NumPy dizisinden bir Pandas veri çerçevesi oluşturur ve sütun başlıklarını belirler. Şimdi, bir veri çerçevesi oluşturulduğuna göre, verileri işleyebilir ve analiz edebilirsiniz. Örneğin, veri çerçevesi için birkaç istatistiksel bilgi bulmak için describe() yöntemini kullanabilirsiniz:

```
print(df.describe())
```

Ayrıca, bir veri çerçevesindeki her sütunun toplamını almak için sum() yöntemini kullanabilirsiniz:

```
print(df.sum())
```

Pandas İle Veri Çerçeveleri Oluşturma

NumPy'nin sadece tek tip verileri desteklediğini belirtmiştik. Pandas, farklı veri tiplerini ve veri yapısını destekleyerek, daha geniş bir veri analizi yelpazesi sunar. Veriler düzgün formatta olduğunda (örneğin, aynı sütunlara sahip veri çerçeveleri), dataframes daha iyi performans gösterir. Pandas, veri çerçevelerini oluşturmak ve yönetmek için kullanılan en popüler araçlardan biridir.

Veri çerçevelerini Pandas kullanarak oluşturmak için, önce verileri bir sözlük veya liste formatında saklamanız gerekir. Bir sözlük formatındaki verileri bir data frame haline getirelim. Şöyle bir sözlük tanımlayalım,

```
data_dict = {\"A\": [1, 2, 3], \"B\": [4, 5, 6], \"C\": [7, 8, 9]}
```

Bu sözlük, üç anahtarla (A, B, C) ve her bir anahtarla ilişkili sütunlarla birlikte bir tablo verileri içerir. Veri çerçevesi oluşturmak için, sözlüğü pandas.DataFrame() fonksiyonu içine aktarabilirsiniz:

```
df = pd.DataFrame(data_dict)

print(df)
```

Bu, bir veri çerçevesi oluşturur ve her bir anahtar için bir sütun oluşturur. Veri çerçevelerinde her sütunun veri türü farklı olabilir, bu nedenle Pandas bu verileri farklı veri türleri içeren bir tablo olarak saklar. Bir veri çerçevesindeki sütunların farklı veri türleri, verileri Pandas’ın farklı teknikleriyle ele almamızı gerektirir.

Veri Çerçevelerinde Sütun Değiştirme

Bir veri çerçevesindeki sütunların düzeni değiştirilebilir ve sütun isimleri belirtilerek yeni bir sıraya göre düzenlenebilir. Bu veri çerçevesindeki sıralama yapmak istediğimiz sütun adlarını listeye eklememiz gerekir. Diyelim ki veri çerçevesindeki sütun isimleri şöyledir: \"A\", \"B\", ve \"C\". Sütun isimlerini yeni bir sırayla değiştirmek için şu adımları kullanabilirsiniz:

```
column_names = [\"C\", \"A\", \"B\"]
df = df[column_names]

print(df)
```

Sütun değiştirme işlemi, sadece sütunların sırasını değiştirirken sütunların yapısında bir değişiklik yapmaz.

Veri Çerçeveleri İçinde İşlem Yapmak

Bir veri çerçevesi oluşturduktan sonra, onun üzerinde çeşitli operasyonlar yapabilirsiniz. Bunların bazıları aşağıda listelenir:

1) Satır Değişimi

Bir veri çerçevesindeki bir satırda, her satır bir dizi veriyi içeren bir dizi olarak depolanır. Satırları değiştirmek için, satır indekslerini kullanarak ilgili satırı seçebilirsiniz. Örneğin, aşağıdaki kod bloğu 2. satırı (indeks 1) etiketli satırı seçer ve onu yeni bir satırla değiştirir:

```
new_row = {\"A\": 10, \"B\": 20, \"C\": 30}
df.loc[1] = new_row

print(df)
```

2) Sütun Ekleme

Sütun ekleme, df[‘sütunAdı’] = veriler formülü kullanarak yapılır. Aşağıdaki örnekte, veri çerçevesine yeni bir sütun eklenerek sütun indeksi \"D\" atanır:

```
new_col = [100, 200, 300]
df['D'] = new_col

print(df)
```

3) Sütun Silme

Sütun silmek için drop() fonksiyonu kullanılır. Aşağıdaki örnek veri çerçevesindeki \"D\" sütununu siler:

```
df = df.drop('D', axis=1)

print(df)
```

4) Satır Silme

Satır silmek için, drop() fonksiyonuna ilgili satırın indeksini vererek, satırı sileriz:

```
df = df.drop(1)

print(df)
```

Sıkça Sorulan Sorular

1) NumPy dizileri değiştirilemez. Bu veriler veri çerçevelerinde nasıl dönüştürülür?

Numpy dizileri, sadece okunabilirdir, ancak Pandas veri çerçeveleri değiştirilebilir. Bir NumPy dizisi bir veri çerçevesine dönüştürülürken, diziyi pandas.DataFrame() fonksiyonuna vermeniz gerekir.

2) Pandas veri çerçevelerinde, tek bir sütunun bir alt kümesi nasıl alınır?

Veri çerçevelerinde, bir sütunun bir alt kümesini seçmek için sütun adını kullanabilirsiniz. Örneğin, aşağıdaki kod bloğu, \"B\" sütunundan 2. ve 3. elemanlarını alır:

```
subset = df[\"B\"][1:3]

print(subset)
```

3) Veri çerçevelerindeki bir sütunda, belirli bir değer içeren satırlar nasıl seçilir?

Belirli bir değere sahip olan satırları seçmek için, df[df['sütunAdı'] == 'değer'] formülü kullanılır. Aşağıdaki örnekte, sadece \"B\" sütununda değeri '5' olan satırları alır:

```
subset = df[df['B'] == 5]

print(subset)
```

4) Veri çerçevelerinde hızlı hesaplama yapmak için hangi metodlar kullanılabilir?

Pandas veri çerçeveleri için bazı hızlı hesaplama yöntemleri şunlardır: describe(), mean(), min(), max(), std(), ve var()

5) Pandas veri çerçevesi silinirken hangi değerlerin silinmesi yerinde yok edilmesi veya yenisinin oluşturulması sağlanabilir?

Pandas veri çerçevelerinden bir sözlük anahtarını silerken, bu yöntemi kullanarak ilk kopya oluşturulabilir ve yeni bir veri çerçevesi oluşturulabilir. Böylece veri çerçevesi yok olmaz ve yerinde değiştirilmez. Yeni veri çerçevesi orijinal veri çerçevesinden bir kopyadır. Aşağıdaki örnekte, yeni bir veri çerçevesi, B sütunu silindiği halde orijinal veri çerçevesinin aynısını temsil edecektir.

```
new_df = df.drop(\"B\", axis=1)

print(new_df)
print(df)
```

6) Veri çerçevelerinde sıralama işlemi nasıl gerçekleştirilir?

Pandas veri çerçevelerinde sıralama işlemi .sort_values(‘sütunAdı’) fonksiyonu veya .sort_index() yöntemiyle yapılır. Aşağıdaki örnekte, \"B\" sütununu varsayılan sıralama yöntemi olan artan sırayla sıralar ve \"A\" sütununun değerine göre sıralama yapar:

```
sort_by_b = df.sort_values('B')

print(sort_by_b)

sort_by_a = df.sort_values('A')

print(sort_by_a)
```

7) Pandas veri çerçevesindeki NaN değerleri nasıl ele alınabilir?

Pandas veri çerçevelerinde, NaN değerler (boş veya eksik değerler) genellikle 0, yok, N/A veya başka bir değerle değiştirilir. Ya da basitçe silinebilir. Örneğin, aşağıdaki kod bloğu, NaN değerleri \"0\" ile değiştirir:

```
df.fillna(0, inplace=True)

print(df)
```

Söz konusu olmayan her çerçevedeki bir Null değerini Ture olarak gösteren bir soru döndürmektedir. Bu durum genellikle bir çerçevedeki boş veya eksik verileri doğru bir şekilde temsil etmediğinden Pandas'ın soruyu yok sayması nedeniyle oluşur."

Adı : NumPy ve Pandas Kullanarak Veri Çerçeveleri Oluşturma

NumPy Pandas Veri Çerçeveleri Oluşturma işleme Yapısı Yazılım Python

NumPy ve Pandas Kullanarak Veri Çerçeveleri Oluşturma

Adı : NumPy ve Pandas Kullanarak Veri Çerçeveleri Oluşturma

Adı : NumPy ve Pandas Kullanarak Veri Çerçeveleri Oluşturma

İlgili Yazılar