آموزش Pandas | بررسی دادهها
خطای دسترسی
برای ثبت پاسخ، ابتدا باید در سایت وارد شوید.
نمایش دادهها
یکی از مهمترین مراحل در تحلیل دادهها، نمایش دادهها به روشی است که بتوانیم به راحتی اطلاعات مورد نظر را مشاهده و درک کنیم. در کتابخانه Pandas، ابزارهایی وجود دارد که به ما کمک میکند تا دادههای خود را به سادگی نمایش دهیم. در این بخش، به بررسی روشهای مختلف نمایش دادهها میپردازیم.
1. نمایش کل DataFrame
برای نمایش کل DataFrame، کافی است نام آن را در محیط Python بنویسید. به عنوان مثال:
import pandas as pd
# ایجاد یک DataFrame نمونه
data = {
'نام': ['علی', 'مریم', 'رضا'],
'سن': [25, 30, 22],
'شغل': ['برنامهنویس', 'معلم', 'مهندس']
}
df = pd.DataFrame(data)
# نمایش کل DataFrame
print(df)
این کد یک DataFrame ساده ایجاد کرده و آن را نمایش میدهد. خروجی به شکل زیر خواهد بود:
نام سن شغل
0 علی 25 برنامهنویس
1 مریم 30 معلم
2 رضا 22 مهندس
2. نمایش چند سطر اول
برای مشاهده چند سطر اول DataFrame، میتوانیم از تابع head() استفاده کنیم. به طور پیشفرض، این تابع 5 سطر اول را نمایش میدهد، اما میتوانیم تعداد سطرهای مورد نظر را نیز مشخص کنیم:
# نمایش 2 سطر اول
print(df.head(2))
خروجی به شکل زیر خواهد بود:
نام سن شغل
0 علی 25 برنامهنویس
1 مریم 30 معلم
3. نمایش چند سطر آخر
برای مشاهده چند سطر آخر DataFrame، از تابع tail() استفاده میکنیم. این تابع نیز به طور پیشفرض 5 سطر آخر را نمایش میدهد:
# نمایش 2 سطر آخر
print(df.tail(2))
خروجی به شکل زیر خواهد بود:
نام سن شغل
1 مریم 30 معلم
2 رضا 22 مهندس
4. نمایش اطلاعات کلی DataFrame
برای مشاهده اطلاعات کلی درباره DataFrame، از تابع info() استفاده میکنیم. این تابع اطلاعاتی از جمله تعداد سطرها، نوع دادهها و تعداد دادههای غیر خالی را نمایش میدهد:
# نمایش اطلاعات کلی DataFrame
df.info()
خروجی به شکل زیر خواهد بود:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 نام 3 non-null object
1 سن 3 non-null int64
2 شغل 3 non-null object
dtypes: int64(1), object(2)
memory usage: 120.0+ bytes
5. نمایش آمار توصیفی
برای مشاهده آمار توصیفی دادههای عددی، میتوانیم از تابع describe() استفاده کنیم. این تابع اطلاعاتی مانند میانگین، انحراف معیار، حداقل و حداکثر را نمایش میدهد:
# نمایش آمار توصیفی
print(df.describe())
خروجی به شکل زیر خواهد بود:
سن
count 3.0
mean 25.67
std 4.04
min 22.0
25% 24.0
50% 25.0
75% 27.5
max 30.0
با استفاده از این روشها، میتوانیم دادههای خود را به سادگی نمایش دهیم و از آنها برای تحلیلهای بعدی استفاده کنیم.
برای ثبت پرسش ابتدا در سایت وارد شوید.