Pandas یک کتابخانه محبوب در زمینه تحلیل داده ها در پایتون است که به شما اجازه میدهد با داده ها به صورت آسان و سریع کار کنید. با Pandas، شما میتوانید به سرعت داده ها را فیلتر، تبدیل، ترکیب و محاسبه کنید. در زیر، چند مثال از عملیات محاسباتی روی داده ها با Pandas آورده شده است:
ایجاد و انتخاب داده ها
ایجاد DataFrame
در مثال زیر، یک DataFrame با استفاده از دیکشنری ایجاد شده است:
import pandas as pd
data = {'name': ['John', 'Doe', 'Jane', 'Smith'],
'age': [25, 30, 18, 40],
'salary': [50000, 70000, 30000, 90000]}
df = pd.DataFrame(data)
انتخاب ستون
برای انتخاب یک ستون از DataFrame، کافی است نام ستون مورد نظر را به عنوان یک ورودی به داخل دستور loc یا iloc بدهید:
# انتخاب ستون name با استفاده از loc
df.loc[:, 'name']
# انتخاب ستون salary با استفاده از iloc
df.iloc[:, 2]
انتخاب ردیف
برای انتخاب یک ردیف از DataFrame، میتوانید از دستور loc یا iloc استفاده کنید:
# انتخاب ردیف اول با استفاده از loc
df.loc[0, :]
# انتخاب ردیف سوم با استفاده از iloc
df.iloc[2, :]
اعمال شرط
برای اعمال شرط به یک DataFrame، شما میتوانید از دستورات شرطی استفاده کنید:
# فیلتر کردن ردیف هایی که سن بیشتر از 25 است
df[df['age'] > 25]
# فیلتر کردن ردیف هایی که حقوق بین 30,000 و 60,000 دلار است
df[(df['salary'] >= 30000) & (df['salary'] <= 60000)]
انجام محاسبات آماری روی داده ها
با استفاده از Pandas، شما میتوانید محاسبات آماری مختلفی را روی داده ها اعمال کنید.
محاسبه میانگین:
برای محاسبه میانگین از دستور mean استفاده میشود:
# محاسبه میانگین سن
df['age'].mean()
# محاسبه میانگین حقوق
df['salary'].mean()
محاسبه مجموع:
برای محاسبه مجموع از دستور sum استفاده میشود:
# محاسبه مجموع سن
df['age'].sum()
# محاسبه مجموع حقوق
df['salary'].sum()
محاسبه حداکثر و حداقل:
برای محاسبه حداکثر و حداقل از دستورهای max و min استفاده میشود:
# محاسبه حداکثر حقوق
df['salary'].max()
# محاسبه حداقل حقوق
df['salary'].min()
محاسبه واریانس و انحراف معیار:
برای محاسبه واریانس و انحراف معیار از دستورهای var و std استفاده میشود:
# محاسبه واریانس سن
df['age'].var()
# محاسبه انحراف معیار حقوق
df['salary'].std()
مرتب سازی:
برای مرتب سازی یک DataFrame، میتوانید از دستور sort_values استفاده کنید:
# مرتب سازی بر اساس سن
df.sort_values(by='age')
# مرتب سازی بر اساس حقوق
df.sort_values(by='salary')
این عملیاتها فقط چند مثال از عملیاتهایی است که با Pandas انجام میدهید، اما این کتابخانه تواناییهای بسیاری دارد و میتوانید با مطالعه بیشتر در آن مهارت خود را توسعه دهید.
دیدگاهها