بکندباز

نحوه انجام محاسبات روی داده ها با Pandas

Pandas یک کتابخانه محبوب در زمینه تحلیل داده ها در پایتون است که به شما اجازه می‌دهد با داده ها به صورت آسان و سریع کار کنید. با Pandas، شما می‌توانید به سرعت داده ها را فیلتر، تبدیل، ترکیب و محاسبه کنید. در زیر، چند مثال از عملیات محاسباتی روی داده ها با Pandas آورده شده است:

ایجاد و انتخاب داده ها

ایجاد DataFrame

در مثال زیر، یک DataFrame با استفاده از دیکشنری ایجاد شده است:

import pandas as pd
data = {'name': ['John', 'Doe', 'Jane', 'Smith'],
        'age': [25, 30, 18, 40],
        'salary': [50000, 70000, 30000, 90000]}
df = pd.DataFrame(data)

انتخاب ستون

برای انتخاب یک ستون از DataFrame، کافی است نام ستون مورد نظر را به عنوان یک ورودی به داخل دستور loc یا iloc بدهید:

# انتخاب ستون name با استفاده از loc
df.loc[:, 'name']

# انتخاب ستون salary با استفاده از iloc
df.iloc[:, 2]

انتخاب ردیف

برای انتخاب یک ردیف از DataFrame، می‌توانید از دستور loc یا iloc استفاده کنید:

# انتخاب ردیف اول با استفاده از loc
df.loc[0, :]

# انتخاب ردیف سوم با استفاده از iloc
df.iloc[2, :]

اعمال شرط

برای اعمال شرط به یک DataFrame، شما می‌توانید از دستورات شرطی استفاده کنید:

# فیلتر کردن ردیف هایی که سن بیشتر از 25 است
df[df['age'] > 25]

# فیلتر کردن ردیف هایی که حقوق بین 30,000 و 60,000 دلار است
df[(df['salary'] >= 30000) & (df['salary'] <= 60000)]

انجام محاسبات آماری روی داده ها

با استفاده از Pandas، شما می‌توانید محاسبات آماری مختلفی را روی داده ها اعمال کنید.

محاسبه میانگین:

برای محاسبه میانگین از دستور mean استفاده می‌شود:

# محاسبه میانگین سن
df['age'].mean()‎

# محاسبه میانگین حقوق
df['salary'].mean()‎

محاسبه مجموع:

برای محاسبه مجموع از دستور sum استفاده می‌شود:

# محاسبه مجموع سن
df['age'].sum()‎

# محاسبه مجموع حقوق
df['salary'].sum()‎

محاسبه حداکثر و حداقل:

برای محاسبه حداکثر و حداقل از دستورهای max و min استفاده می‌شود:

# محاسبه حداکثر حقوق
df['salary'].max()‎

# محاسبه حداقل حقوق
df['salary'].min()‎

محاسبه واریانس و انحراف معیار:

برای محاسبه واریانس و انحراف معیار از دستورهای var و std استفاده می‌شود:

# محاسبه واریانس سن
df['age'].var()‎

# محاسبه انحراف معیار حقوق
df['salary'].std()‎

مرتب سازی:

برای مرتب سازی یک DataFrame، می‌توانید از دستور sort_values استفاده کنید:

# مرتب سازی بر اساس سن
df.sort_values(by='age')

# مرتب سازی بر اساس حقوق
df.sort_values(by='salary')

این عملیات‌ها فقط چند مثال از عملیات‌هایی است که با Pandas انجام می‌دهید، اما این کتابخانه توانایی‌های بسیاری دارد و می‌توانید با مطالعه بیشتر در آن مهارت خود را توسعه دهید.

zohreh

مدیر وب سایت بکندباز

دیدگاه‌ها

*
*