آموزش Pandas | انتخاب و فیلتر کردن داده‌ها

انتخاب سطرها و ستون‌ها

انتخاب سطرها و ستون‌ها یکی از اساسی‌ترین عملیات‌ها در کار با Pandas است. برای این کار روش‌های مختلفی وجود دارد که هر کدام کاربرد خاص خود را دارند.

انتخاب ستون‌ها:
برای انتخاب یک ستون خاص، می‌توانید از نام ستون استفاده کنید. این کار یک Series برمی‌گرداند:

df['نام_ستون']

برای انتخاب چندین ستون، می‌توانید از لیستی از نام ستون‌ها استفاده کنید. این کار یک DataFrame جدید برمی‌گرداند:

df[['ستون1', 'ستون2', 'ستون3']]

انتخاب سطرها با استفاده از iloc:
روش iloc برای انتخاب سطرها و ستون‌ها بر اساس موقعیت عددی (ایندکس عددی) استفاده می‌شود:

# انتخاب سطر اول
df.iloc[0]

# انتخاب سه سطر اول
df.iloc[0:3]

# انتخاب سطر و ستون خاص
df.iloc[2, 3]  # سطر سوم، ستون چهارم

# انتخاب چند سطر و چند ستون
df.iloc[0:3, 1:4]  # سطرهای 0 تا 2، ستون‌های 1 تا 3

انتخاب سطرها با استفاده از loc:
روش loc برای انتخاب بر اساس برچسب (label) استفاده می‌شود:

# انتخاب سطر با ایندکس خاص
df.loc[5]  # سطر با ایندکس 5

# انتخاب محدوده‌ای از سطرها
df.loc[2:5]  # سطرهای از ایندکس 2 تا 5

# انتخاب سطر و ستون خاص
df.loc[2, 'نام_ستون']  # سطر دوم، ستون با نام مشخص

# انتخاب چند سطر و چند ستون
df.loc[2:5, ['ستون1', 'ستون2']]

تفاوت بین iloc و loc:

  • iloc: از موقعیت عددی استفاده می‌کند (مانند لیست در پایتون)
  • loc: از برچسب ایندکس استفاده می‌کند

انتخاب شرطی سطرها:
می‌توانید سطرها را بر اساس شرایط خاص انتخاب کنید:

# انتخاب سطرهایی که در ستون خاصی مقدار مشخصی دارند
df[df['ستون'] > 50]

# انتخاب با چند شرط
df[(df['ستون1'] > 50) & (df['ستون2'] == 'مقدار')]

این روش‌ها به شما امکان می‌دهند به راحتی بخش‌های مختلف داده‌های خود را انتخاب و بررسی کنید.

پرسش و پاسخ این درس

برای ثبت پرسش ابتدا در سایت وارد شوید.

  • 1
  • 2
  • 3