آموزش Pandas | DataFrame و Series

تعریف DataFrame

DataFrame یکی از ساختارهای اصلی داده در کتابخانه Pandas است که به شما این امکان را می‌دهد تا داده‌ها را به صورت جدولی سازماندهی کنید. به عبارت ساده‌تر، DataFrame مانند یک جدول در پایگاه داده یا یک شیت در Excel است که شامل سطرها و ستون‌ها می‌باشد. هر ستون می‌تواند نوع داده متفاوتی داشته باشد، مانند اعداد، رشته‌ها، تاریخ‌ها و غیره.

ویژگی‌های DataFrame

  1. سطرها و ستون‌ها: DataFrame شامل سطرها و ستون‌ها است. هر ستون یک ویژگی خاص از داده‌ها را نشان می‌دهد و هر سطر یک نمونه خاص از داده‌ها را نمایش می‌دهد.

  2. ایندکس: هر DataFrame دارای یک ایندکس است که به هر سطر یک شناسه منحصر به فرد می‌دهد. این ایندکس می‌تواند به صورت خودکار ایجاد شود یا می‌توانید آن را به صورت دستی تعیین کنید.

  3. نوع داده: هر ستون در DataFrame می‌تواند نوع داده خاصی داشته باشد. به عنوان مثال، یک ستون می‌تواند شامل اعداد صحیح باشد، در حالی که ستون دیگر شامل رشته‌ها باشد.

  4. عملیات بر روی داده‌ها: با استفاده از DataFrame، می‌توانید به راحتی عملیات مختلفی مانند فیلتر کردن، گروه‌بندی، و تجزیه و تحلیل داده‌ها را انجام دهید.

مثال ساده

برای ایجاد یک DataFrame ساده، می‌توانید از تابع pd.DataFrame() در Pandas استفاده کنید. در زیر یک مثال از ایجاد یک DataFrame با داده‌های فرضی آورده شده است:

import pandas as pd

data = {
    'نام': ['علی', 'سارا', 'محمد'],
    'سن': [25, 30, 22],
    'شغل': ['مهندس', 'دکتر', 'معلم']
}

df = pd.DataFrame(data)
print(df)

خروجی این کد به صورت زیر خواهد بود:

    نام  سن     شغل
0   علی  25   مهندس
1  سارا  30    دکتر
2  محمد  22   معلم

در این مثال، یک DataFrame با سه ستون (نام، سن و شغل) و سه سطر (علی، سارا و محمد) ایجاد شده است. هر سطر نمایانگر یک فرد و ویژگی‌های او است. DataFrame به شما این امکان را می‌دهد که به راحتی داده‌ها را مدیریت و تجزیه و تحلیل کنید.

پرسش و پاسخ این درس

برای ثبت پرسش ابتدا در سایت وارد شوید.

  • 1
  • 2
  • 3