آموزش Pandas | کار با داده‌های چند بعدی

مفهوم داده‌های چند بعدی

داده‌های چند بعدی (Multi-dimensional Data) به داده‌هایی گفته می‌شود که برای توصیف یک رکورد، بیش از دو بعد یا سطح اطلاعاتی دارند. در یک DataFrame معمولی در Pandas، داده‌ها در دو بعد سطر و ستون سازماندهی می‌شوند. اما در دنیای واقعی، بسیاری از داده‌ها نیاز به بیش از دو بعد دارند تا بتوان آن‌ها را به درستی نمایش داد و تحلیل کرد.

به عنوان مثال، تصور کنید که فروش یک محصول را در یک فروشگاه در طول سال دارید. داده‌های شما ممکن است شامل موارد زیر باشد:

  • نام محصول (یک بعد)
  • تاریخ فروش (یک بعد دوم)
  • شهر فروش (یک بعد سوم)
  • میزان فروش (مقدار عددی)

اگر بخواهید همه این اطلاعات را در یک جدول دو بعدی (سطر و ستون) قرار دهید، باید تصمیم بگیرید که کدام یک از این ابعاد را به عنوان ستون و کدام را به عنوان سطر استفاده کنید. اما این کار باعث می‌شود که برخی اطلاعات تکراری شوند یا تحلیل آن دشوار شود. برای مثال، اگر بخواهید فروش یک محصول خاص را در تمام شهرها در طول یک ماه مقایسه کنید، باید داده‌ها را به صورت جداگانه استخراج و ترکیب کنید.

داده‌های چند بعدی در Pandas عمدتاً با استفاده از MultiIndex یا Index سلسله‌مراتبی مدیریت می‌شوند. این ساختار به شما اجازه می‌دهد که چندین سطح از کلیدها را برای سطرها و حتی ستون‌ها داشته باشید.

مثال ساده برای درک بهتر:

فرض کنید یک DataFrame معمولی دارید که فروش یک محصول را در سه شهر (تهران، اصفهان، شیراز) برای سه ماه اول سال نشان می‌دهد:

        فروش
تهران   100
اصفهان  80
شیراز   90

در این جدول، داده‌ها فقط دو بعد دارند: شهر و فروش. حال فرض کنید می‌خواهید برای هر شهر، فروش را بر اساس ماه نیز ثبت کنید. نمی‌توانید به راحتی این کار را در یک جدول دو بعدی انجام دهید زیرا ماه نیز یک بعد جدید است. در اینجا به یک ساختار داده‌ای نیاز دارید که سه بعد داشته باشد: شهر، ماه، و فروش.

نکات کلیدی:

  • داده‌های چند بعدی به شما امکان می‌دهد که داده‌ها را با جزئیات بیشتر ذخیره کنید.
  • این نوع داده‌ها برای تحلیل‌های پیچیده مانند پیش‌بینی سری‌های زمانی، تحلیل‌های جغرافیایی و داده‌های پرسنلی بسیار مفید هستند.
  • در Pandas، برای استفاده از داده‌های چند بعدی، باید به جای ستون‌های تکراری یا کلیدهای ترکیبی، از MultiIndex استفاده کنید تا ساختار داده شما شفاف و قابل مدیریت باقی بماند.

در بخش بعدی، یاد می‌گیرید که چگونه با استفاده از MultiIndex این ساختار را در عمل ایجاد و مدیریت کنید.

پرسش و پاسخ این درس

برای ثبت پرسش ابتدا در سایت وارد شوید.

  • 1
  • 2
  • 3