آموزش Pandas | مثال‌های عملی - پروژه تحلیل داده‌های آب و هوا

مثال‌های عملی – پروژه تحلیل داده‌های آب و هوا (قسمت 1)

در این بخش، اولین قدم از یک پروژه عملی برای تحلیل داده‌های آب و هوایی را برمی‌داریم. فرض کنید یک فایل CSV با نام weather_data.csv دارید که شامل اطلاعات روزانه دما، رطوبت، سرعت باد و وضعیت آب و هوا (مانند آفتابی، ابری، بارانی) برای یک شهر در طول یک سال است. هدف ما در این قسمت، بارگذاری داده‌ها، بررسی ساختار اولیه و شناسایی داده‌های گمشده است.

ابتدا کتابخانه Pandas را فراخوانی کرده و فایل را می‌خوانیم. از آنجایی که محیط آنلاین شما فایل را در اختیار دارد، فرض می‌کنیم مسیر فایل weather_data.csv است.

import pandas as pd

# خواندن فایل CSV
df = pd.read_csv('weather_data.csv')

# نمایش 5 سطر اول برای آشنایی با داده‌ها
print(df.head())

بعد از اجرای کد، خروجی احتمالاً جدولی با ستون‌های date (تاریخ)، temperature_c (دما بر حسب سانتی‌گراد)، humidity_percent (درصد رطوبت)، wind_speed_kmh (سرعت باد بر حسب کیلومتر بر ساعت) و weather_condition (وضعیت آب و هوا) نشان می‌دهد.

حالا نوبت به بررسی ساختار و نوع داده‌ها می‌رسد. از دستورات زیر استفاده می‌کنیم تا بفهمیم هر ستون چه نوع داده‌ای دارد و آیا مقدار تهی (NaN) وجود دارد:

# نمایش اطلاعات کلی DataFrame
print(df.info())

# نمایش تعداد داده‌های گمشده در هر ستون
print(df.isnull().sum())

خروجیdf.info() به شما نشان می‌دهد که مثلاً ستون temperature_c از نوع float64 و ستون weather_condition از نوع object (رشته) است. همچنین تعداد ردیف‌های غیرتهی را مشخص می‌کند. دستور isnull().sum() تعداد دقیق داده‌های گمشده را در هر ستون نمایش می‌دهد. برای مثال، ممکن است ببینید که ستون wind_speed_kmh سه مقدار NaN دارد.

در انتهای این قسمت، شما باید بدانید:

  • ساختار کلی داده‌های خود را.
  • کدام ستون‌ها داده گمشده دارند و تعداد آنها چقدر است.

این اطلاعات پایه‌ای برای تصمیم‌گیری در مورد نحوه پاکسازی داده‌ها در قسمت‌های بعدی است.

پرسش و پاسخ این درس

برای ثبت پرسش ابتدا در سایت وارد شوید.

  • 1
  • 2
  • 3