آموزش Pandas | مثالهای عملی - پروژه تحلیل دادههای آب و هوا
خطای دسترسی
برای ثبت پاسخ، ابتدا باید در سایت وارد شوید.
مثالهای عملی – پروژه تحلیل دادههای آب و هوا (قسمت 1)
در این بخش، اولین قدم از یک پروژه عملی برای تحلیل دادههای آب و هوایی را برمیداریم. فرض کنید یک فایل CSV با نام weather_data.csv دارید که شامل اطلاعات روزانه دما، رطوبت، سرعت باد و وضعیت آب و هوا (مانند آفتابی، ابری، بارانی) برای یک شهر در طول یک سال است. هدف ما در این قسمت، بارگذاری دادهها، بررسی ساختار اولیه و شناسایی دادههای گمشده است.
ابتدا کتابخانه Pandas را فراخوانی کرده و فایل را میخوانیم. از آنجایی که محیط آنلاین شما فایل را در اختیار دارد، فرض میکنیم مسیر فایل weather_data.csv است.
import pandas as pd
# خواندن فایل CSV
df = pd.read_csv('weather_data.csv')
# نمایش 5 سطر اول برای آشنایی با دادهها
print(df.head())
بعد از اجرای کد، خروجی احتمالاً جدولی با ستونهای date (تاریخ)، temperature_c (دما بر حسب سانتیگراد)، humidity_percent (درصد رطوبت)، wind_speed_kmh (سرعت باد بر حسب کیلومتر بر ساعت) و weather_condition (وضعیت آب و هوا) نشان میدهد.
حالا نوبت به بررسی ساختار و نوع دادهها میرسد. از دستورات زیر استفاده میکنیم تا بفهمیم هر ستون چه نوع دادهای دارد و آیا مقدار تهی (NaN) وجود دارد:
# نمایش اطلاعات کلی DataFrame
print(df.info())
# نمایش تعداد دادههای گمشده در هر ستون
print(df.isnull().sum())
خروجیdf.info() به شما نشان میدهد که مثلاً ستون temperature_c از نوع float64 و ستون weather_condition از نوع object (رشته) است. همچنین تعداد ردیفهای غیرتهی را مشخص میکند. دستور isnull().sum() تعداد دقیق دادههای گمشده را در هر ستون نمایش میدهد. برای مثال، ممکن است ببینید که ستون wind_speed_kmh سه مقدار NaN دارد.
در انتهای این قسمت، شما باید بدانید:
- ساختار کلی دادههای خود را.
- کدام ستونها داده گمشده دارند و تعداد آنها چقدر است.
این اطلاعات پایهای برای تصمیمگیری در مورد نحوه پاکسازی دادهها در قسمتهای بعدی است.
برای ثبت پرسش ابتدا در سایت وارد شوید.