زیاد پیش می آید که اطلاعاتی دارید که می خواهید به برنامه های خود وارد و یا از آن خارج کنید، البته نه فقط از صفحه کلید و کنسول. تبادل اطلاعات از طریق فایل های متنی یک روش رایج برای اشتراک گذاری اطلاعات بین برنامه ها است. یکی از محبوب ترین فرمت ها برای تبادل داده، فرمت CSV است. اما چگونه از آن استفاده می کنید؟
بیایید یک چیز را روشن کنیم: شما مجبور نیستید (و نخواهید شد) که کد تجزیه کننده CSV خود را از ابتدا بسازید. چندین کتابخانه کاملاً قابل قبول از قبل وجود دارد که می توانید از آنها استفاده کنید. کتابخانه داخلی csv در پایتون برای اکثر موارد مربوط به تجزیه فایل csv کار خواهد کرد. اگر هم کار شما داده های زیادی دارد و یا تجزیه و تحلیل عددی نیاز دارد، کتابخانه pandas که دارای قابلیت تجزیه CSV نیز هست، برای مدیریت این موارد کافی است.
در این مقاله، نحوه خواندن، پردازش و تجزیه CSV از فایل های متنی را با استفاده از پایتون خواهید آموخت. خواهید دید که فایلهای CSV چگونه کار میکنند، در مورد csv، کتابخانه بسیار مهم تعبیهشده در پایتون را یاد میگیرید و خواهید دید که تجزیه CSV با استفاده از کتابخانه pandas چگونه کار میکند .
پس بیایید شروع کنیم!
فایل CSV چیست؟
فایل CSV (فایل مقادیر جدا شده با کاما) نوعی فایل متنی ساده است که از ساختار خاصی برای مرتب کردن داده های جدولی استفاده می کند. از آنجایی که یک فایل متنی ساده است، فقط میتواند حاوی دادههای متنی واقعی باشد – به عبارت دیگر، کاراکترهای ASCII و یا Unicode قابل چاپ .
ساختار یک فایل CSV با نام آن مشخص شده است. به طور معمول، فایلهای CSV از یک کاما برای جدا کردن هر مقدار داده خاص استفاده میکنند. این ساختار به شکل زیر است:
column 1 name,column 2 name, column 3 name
first row data 1,first row data 2,first row data 3
second row data 1,second row data 2,second row data 3
...
توجه کنید که چگونه هر قطعه داده با کاما از هم جدا می شود. به طور معمول، خط اول فایل، عنوانِ هر بخش از داده را مشخص می کند – به عبارت دیگر، نام ستون داده را. هر خط بعدی پس از آن داده واقعی است که فقط با محدودیت اندازه فایل محدود می شود.
به طور کلی کاراکتر جداکننده، “جداکننده یا delimiter” نامیده می شود و کاما تنها علامت مورد استفاده نیست. دیگر جداکننده های محبوب عبارتند از تب ( \t
)، کولون ( :
) و نیم دونقطه ( ;
). تجزیه صحیح یک فایل CSV مستلزم آن است که بدانیم از کدام جداکننده استفاده می شود.
دیدگاهها