پایتون یک زبان برنامه نویسی همه منظوره محبوب است. سینتکس واضح آن، باعث می شود، گزینه ایده آلی برای یادگیری برای مبتدیان باشد. یکی از مزایای این زبان تعداد زیاد کتابخانه های منبع باز موجود آن است. کتابخانه های پایتون، گروهی از ماژول های مرتبط به هم هستند. میتوانید از این ماژولها در برنامههای خود برای سادهتر و سریعتر کردن کدنویسی استفاده کنید – بهعنوان مثال به جای نوشتن تابع اختصاصی خود برای باز کردن یک فایل اکسل، میتوانید از یکی از کتابخانهها به نام pandas
استفاده کنید.
بسیاری از کتابخانه ها و ماژول ها با نصب پایتون به صورت پیش فرض ارائه می شوند، در حالی که بقیه آن ها را باید جداگانه دانلود کنید. پس از نصب، می توان آنها را به راحتی به پروژه وارد کرد و به شما امکان دسترسی مستقیم به عملکردهای اضافی را می دهد. در این مقاله، تعدادی از مهمترین و مفیدترین کتابخانههایی را که باید بهعنوان یک برنامهنویس مبتدی پایتون بشناسید، به شما نشان میدهیم.
اگر هنوز با اصول اولیه پایتون آشنا نیستند، ابتدا پیشنهاد می کنم با استفاده از دوره آموزش تعاملی پایتون ما، مسائل مقدماتی را آموزش ببینید و سپس برای یادگیری بیشتر به سراغ مطالعه ادامه این مطلب بیایید.
اکنون که می دانیم کتابخانه ها چیست و چگونه سفر یادگیری پایتون خود را آغاز کنیم، بیایید در مورد کتابخانه هایی از پایتون که مبتدیان باید بدانند صحبت کنیم.
7 بهترین کتابخانه پایتون برای برنامه نویسان جدید
در زیر لیستی از کتابخانه های پایتون آورده شده است که هر مبتدی باید بداند. ممکن است نخواهید همه آنها را با جزئیات یاد بگیرید، اما باید با کارهایی که آنها می توانند انجام دهند آشنا شوید.
1. NumPy
NumPy یکی از پرکاربردترین کتابخانه های پایتون است. دارای قابلیتی برای محاسبات عددی سریع و کارآمد است، اما قدرت آن در “کار با آرایه ها” نهفته است. در پایتون، آرایه ها می توانند شامل اعداد صحیح، اعشاری، رشته ها یا حتی اعداد مختلط باشند. به عنوان مثال، یک آرایه 2 بعدی NumPy را می توان به صورت زیر ایجاد کرد:
import numpy as np
ar = np.array([[1, 2, 3], [4, 5, 6]])
print(ar)
#[[1 2 3]
# [4 5 6]]
همچنین میتوانیم به طور بهینه، جذر هر عنصر را محاسبه کنیم یا برخی از محاسبات دیگر را برای همه دادهها به طور همزمان با سرعت خوبی انجام دهیم:
print(np.sqrt(ar))
#[[1. 1.41421356 1.73205081],
# [2. 2.23606798 2.44948974]]
اگر نیاز به کار با حجم زیادی از داده های عددی دارید، غیر از NumPy به دنبال چیز دیگری نگردید.
2. pandas
کتابخانه pandas به ستون فقرات تجزیه و تحلیل داده ها در پایتون تبدیل شده است. برای کسانی از شما که می خواهید سینتکس کار با داده ها را بیاموزید، باید کار با این کتابخانه را بدانید. با pandas، می توانید داده ها را از یک فایل بخوانید، تجزیه و تحلیل و تجسم داده های استخراج شده را انجام دهید، داده ها را دستکاری کنید، آمار را محاسبه کنید و خیلی چیزهای دیگر.
فرض کنید یک فایل اکسل حاوی نمرات دانش آموزان در دروس مختلف دارید. ما می توانیم از pandas برای خواندن آسان فایل ها استفاده کنیم:
import pandas as pd
df = pd.read_excel('grades.xlsx', index_col='name')
print(df)
"""
physics geography french
name
Sam 68 81 78
Aiko 91 84 88
Lisa 62 73 74
Jonas 72 57 60
"""
اکنون می توانیم میانگین نمرات هر دانش آموز را محاسبه کنیم:
print(df.mean(axis=1))
"""
name
Sam 75.666667
Aiko 87.666667
Lisa 69.666667
Jonas 63.000000
"""
همچنین میتوان آن را با دادههای دانشآموزان در کلاس دیگر ادغام کرد و برای یافتن دانشآموزانی که بالاترین نمرات را دارند، داده ها را فیلتر کرد. سپس نتایج را می توان در یک فایل جدید نوشت؛ همه فقط با چند خط کد.
3. matplotlib
تولید نمودار های زیبا، به سرعت و به راحتی، یک مهارت کلیدی برای بسیاری از پروژه های پایتون است. اگرچه کتابخانه های زیادی برای تولید انواع مختلف نمودارها در پایتون وجود دارد، matplotlib باید اولین انتخاب شما باشد. چرا که استفاده از آن آسان بوده و مستندات زیادی برای آن ارائه شده است.
4. os
این یکی به اندازه برخی از کتابخانه های پایتون دیگر در این لیست جذاب نیست. با این حال، زمانی که نیاز به تعامل با سیستم عامل از داخل برنامه پایتون خود دارید، به کارتان می آید. به عنوان مثال، میتوانید دایرکتوری فعلی پروژه خود را دریافت کنید و فایلهای موجود در آن را فهرست کنید:
import os
root_directory = os.getcwd()
file_list = os.listdir(root_directory)
پس از اینکه لیست فایلهای خود را تهیه کردید، میتوانید تعدادی را انتخاب کنید و با استفاده از os.rename() یا os.replace()
آنها را به دایرکتوری دیگری منتقل کنید و مجوزها را با استفاده از os.chmod()
تغییر دهید. برای اطلاعات بیشتر ، اسناد رسمی پایتون را در این مورد بررسی کنید.
5. datetime
اگر میخواهید در پروژه پایتون خود با تاریخها یا زمانها کار کنید، با کتابخانه DATETIME به کتابخانه دیگری نیاز نخواهید داشت. با این کتابخانه می توانید تاریخ ها و زمان ها را به عنوان اشیا تعریف کرده و آنها را دستکاری کنید. به عنوان مثال اضافه کردن تعداد معینی از روزها یا محاسبه زمان بین دو شیء تاریخ. این کار شما را از نگرانی در مورد تعداد روزهای مختلف در هر ماه یا سال کبیسه نجات می دهد. حتی می توانید اشیاء تاریخ خود را از منطقه زمانی خود آگاه کنید. در اینجا سینتکسی برای محاسبه “چند روز از تولد شما گذشته است” آورده شده است:
import datetime as dt
date_of_birth = dt.datetime(1990, 3, 12)
print(dt.datetime.today() - date_of_birth)
#11818 days, 17:17:27.865661
اگر نمونه های بیشتری می خواهید، به مقاله معرفی چند ماژول برای کار با تاریخ و زمان در پایتون نگاهی بیندازید.
6. statsmodels
انجام عملیات آماری بخش مهمی از برنامه ریزی علمی است. شما چند گزینه برای انتخاب دارید (مثلاً استفاده از NumPy یا pandas برای محاسبه میانگین). با این حال، statsmodels پا را فراتر می برد و توابعی را برای تخمین بسیاری از مدل های آماری مختلف و انجام تست های آماری ارائه می دهد.
این کتابخانه بر اساس NumPy و SCIPY (یکی دیگر از کتابخانه های عالی برای محاسبات علمی) ساخته شده است. با statsmodels، می توانید به راحتی یک مدل رگرسیون را به برخی از داده ها تطبیق دهید و خلاصه نتایج را که حاوی پارامترهای مدل، متریک مربع r، آماره f و بسیاری اطلاعات دیگر از داده است، چاپ کنید. اگر به دنبال جزئیات بیشتر هستید، مستندات STATSMODELS را مطالعه کنید.
7. scikit-learn
اگر میخواهید وارد یادگیری ماشین شوید، این کتابخانه باید در صدر لیست شما باشد. این کتابخانه شامل عملکردی برای انجام هر کاری یادگیری ماشین است:
- داده ها را بارگیری، تمیز و آماده می کند.
- داده ها را به مجموعه های یادگیری و آزمایش تقسیم می کند.
- ویژگی ها را مجاسبه می کند
- یک الگوریتم نظارت شده یا بدون نظارت را آموزش می دهد.
- عملکرد یک الگوریتم را ارزیابی می کند
شما می توانید از scikit-learn برای بسیاری از پروژه های یادگیری ماشینی استفاده کنید، صرف نظر از اینکه با داده های عددی، متن یا تصاویر کار می کنید.
کتابخانه scikit-learn حتی شامل مجموعهای از دادههای آزمایشی است که میتوانید مستقیماً به پایتون وارد کنید. این بدان معناست که اگر میخواهید کمی تجربه در یادگیری ماشین داشته باشید، لازم نیست از همان ابتدا دادههای خود را پیدا کنید. در اینجا سینتکس بارگیری دیتاست معروف iris آمده است :
from sklearn.datasets import load_iris
x = data.data
y = data.target
از اینجا، می توانید با محاسبه مقادیر متوسط با استفاده از NumPy یا کشیدن نمودار داده ها با استفاده از matplotlib، تجزیه و تحلیل داده های استخراج شده را انجام دهید. حتی میتوانید آرایههای x و y را در دیتافریم pandas قرار دهید تا دستکاری دادهها را تمرین کنید. برای چالش بیشتر، می توانید از scikit-learn برای انجام یک تحلیل خوشه ای استفاده کنید. اگر بتوانید این را مدیریت کنید، در راه تبدیل شدن به یک استاد یادگیری ماشینی هستید!
کتابخانه های پایتون بیشتری می خواهید؟
آنقدر کتابخانه های خارق العاده پایتون وجود دارد که به سختی می توان آنها را به لیست مهم ترین ها محدود کرد. صرف نظر از کاری که می خواهید در پایتون انجام دهید، به احتمال زیاد کتابخانه ای برای آن وجود دارد. همیشه قبل از نوشتن کد خود، خوب است که ببینید آیا کتابخانه ای از قبل برای آن وجود دارد یا خیر (که البته اکثر اوقات وجود دارد!). این کار زندگی شما را آسان تر و برنامه های شما را قوی تر می کند.
ممنون از این مقاله کاربردی