بکندباز

هوش مصنوعی در پایتون

هوش مصنوعی بیش از نیم قرن است که وارد عرصه فناوری شده و سرعت پیشرفت‌های آن روز به روز بیشتر می‌شود. این روزها تقاضا برای هوش مصنوعی به اوج خود رسیده و اگر شما هم به یادگیری آن علاقه‌مند هستید، جای درستی آمده‌اید. این مطلب درباره هوش مصنوعی با پایتون به شما کمک می‌کند تا تمامی مفاهیم پایه‌ای این حوزه را به همراه پیاده‌سازی‌های عملی در پایتون به خوبی درک کنید.

در این مقاله به موضوعات زیر پرداخته شده است:

  • چرا پایتون بهترین زبان برای هوش مصنوعی است؟
  • تقاضا برای هوش مصنوعی
  • هوش مصنوعی چیست؟
  • انواع هوش مصنوعی
  • مبانی یادگیری ماشین
  • انواع یادگیری ماشین
  • انواع مسائلی که با استفاده از یادگیری ماشین حل می‌شوند
  • فرآیند یادگیری ماشین

 

چرا پایتون بهترین انتخاب برای هوش مصنوعی است؟

خیلی‌ها از من می‌پرسند: «بهترین زبان برنامه‌نویسی برای هوش مصنوعی چیست؟» یا «چرا از پایتون برای هوش مصنوعی استفاده می‌شود؟»

با وجود اینکه پایتون یک زبان برنامه‌نویسی عمومی است، توانسته جایگاه خود را در پیچیده‌ترین حوزه‌های فناوری مانند هوش مصنوعی، یادگیری ماشین و یادگیری عمیق پیدا کند. داشتن مدرک برنامه‌نویسی پایتون یک مزیت بزرگ محسوب می‌شود، به‌خصوص در مقایسه با سایر توسعه‌دهندگانی که این مهارت را ندارند.

اما چرا پایتون تا این حد در این حوزه‌ها محبوب شده است؟ دلایل زیر به این سؤال پاسخ می‌دهند:

  1. کد کمتر: پیاده‌سازی هوش مصنوعی به الگوریتم‌های زیادی نیاز دارد. خوشبختانه، به لطف وجود بسته‌های از پیش تعریف‌شده در پایتون، نیاز به نوشتن الگوریتم‌ها از ابتدا نداریم. پایتون همچنین رویکردی به نام “چک کردن هنگام کدنویسی” ارائه می‌دهد که بار تست کد را کاهش می‌دهد.
  2. کتابخانه‌های پیش‌ساخته: پایتون دارای صدها کتابخانه پیش‌ساخته است که به ما اجازه می‌دهد الگوریتم‌های یادگیری ماشین و یادگیری عمیق را به راحتی پیاده‌سازی کنیم. مثال‌هایی از این کتابخانه‌ها عبارتند از: NumPy، Keras، Tensorflow و Pytorch.
  3. آسانی یادگیری: سینتکس پایتون بسیار ساده است و می‌توان از آن برای انجام محاسبات ساده مثل جمع دو رشته یا فرآیندهای پیچیده مانند ساخت مدل یادگیری ماشین استفاده کرد.
  4. پلتفرم مستقل: پایتون روی پلتفرم‌های مختلفی مثل ویندوز، مک، لینوکس و یونیکس قابل اجراست. برای انتقال کد از یک پلتفرم به دیگری، می‌توانید از بسته‌هایی مانند PyInstaller استفاده کنید که مشکلات وابستگی‌ها را برطرف می‌کند.
  5. حمایت گسترده جامعه: پایتون دارای جامعه بزرگی از کاربران است که همیشه در مواجهه با خطاهای کدنویسی به کمک یکدیگر می‌شتابند. انجمن‌ها، گروه‌ها و فروم‌های متعددی وجود دارند که برنامه‌نویسان در آن‌ها مشکلات خود را مطرح و راه‌حل دریافت می‌کنند.

معرفی چند کتابخانه مهم پایتون برای هوش مصنوعی:

  • TensorFlow: کتابخانه‌ای که توسط گوگل توسعه یافته و معمولاً برای نوشتن الگوریتم‌های یادگیری ماشین و محاسبات سنگین مربوط به شبکه‌های عصبی استفاده می‌شود.
  • Scikit-Learn: این کتابخانه که به همراه NumPy و SciPy مورد استفاده قرار می‌گیرد، یکی از بهترین ابزارها برای کار با داده‌های پیچیده است.
  • NumPy: کتابخانه‌ای که برای محاسبات علمی و ریاضی به کار می‌رود.
  • Theano: این کتابخانه به طور خاص برای انجام محاسبات پیچیده ریاضی که شامل آرایه‌های چندبعدی می‌شود، طراحی شده است.
  • Keras: یک کتابخانه قدرتمند که پیاده‌سازی شبکه‌های عصبی را ساده‌تر می‌کند. همچنین برای محاسبه مدل‌ها، ارزیابی داده‌ها و تجسم گراف‌ها قابلیت‌های بسیار خوبی دارد.
  • NLTK: کتابخانه‌ای منبع‌باز که به طور خاص برای پردازش زبان طبیعی، تحلیل متون و استخراج داده‌های متنی طراحی شده است.

اکنون که با مهم‌ترین کتابخانه‌های پایتون در حوزه هوش مصنوعی آشنا شدید، بیایید به مفاهیم اصلی هوش مصنوعی بپردازیم. در بخش بعدی تمامی اصول پایه‌ای هوش مصنوعی را بررسی خواهیم کرد.

ابتدا بیایید با درک علت افزایش ناگهانی تقاضا برای هوش مصنوعی شروع کنیم.

تقاضا برای هوش مصنوعی

از زمان پیدایش هوش مصنوعی در دهه ۱۹۵۰، شاهد رشد چشمگیر قابلیت‌های آن بوده‌ایم. اما اگر هوش مصنوعی بیش از نیم قرن قدمت دارد، چرا به تازگی این‌قدر اهمیت پیدا کرده؟ چرا حالا همه درباره هوش مصنوعی صحبت می‌کنند؟

دلیل اصلی این محبوبیت گسترده هوش مصنوعی موارد زیر است:

  1. قدرت پردازشی بیشتر: پیاده‌سازی هوش مصنوعی نیازمند توان پردازشی بسیار بالاست؛ زیرا ساخت مدل‌های هوش مصنوعی شامل محاسبات سنگین و استفاده از شبکه‌های عصبی پیچیده می‌شود. اختراع پردازنده‌های گرافیکی (GPU) این امر را ممکن کرده و حالا می‌توانیم محاسبات سطح بالا و الگوریتم‌های پیچیده را پیاده‌سازی کنیم.
  2. تولید داده‌های بیشتر: در سال‌های اخیر، حجم عظیمی از داده تولید شده که باید با استفاده از الگوریتم‌های یادگیری ماشین و دیگر تکنیک‌های هوش مصنوعی تحلیل و پردازش شود.
  3. الگوریتم‌های کارآمدتر: در دهه گذشته، موفق به توسعه الگوریتم‌های پیشرفته‌ای شده‌ایم که شبکه‌های عصبی عمیق را پیاده‌سازی می‌کنند.
  4. سرمایه‌گذاری گسترده: شرکت‌های بزرگی مثل تسلا، نتفلیکس و فیسبوک با سرمایه‌گذاری در هوش مصنوعی، محبوبیت آن را افزایش دادند که در نتیجه تقاضا برای سیستم‌های مبتنی بر هوش مصنوعی هم رشد چشمگیری داشت.

رشد هوش مصنوعی با سرعتی شتابان در حال انجام است و به سرعت در حال افزودن به اقتصاد جهانی است. به همین دلیل، اکنون بهترین زمان برای ورود به حوزه هوش مصنوعی است.

اگر می‌خواهید سریع‌تر در زمینه هوش مصنوعی و یادگیری ماشین (AIML) پیشرفت کنید، دوره‌های آموزشی هوش مصنوعی را در «Edureka» دنبال کنید که شامل آموزش زنده با مدرس، پروژه‌های عملی و اخذ گواهینامه است.

برای کاهش خطای انسانی و افزایش بهره‌وری، ابزارهای هوش مصنوعی در تمامی صنایع مورد استفاده قرار می‌گیرند. به عنوان مثال، در حوزه منابع انسانی (HR)، هوش مصنوعی به غربالگری رزومه‌ها، فرآیند استخدام، ورود کارمندان جدید، و حتی امور حقوق و دستمزد کمک می‌کند.

هوش مصنوعی چیست؟

اصطلاح هوش مصنوعی (AI) برای اولین بار در سال ۱۹۵۶ توسط «جان مک‌کارتی» در کنفرانس دارتموث مطرح شد. او هوش مصنوعی را این‌گونه تعریف کرد:
“علم و مهندسی ساخت ماشین‌های هوشمند.”

به عبارت دیگر، هوش مصنوعی علم ایجاد ماشین‌هایی است که بتوانند مثل انسان فکر کرده و تصمیم بگیرند.

در سال‌های اخیر، هوش مصنوعی موفق شده است تا با ساخت ماشین‌ها و ربات‌هایی که در حوزه‌های مختلف از جمله سلامت، رباتیک، بازاریابی و تحلیل کسب‌وکار کاربرد دارند، این هدف را محقق کند.

حالا بیایید درباره مراحل مختلف تکامل هوش مصنوعی صحبت کنیم.

انواع هوش مصنوعی

هوش مصنوعی در سه مرحله تکاملی تقسیم‌بندی می‌شود:

  1. هوش مصنوعی محدود (Narrow AI)
    این نوع هوش مصنوعی که به نام “ضعیف” نیز شناخته می‌شود، فقط برای انجام وظایف خاص به کار می‌رود. سیستم‌های هوش مصنوعی موجود که ادعای استفاده از این فناوری را دارند، در واقع در این دسته قرار می‌گیرند. الکسا، موتور جستجوی گوگل، خودروهای خودران و حتی «آلفاگو» مثال‌هایی از هوش مصنوعی محدود هستند. این سیستم‌ها در محدوده عملکرد از پیش تعریف‌شده‌ای عمل می‌کنند و هوش یا آگاهی واقعی ندارند.
  2. هوش مصنوعی عمومی (General AI)
    این نوع هوش مصنوعی، معروف به “قوی”، ماشین‌هایی را شامل می‌شود که توانایی انجام هر وظیفه فکری که یک انسان قادر به انجام آن است را دارند. اگرچه این ماشین‌ها واحد پردازشی بسیار قدرتمندی دارند و می‌توانند محاسبات سطح بالا را انجام دهند، اما هنوز به سطح تفکر و استدلال انسانی نرسیده‌اند. بسیاری از متخصصان حتی شک دارند که هوش مصنوعی عمومی امکان‌پذیر باشد و برخی نیز درباره مطلوب بودن آن تردید دارند.
    استیون هاوکینگ هشدار داده بود که:
    “هوش مصنوعی قوی به‌طور خودکار رشد خواهد کرد و با سرعت فزاینده‌ای خود را بازطراحی خواهد کرد. انسان‌ها که محدود به تکامل زیستی آهسته هستند، نمی‌توانند رقابت کنند و جایگزین خواهند شد.”
  3. هوش مصنوعی فوق‌العاده (Super AI)
    هوش مصنوعی فوق‌العاده زمانی را توصیف می‌کند که توانایی‌های کامپیوترها از انسان‌ها فراتر رود. این وضعیت در حال حاضر به عنوان یک سناریوی فرضی دیده می‌شود، چیزی که در فیلم‌ها و کتاب‌های علمی-تخیلی به تصویر کشیده شده است؛ جایی که ماشین‌ها کنترل دنیا را به دست می‌گیرند. با این حال، نوابغ فناوری مثل ایلان ماسک باور دارند که تا سال ۲۰۴۰، هوش مصنوعی فوق‌العاده بر جهان تسلط خواهد یافت!

نظر شما درباره هوش مصنوعی فوق‌العاده چیست؟ در بخش نظرات منتظر دیدگاه‌های شما هستم.

قبل از اینکه به جزئیات بیشتری بپردازم، باید یک تصور اشتباه رایج را روشن کنم. این سوالی است که تقریباً هر مبتدی از من پرسیده است:

تفاوت هوش مصنوعی، یادگیری ماشین و یادگیری عمیق چیست؟
آیا هوش مصنوعی همان یادگیری ماشین است؟

بیایید این موضوع را دقیق‌تر بررسی کنیم:

هوش مصنوعی در مقابل یادگیری ماشین و یادگیری عمیق (AI vs ML vs DL)

بسیاری از افراد فکر می‌کنند که هوش مصنوعی (AI)، یادگیری ماشین (ML) و یادگیری عمیق (DL) یکسان هستند؛ چرا که این فناوری‌ها کاربردهای مشابهی دارند. برای مثال، سیری (Siri) یک نمونه از کاربردهای هوش مصنوعی، یادگیری ماشین و یادگیری عمیق است.

اما این فناوری‌ها چگونه به هم مرتبط‌اند؟

  • هوش مصنوعی (AI) علم این است که ماشین‌ها را به گونه‌ای برنامه‌ریزی کنیم که رفتار انسان‌ها را تقلید کنند.
  • یادگیری ماشین (ML) زیرمجموعه‌ای از هوش مصنوعی است که تمرکزش بر این است که ماشین‌ها بتوانند با استفاده از داده‌ها تصمیم‌گیری کنند.
  • یادگیری عمیق (DL) نیز زیرمجموعه‌ای از یادگیری ماشین است که با استفاده از شبکه‌های عصبی پیچیده به حل مسائل دشوار می‌پردازد.

به طور خلاصه، هوش مصنوعی، یادگیری ماشین و یادگیری عمیق سه حوزه مرتبط هستند. یادگیری ماشین و یادگیری عمیق به هوش مصنوعی کمک می‌کنند تا از طریق الگوریتم‌ها و شبکه‌های عصبی مسائل مبتنی بر داده را حل کند.

البته، هوش مصنوعی تنها به یادگیری ماشین و یادگیری عمیق محدود نمی‌شود. این حوزه شامل زمینه‌های گسترده‌تری مانند پردازش زبان طبیعی (NLP)، تشخیص اشیا، بینایی کامپیوتر، رباتیک، سیستم‌های خبره و موارد دیگر است.

به عنوان مثال، استفاده از هوش مصنوعی در حوزه مالی می‌تواند فعالیت‌های کلاهبرداری مثل سرقت هویت، تقلب با کارت اعتباری و فیشینگ را شناسایی و پیشگیری کند. این تکنولوژی از ضررهای مالی و آسیب به اعتبار شرکت‌ها جلوگیری می‌کند.

حالا بیایید به سراغ یادگیری ماشین برویم.

مبانی یادگیری ماشین

اصطلاح یادگیری ماشین برای اولین بار توسط «آرتور ساموئل» در سال ۱۹۵۹ مطرح شد. اگر به عقب برگردیم، آن سال احتمالاً یکی از مهم‌ترین سال‌ها در پیشرفت‌های تکنولوژیکی بود.

به زبان ساده:

یادگیری ماشین زیرمجموعه‌ای از هوش مصنوعی است که به ماشین‌ها این امکان را می‌دهد تا به‌صورت خودکار از طریق داده‌هایی که به آن‌ها داده می‌شود، یاد بگیرند و با تجربه بهبود یابند. بنابراین، یادگیری ماشین یک روش است که به ماشین‌ها کمک می‌کند با کسب توانایی “فکر کردن”، مسائل را حل کنند.

اما چطور یک ماشین می‌تواند تصمیم‌گیری کند؟

اگر به یک ماشین مقدار زیادی داده بدهید، می‌تواند با استفاده از الگوریتم‌های یادگیری ماشین، این داده‌ها را تفسیر، پردازش و تحلیل کند.

در این فرآیند:

  1. ابتدا مقدار زیادی داده به ماشین داده می‌شود.
  2. ماشین روی این داده‌ها آموزش می‌بیند تا الگوها و بینش‌های پنهان را شناسایی کند.
  3. سپس این بینش‌ها برای ساخت یک مدل یادگیری ماشین استفاده می‌شود که بتواند یک مسئله را حل کند.

حالا که با یادگیری ماشین آشنا شدیم، بیایید انواع مختلف یادگیری ماشین را بررسی کنیم.

انواع یادگیری ماشین

یک ماشین می‌تواند از یکی از این سه روش برای حل یک مسئله استفاده کند:

  • یادگیری نظارت‌شده (Supervised Learning)
  • یادگیری بدون نظارت (Unsupervised Learning)
  • یادگیری تقویتی (Reinforcement Learning)

یادگیری نظارت‌شده

یادگیری نظارت‌شده روشی است که در آن ما به ماشین با استفاده از داده‌های “برچسب‌گذاری شده” آموزش می‌دهیم.

برای درک بهتر این مفهوم، فرض کنید در کودکی هنگام حل مسائل ریاضی نیاز به کمک معلم داشتیم. معلم به ما یاد می‌داد جمع کردن چیست و چگونه انجام می‌شود. به همین شکل، در یادگیری نظارت‌شده، داده‌های برچسب‌گذاری شده نقش معلم را دارند و به ماشین کمک می‌کنند تا الگوهای داده‌ها را بفهمد.

مثلاً فرض کنید تصاویری از «تام» و «جری» به ماشین داده می‌شود و هدف این است که ماشین بتواند این تصاویر را به دو دسته «تام» و «جری» طبقه‌بندی کند. داده‌های آموزشی که به مدل داده می‌شود برچسب‌گذاری شده است، یعنی ما به ماشین می‌گوییم «این تصویر تام است و این یکی جری». به این ترتیب، ماشین با استفاده از داده‌های برچسب‌گذاری شده آموزش می‌بیند.

یادگیری بدون نظارت

در یادگیری بدون نظارت، آموزش ماشین با داده‌های بدون برچسب انجام می‌شود و مدل باید بدون راهنمایی روی این اطلاعات عمل کند.

در این نوع یادگیری، ماشین نمی‌داند که «این تصویر تام است و این یکی جری»، بلکه باید خودش از طریق تحلیل داده‌های زیاد، تفاوت‌ها و الگوهای موجود بین تام و جری را کشف کند.

مثلاً، ماشین با تحلیل ویژگی‌های برجسته تام مثل گوش‌های نوک‌تیز و اندازه بزرگ‌تر، متوجه می‌شود که این تصویر متعلق به نوع ۱ است. به همین شکل، ویژگی‌های جری را نیز شناسایی می‌کند و نتیجه می‌گیرد که این تصویر متعلق به نوع ۲ است. این فرآیند بدون اینکه ماشین بداند کدام تصویر مربوط به تام یا جری است انجام می‌شود.

یادگیری تقویتی

یادگیری تقویتی شاخه‌ای از یادگیری ماشین است که در آن یک عامل (Agent) در یک محیط قرار داده می‌شود و این عامل با انجام اعمال مختلف و مشاهده پاداش‌هایی که از آن‌ها دریافت می‌کند، یاد می‌گیرد چگونه در آن محیط رفتار کند.

فرض کنید شما را در یک جزیره دورافتاده رها کرده‌اند. در ابتدا احتمالاً مضطرب خواهید شد، اما با گذشت زمان یاد می‌گیرید چگونه در آن جزیره زنده بمانید. شما محیط را کاوش می‌کنید، شرایط آب و هوا را درک می‌کنید، نوع غذاهایی که در آنجا رشد می‌کنند را پیدا می‌کنید و با خطرات آنجا آشنا می‌شوید.

این دقیقاً همان روشی است که یادگیری تقویتی کار می‌کند. در اینجا، یک عامل (شما در جزیره) در یک محیط ناشناخته (جزیره) قرار می‌گیرد و باید از طریق انجام اعمال و مشاهده پاداش‌ها یاد بگیرد.

یادگیری تقویتی بیشتر در حوزه‌های پیشرفته‌ای مثل خودروهای خودران و «آلفاگو» استفاده می‌شود.

این خلاصه‌ای بود از انواع یادگیری ماشین. حالا بیایید نگاهی به مسائلی بیندازیم که می‌توان با استفاده از یادگیری ماشین حل کرد.

چه مسائلی را می‌توان با یادگیری ماشین حل کرد؟

یادگیری ماشین می‌تواند سه نوع مسئله اصلی را حل کند:

رگرسیون چیست؟

در این نوع مسئله، خروجی یک مقدار پیوسته است. برای مثال، اگر بخواهید سرعت یک خودرو را بر اساس مسافت طی‌شده پیش‌بینی کنید، این یک مسئله رگرسیون است. مسائل رگرسیون با استفاده از الگوریتم‌های یادگیری نظارت‌شده مثل رگرسیون خطی حل می‌شوند.

طبقه‌بندی چیست؟

در این نوع مسائل، خروجی یک مقدار دسته‌ای (یا طبقه‌بندی‌شده) است. برای مثال، طبقه‌بندی ایمیل‌ها به دو دسته اسپم و غیر اسپم یک مسئله طبقه‌بندی است که می‌توان آن را با استفاده از الگوریتم‌های نظارت‌شده مانند ماشین بردار پشتیبانی (SVM)، بیز ساده، رگرسیون لجستیک یا نزدیک‌ترین همسایه حل کرد.

خوشه‌بندی چیست؟

در مسائل خوشه‌بندی، ورودی‌ها بر اساس شباهت ویژگی‌ها به دو یا چند دسته (خوشه) تقسیم می‌شوند. برای مثال، می‌توان بینندگان یک سرویس آنلاین را بر اساس علایق، سن، موقعیت جغرافیایی و غیره به خوشه‌های مشابه دسته‌بندی کرد. این کار با استفاده از الگوریتم‌های یادگیری بدون نظارت مانند خوشه‌بندی K-میانگین انجام می‌شود.

در جدول زیر تفاوت‌های بین رگرسیون، طبقه‌بندی و خوشه‌بندی نشان داده شده است:

نوع مسئله رگرسیون طبقه‌بندی خوشه‌بندی
خروجی پیوسته دسته‌ای دسته‌بندی نشده
کاربرد پیش‌بینی شناسایی گروه‌بندی

مراحل فرآیند یادگیری ماشین

فرآیند یادگیری ماشین شامل ساختن یک مدل پیش‌بینی است که می‌تواند برای حل یک مسئله مورد استفاده قرار گیرد. برای درک بهتر این فرآیند، فرض کنید که به شما مسئله‌ای داده شده که باید با استفاده از یادگیری ماشین حل شود؛ مثلاً پیش‌بینی وقوع باران در منطقه شما.

مراحل زیر در فرآیند یادگیری ماشین دنبال می‌شود:

مرحله ۱: تعریف هدف مسئله

در این مرحله، باید بفهمیم دقیقاً چه چیزی را باید پیش‌بینی کنیم. در مثال ما، هدف پیش‌بینی احتمال باران با بررسی شرایط آب و هوایی است. همچنین باید به این فکر کنیم که چه نوع داده‌هایی برای حل این مسئله نیاز است و چه رویکردی باید دنبال شود.

مرحله ۲: جمع‌آوری داده‌ها

در این مرحله باید سوالاتی مانند این را بپرسیم:

  • چه نوع داده‌ای برای حل این مسئله نیاز است؟
  • آیا این داده‌ها در دسترس هستند؟
  • چگونه می‌توان این داده‌ها را جمع‌آوری کرد؟

پس از مشخص کردن نوع داده‌های مورد نیاز، باید بفهمید که چگونه می‌توانید این داده‌ها را به‌دست آورید. داده‌ها ممکن است به صورت دستی یا با استفاده از ابزارهای اینترنتی جمع‌آوری شوند. اگر تازه‌کار هستید، نگران جمع‌آوری داده‌ها نباشید؛ چرا که هزاران مجموعه داده در اینترنت وجود دارد که می‌توانید آن‌ها را دانلود و استفاده کنید.

برای مثال، داده‌های مورد نیاز برای پیش‌بینی آب و هوا شامل سطح رطوبت، دما، فشار هوا، محل جغرافیایی و اینکه آیا شما در منطقه کوهستانی زندگی می‌کنید یا خیر، می‌باشد.

مرحله ۳: آماده‌سازی داده‌ها

داده‌هایی که جمع‌آوری می‌کنید معمولاً به فرمت مناسب نیستند. ممکن است با مشکلاتی مثل مقادیر گمشده، متغیرهای اضافی یا داده‌های تکراری مواجه شوید. پاک‌سازی این نوع ناهماهنگی‌ها بسیار مهم است، چرا که ممکن است به محاسبات نادرست و پیش‌بینی‌های اشتباه منجر شوند. در این مرحله، داده‌ها را بررسی و مشکلات آن‌ها را رفع می‌کنید.

مرحله ۴: تحلیل اکتشافی داده‌ها

این مرحله مثل یک کار کارآگاهی است. باید به عمق داده‌ها بروید و الگوها و روندهای مخفی را کشف کنید. تحلیل اکتشافی داده‌ها (EDA) یک مرحله تفکر و بررسی در یادگیری ماشین است. در این مرحله، بینش‌های مفیدی از داده‌ها به دست می‌آید و روابط بین متغیرها شناخته می‌شود.

برای مثال، در پیش‌بینی باران، می‌دانیم که احتمال باران بیشتر می‌شود اگر دما کاهش یابد. این نوع ارتباطات در این مرحله شناسایی و ثبت می‌شود.

مرحله ۵: ساخت مدل یادگیری ماشین

تمام الگوها و بینش‌های به‌دست آمده از مرحله تحلیل داده‌ها در ساخت مدل یادگیری ماشین استفاده می‌شوند. این مرحله همیشه با تقسیم داده‌ها به دو بخش شروع می‌شود: داده‌های آموزشی و داده‌های آزمایشی.

داده‌های آموزشی برای ساخت و تحلیل مدل به‌کار می‌روند. منطق مدل بر اساس الگوریتم یادگیری ماشینی است که انتخاب کرده‌اید. در مثال پیش‌بینی باران، چون خروجی به صورت “درست” (باران خواهد آمد) یا “غلط” (باران نخواهد آمد) است، می‌توان از الگوریتم طبقه‌بندی مثل رگرسیون لجستیک یا درخت تصمیم‌گیری استفاده کرد.

انتخاب الگوریتم درست به نوع مسئله، داده‌ها و سطح پیچیدگی مسئله بستگی دارد.

مرحله ۶: ارزیابی و بهینه‌سازی مدل

پس از ساخت مدل با استفاده از داده‌های آموزشی، حالا وقت آن است که مدل را آزمایش کنید. داده‌های آزمایشی برای بررسی کارایی و دقت مدل استفاده می‌شوند. پس از محاسبه دقت، بهبودهای بیشتر می‌توانند در این مرحله اعمال شوند. روش‌هایی مانند تنظیم پارامترها و اعتبارسنجی متقاطع می‌توانند برای بهبود عملکرد مدل استفاده شوند.

مرحله ۷: پیش‌بینی‌ها

پس از ارزیابی و بهبود مدل، در نهایت از آن برای پیش‌بینی استفاده می‌شود. خروجی نهایی می‌تواند یک متغیر دسته‌بندی‌شده (مثل درست یا غلط) یا یک مقدار پیوسته (مثل ارزش پیش‌بینی‌شده یک سهام) باشد.

در مثال ما، خروجی پیش‌بینی وقوع باران یک متغیر دسته‌بندی‌شده خواهد بود.

 

backendbaz

مدیر وب سایت بکندباز

دیدگاه‌ها

*
*