در این دوره چه آموزش داده می شود؟
دنیای پردازش تصویر و یادگیری عمیق هر روز در حال پیشرفت است، و اگر میخواهید در این حوزه متخصص شوید، این دوره جامع بهترین نقطه شروع برای شماست. از مفاهیم ابتدایی مثل بارگیری و نمایش تصاویر با OpenCV تا تکنیکهای پیشرفتهای مانند تشخیص اشیا با YOLOv4، شبکههای عصبی پیچشی (CNN) و مدلهای از پیش آموزشدیده مانند VGG16 و EfficientNet، همه در این دوره پوشش داده شدهاند. علاوه بر این، یاد خواهید گرفت که چگونه تصاویر سیاه و سفید را رنگی کنید، پسزمینه را حذف کنید، چهرهها را تشخیص دهید و حتی تصاویر DeepFake ایجاد کنید.
این دوره نه تنها مباحث تئوری را به شما آموزش میدهد، بلکه در هر بخش، پروژههای عملی و کاربردی را نیز بررسی میکند تا بتوانید مهارتهای خود را در دنیای واقعی به کار بگیرید. از تشخیص چالههای جادهای و پلاک خودرو گرفته تا تشخیص بیماری در تصاویر اشعه ایکس، تکنیکهای پیشرفتهای که یاد میگیرید، شما را برای ورود به حوزههای متنوعی از هوش مصنوعی و بینایی کامپیوتر آماده میکند. اگر به دنبال یادگیری پردازش تصویر از پایه تا سطح حرفهای هستید، این دوره دقیقا همان چیزی است که به آن نیاز دارید!
- یادگیری گامبهگام از پایه تا پیشرفته با پروژههای عملی
- پوشش جامع جدیدترین تکنیکهای پردازش تصویر و یادگیری عمیق
- کار با کتابخانههای محبوبی مثل OpenCV، TensorFlow و Keras
- آموزش تشخیص اشیا، چهره، حرکات و حتی تولید DeepFake
- تمرینهای عملی برای تسلط بر مفاهیم پردازش تصویر و هوش مصنوعی
- استفاده از مدلهای پیشرفته مانند YOLOv4، VGG16 و EfficientNet
- پیادهسازی الگوریتمهای یادگیری عمیق روی تصاویر و ویدیوها
- آموزش تکنیکهای حذف نویز، بهبود تصویر و بازسازی عکسهای آسیبدیده
- کاربردهای متنوع در حوزههای پزشکی، امنیتی، صنعتی و تجاری
- مناسب برای علاقهمندان، برنامهنویسان و محققان هوش مصنوعی و بینایی کامپیوتر
پیش نیاز های این دوره آموزشی
برای شرکت در این دوره، داشتن دانش اولیه در برخی از حوزهها میتواند یادگیری را برای شما آسانتر کند. پیشنهاد میکنم پیش از شروع دوره، با این موارد آشنا باشید:
- مبانی پایتون – آشنایی با دستورات پایهای، توابع، لیستها، حلقهها و شرطها. (اگر تجربه برنامهنویسی ندارید، یک دوره مقدماتی پایتون میتواند کمککننده باشد.)
- آشنایی با کتابخانههای NumPy و Pandas – این دو ابزار برای کار با دادهها و پردازش ماتریسی تصاویر ضروری هستند.
- مفاهیم پایهای ریاضیات و جبر خطی – شامل ماتریسها، ضرب ماتریسی و تبدیلها که در پردازش تصویر کاربرد دارند.
- درک اولیه از پردازش تصویر – اگرچه این دوره همه چیز را از ابتدا توضیح میدهد، اما آشنایی کلی با تصاویر دیجیتال، رزولوشن، رنگها و فیلترها مفید خواهد بود.
- آشنایی مقدماتی با یادگیری ماشین و شبکههای عصبی (اختیاری) – در بخشهای پیشرفته دوره، از مدلهای یادگیری عمیق استفاده میشود، بنابراین اگر با مفاهیمی مثل شبکههای عصبی، طبقهبندی و یادگیری نظارتشده آشنا باشید، درک این بخشها برایتان آسانتر خواهد بود.
اگر برخی از این موارد را نمیدانید، نگران نباشید! در طول دوره، توضیحات کافی ارائه میشود تا بتوانید بهراحتی پیش بروید.
فصل های دوره:

به طور دقیق میتوانید سرفصلها را مشاهده کنید.
شروع به کار_ بارگیری نمایش و ذخیر کرده تصویر با OpenCv ویدئو
تصاویر سیاه و سفید ویدئو
فضاهای رنگی ویدئو
تبدیل ها – جابه جایی و چرخش تصاویر ویدئو
Scaling, Re-sizing, Interpolations and Cropping ویدئو
عملیات بیتی و ریاضی بر روی تصاویر ویدئو
مفهوم کانولوشن و تار کردن و تیز کردن تصاویر با کمک آن ویدئو
آستانه گزاری، باینری کردن و آستانه گزاری های وفقی روی تصاویر ویدئو
عملیات مورفولوژی ویدئو
لبه یابی ویدئو
کانتوریابی در تصاویر و کاربردهای آن ویدئو
مفهوم مومنتوم کانتور، تقریب و matching کانتورها ویدئو
تشخیص خط، دایره و لکه ویدئو
شمارش دایره ها، بیضی ها و یافتن والدو با تطبیق الگو ویدئو
گوشه یابی ویدئو
تشخیص چهره و چشم با طبقه بندی کننده هار آبشاری(Cascade Haar Classifier) ویدئو
تشخیص خودرو و عابر پیاده ویدئو
تبدیلات پرسپکتیو ویدئو
هیستوگرام ها و K-Means Clustering برای رنگ های غالب ویدئو
مقایسه تصاویر MSE و تشابه ساختاری ویدئو
فیلتر رنگ ویدئو
تقسیم بندی تصویر مبتنی بر نشانگر الگوریتم آبخیز ویدئو
کم کردن پس زمینه و پیش زمینه ویدئو
ردیابی حرکت با Mean Shift و CAMSHIFT ویدئو
ردیابی شی با optical flow ویدئو
ردیابی ساده اشیاء با رنگ ویدئو
تشخیص نقطه landmark چهره با Dlib ویدئو
Face Swapping with Dlib ویدئو
الگوریتم GrabCut برای حذف پس زمینه ویدئو
بارکد، تولید QR و خواندن آن ویدئو
YOLOv3 in OpenCV ویدئو
رنگی کردن عکس های سیاه و سفید با استفاده از مدل های کتابخانه caffe در OpenCV ویدئو
Inpainting برای بازیابی عکس های آسیب دیده ویدئو
اضافه کردن و حذف نویز و بهبود کنتراست با یکسان سازی هیستوگرام ویدئو
یافتن تاری در تصاویر ویدئو
تشخیص چهره با مدل های عمیق ویدئو
آموزش Keras TensorFlow CNN MNIST ویدئو
طبقه بندی نادرست Keras و تحلیل عملکرد مدل ویدئو
استفاده از LeNet و AlexNet در Tensorflow2.0 با استفاده از Keras ویدئو
مدلهای از پیش آموزشدیده VGG16، ResNet، Inceptionv3، MobileNetv2، DenseNet201، MobileMNASNet و EfficientNet در کراس ویدئو
Keras Transfer Learning and Fine Tuning ویدئو
استفاده از CNN_s به عنوان استخراج کننده ویژگی ویدئو
Google Deep Dream در کراس ویدئو
Neural Style Transfer + TF-HUB Models ویدئو
اتوانکدرها در کراس ویدئو
Generative Adversial Networks - DCGAN – MNIST ویدئو
CycleGAN - اسب ها را به گورخر تبدیل کنید ویدئو
Keras Siamese Networks ویدئو
تشخیص چهره با VGGFace در Keras ویدئو
DeepFace - Age, Gender, Expression, Headpose and Recognition ویدئو
42. Object Detection - Gun, Pistol Detector - Scaled-YOLOv4 ویدئو
Object Detection - Sign Language Detection - TFODAPI - EfficientDetD0-D7 ویدئو
تشخیص چاله با Tiny YOLOv4 ویدئو
تشخیص نوع قارچ ویدئو
Website Screenshot Region Detection ویدئو
تشخیص مهره های شطرنج ویدئو
تشخیص hardhat برای سایت های ساختمانی ویدئو
تشخیص سلولهای خونی ویدئو
DeepFakes - first-order-model ویدئو
Image Classification using BigTransfer (BiT) ویدئو
تخمین عمق با Keras ویدئو
جستجوی شباهت تصویر با استفاده از یادگیری متریک با Keras ویدئو
زیرنویس تصویر با Keras ویدئو
Video Classification with a CNN-RNN Architecture with Keras ویدئو
Video Classification with Transformers with Keras ویدئو
طبقه بندی پنومونی اشعه ایکس با استفاده از TPU ویدئو
بهبود تصویر کم نور با استفاده از MIRNet ویدئو
Detectron2 – BodyPose ویدئو
سوالات متداول
دورهها از سطح مقدماتی تا پیشرفته طراحی شدهاند
بله، اکثر دورهها شامل تمرینهای عملی و پروژههای کاربردی هستند که به درک بهتر مفاهیم کمک میکنند.
بله، پس از اتمام دوره و تکمیل پروژهها، گواهی پایان دوره به شما ارائه خواهد شد.
بله می توان در حداکثر دو قسط شهریه دوره را پرداخت نمود
پایتون یکی از محبوبترین زبانهای برنامهنویسی در دنیا است که در حوزههای مختلفی مثل هوش مصنوعی، یادگیری ماشین، توسعه وب، تحلیل داده و اتوماسیون کاربرد دارد. سادگی سینتکس و کتابخانههای قوی آن را به انتخاب اول بسیاری از برنامهنویسان تبدیل کرده است.
نه الزاماً. پایتون به دلیل سادگی، یکی از بهترین زبانها برای شروع برنامهنویسی است و نیازی به پیشزمینه قوی ندارد.
MATLAB یک ابزار قدرتمند برای پردازش دادهها، شبیهسازی، مدلسازی و محاسبات عددی است. این نرمافزار در مهندسی برق، کنترل، پردازش تصویر و بینایی ماشین کاربرد گستردهای دارد.
بستگی به نیاز شما دارد. MATLAB برای مهندسی و شبیهسازیهای عددی بسیار مناسب است، اما پایتون رایگان است و در یادگیری ماشین و توسعه نرمافزارهای هوش مصنوعی گستردهتر استفاده میشود. اگر قرار بر یک انتخاب باشد قطعا توصیه ما به شما برای یادگیری پایتون است.
دانستن جبر خطی، احتمال و آمار به فهم بهتر مفاهیم یادگیری عمیق کمک میکند، اما میتوان با یادگیری عملی و کار با فریمورکهایی مانند TensorFlow و Keras هم شروع کرد.
پردازش تصویر بیشتر روی بهبود و تغییر تصاویر تمرکز دارد، در حالی که بینایی ماشین به دنبال تحلیل و درک تصاویر برای استخراج اطلاعات مفید است.
اگر به دنبال یادگیری ماشین و تحلیل داده هستید، پایتون با کتابخانههایی مثل Pandas، NumPy، Scikit-learn و TensorFlow انتخاب بهتری است. اما MATLAB برای محاسبات عددی دقیق و مهندسی مناسبتر است.
MATLAB در شبیهسازیهای مهندسی، پردازش سیگنال، کنترل سیستمها و تحلیل دادههای عددی پیچیده قویتر است. همچنین، محیط آن برای انجام محاسبات عددی بدون نیاز به برنامهنویسی پیچیده بسیار راحتتر است.
به دلیل افزایش حجم دادهها، قدرت پردازشی بالاتر و پیشرفت الگوریتمهای یادگیری، مدلهای یادگیری ماشین اکنون میتوانند مسائل پیچیدهای را حل کنند که قبلاً غیرممکن به نظر میرسیدند.
بله، میتوان از Google Colab استفاده کرد که GPU رایگان ارائه میدهد. همچنین، بسیاری از مدلهای کوچک را میتوان روی CPU اجرا کرد.
توصیه میشود ابتدا مبانی یادگیری ماشین (مانند رگرسیون، طبقهبندی، درختهای تصمیم) را یاد گرفت، اما اگر مستقیم به یادگیری عمیق علاقهمند هستید، میتوان مستقیماً با TensorFlow و Keras شروع کرد.
روشهای کلاسیک بینایی ماشین (مثل SIFT، HOG، و الگوریتمهای مبتنی بر ویژگی) دادههای تصویری را پردازش میکنند، اما یادگیری عمیق با شبکههای عصبی کانولوشنی (CNN) ویژگیها را بهصورت خودکار از تصاویر استخراج میکند و دقت بیشتری دارد.
OpenCV یک کتابخانه قوی برای پردازش تصویر، تشخیص اشیا، ویدئو آنالیز و بسیاری از وظایف دیگر است که هم در پایتون و هم در C++ قابل استفاده است.
پزشکی: تشخیص بیماریها از تصاویر پزشکی
خودروهای خودران: تشخیص علائم راهنمایی و رانندگی
امنیت: تشخیص چهره و تحلیل ویدئو
کشاورزی: تشخیص سلامت محصولات از تصاویر ماهوارهای
میتوان از شبکههای عصبی کانولوشنی (CNN) و معماریهایی مثل YOLO و Faster R-CNN برای تشخیص اشیا، تفکیک تصاویر و تحلیل ویدئو استفاده کرد.
OpenCV به دلیل سرعت بالا، پشتیبانی از GPU، وجود توابع از پیش آماده و انعطافپذیری، در بسیاری از پروژههای پردازش تصویر و بینایی ماشین مورد استفاده قرار میگیرد.
خیر، OpenCV علاوه بر پردازش تصویر، قابلیتهایی در پردازش ویدئو، تحلیل حرکت، تشخیص اشیا سهبعدی و کار با سنسورهای عمق مانند Kinect و RealSense را نیز دارد.
بله، برخی از توابع OpenCV قابلیت اجرا روی GPU را دارند، مخصوصاً اگر از OpenCV با CUDA استفاده کنید.
بله، یادگیری این مهارتها همچنان ضروری است. ChatGPT و مدلهای هوش مصنوعی مشابه میتوانند در یادگیری کمک کنند، اما جایگزین درک عمیق مفاهیم، خلاقیت و توانایی حل مسئله توسط انسان نمیشوند. دلایل این اهمیت شامل موارد زیر است:
درک عمیق و کاربردی – ابزارهای هوش مصنوعی میتوانند پاسخهای عمومی بدهند، اما درک دقیق الگوریتمها، نحوه تنظیم مدلها، بهینهسازی، و حل مسائل پیچیده نیاز به دانش عمیق دارد که تنها با آموزش و تجربه به دست میآید.
انعطافپذیری در حل مسائل جدید – مدلهای زبانی مانند ChatGPT بر اساس دادههایی که دیدهاند پاسخ میدهند. اما اگر مسئلهای جدید یا پیچیده باشد، تنها فردی که دانش کافی دارد میتواند آن را تحلیل کرده و راهحل ارائه دهد.
کنترل کامل بر روی پروژهها – وقتی فقط به ChatGPT تکیه کنید، همیشه به مدل وابسته هستید و ممکن است راهحلهایی ارائه دهد که نیاز به اصلاح یا تنظیم داشته باشند. اما با یادگیری مفاهیم، میتوانید دقیقاً کدی بهینه و متناسب با نیاز خود بنویسید.
محدودیتهای مدلهای زبانی – این مدلها ممکن است گاهی اوقات اشتباه کنند یا پیشنهادهایی بدهند که بهینه نباشند. بدون داشتن دانش کافی، امکان تشخیص درست از نادرست وجود ندارد.
دسترسی به منابع و تغییرات جدید – بینایی ماشین و یادگیری عمیق حوزههایی هستند که دائماً در حال تغییر و پیشرفتاند. برای کار کردن در این زمینه و ارائه راهکارهای بهینه، باید توانایی خواندن مقالات جدید، درک الگوریتمهای نوین و استفاده از فریمورکهای مختلف را داشته باشید.
کاربردهای خاص و عملی – در صنایع مختلف مانند پزشکی، خودروسازی، امنیت و غیره، پیادهسازی بینایی ماشین نیاز به تنظیمات خاص، پردازش دادههای اختصاصی و بهینهسازی مدلها دارد که ChatGPT بهتنهایی قادر به انجام آنها نیست.
نتیجهگیری
ChatGPT و سایر ابزارهای هوش مصنوعی میتوانند فرآیند یادگیری را تسهیل کنند و بهعنوان یک دستیار مفید باشند، اما برای تسلط واقعی بر این حوزهها، یادگیری اصولی و عملی همچنان ضروری است.
دوره های مرتبط
دوره الکترونیک
جامع و پروژهمحور؛ پرواز هنر در مسیر تکنولوژی
با تدریس استاد امید گرویی
دوره آموزش نرم افزار MATLAB
جامع و پروژهمحور؛ پرواز هنر در مسیر تکنولوژی
با تدریس استاد امید گرویی
نظرات

امید گرویی
متخصص ماشین لرنینگایشان مدرس دورههای آکادمی امید گرویی هستند!