هوش مصنوعی

پیچیدگی پردازش تصویر در هوش مصنوعی

زمان مطالعه: 10 دقیقه

پردازش تصویر در هوش مصنوعی

این مقاله تحت حمایت قانون حقوق مؤلف می‌باشد. استفاده از این مطلب فقط با ذکر منبع مجاز می‌باشد.

پردازش تصویر در هوش مصنوعی برای تشخیص چهره و هویت افراد (مسائل امنیتی)، بازسازی تصاویر قدیمی و یا خلق تصویری که در ذهن داریم بسیار کمک می کند. در ادامه با بهترین ابزارهای Image Processing و نحوه ی عملکرد ماشین ها آشنا خواهید شد.

تصویر چیست؟

تصویر چیست

در مقاله پردازش تصویر در هوش مصنوعی می خوانیم: تصویر یک سیگنال دو بعدی است و همانند سیگنال‌ها به دو دسته‌ی آنالوگ و دیجیتال تقسیم بندی می‌شود. آنالوگ به معنی پیوسته بودن و دیجیتال به معنی گسسته بودن است. تمامی تصاویری که ما با چشم خود می‌بینیم تصویر آنالوگ هستند در این تصاویر سطوح مختلفی از روشنایی و رنگ ها را می‌بینیم. اما تصاویر دیجیتال که در کامپیوتر تعریف می شوند محدودیت هایی دارند و نمی‌توانند پیوسته باشند. احتمالا برای شما نیز پیش آمده که روی عکس های خود زوم کنید و بخش های کوچک مربعی که تصویر دیجیتالی را تشکیل می‌دهند، ببینید.

تصاویر برای ماشین ها به عنوان یک تابع دو بعدی  تعریف می‌شود. x و y مختصات فضایی هستند و دامنه ی تابع F شدت تصویر را در آن نقطه مشخص نشان می‌دهد. همانطور که گفته شد هنگامی که این مقادیر محدود باشند، یک تصویر دیجیتال داریم.

این نوع چیدمان که برای تصویر تعریف کردیم نشان می‌دهد که تصویر آرایه ای دو بعدی است که درایه‌های آن به طور خاصی در ردیف ها و ستون ها مرتب شده‌اند و به همین دلیل تصاویر به عنوان ماتریس در نظر گرفته می‌شوند. هر تصویر دیجیتال دارای تعداد محدودی عنصر با ارزش خاصی است که به آنها پیکسل می‌گویند.

چیدمان تصویر در برنامه نویسی

انواع تصویر دیجیتال

تصویر های دیجیتال به طور کلی به ۴ دسته تقسیم میشوند.

تصویر باینری

تصویر باینری

همانطور که از نامش پیداست فقط شامل دو عنصر پیکسلی ۰ و ۱ است که در آن ۰ به سیاه و ۱ اشاره به سفید دارد. این تصویر با نام تک رنگ نیز شناخته می شود.

تصویر سیاه و سفید یا خاکستری

تصویر سیاه و سفید یا خاکستری

وضوح آن نسبت به تصویر باینری بیشتر است. در این قالب، ۰ نشان دهنده ی رنگ سیاه و ۲۵۵ نشان دهنده ی رنگ سفید است و عناصری که بین ۰ و ۲۵۵ باند در طیف خاکستری قرار میگیرند.

تصویر رنگی

تصویر رنگی

تصویر رنگی یک ماتریس ۳ بعدی است. که دارای سه کانال رنگی قرمز و سبز و آبی(RGB) می‌باشد. با کم و زیاد شدن شدت هر یک از این سه رنگ، رنگ های گوناگونی به وجود می‌آید.

تصویر رنگی کنتراست بالا

تصویر رنگی کنتراست بالا

اینگونه تصاویر، تصاویر معمولی نیستند زیرا حاوی اطلاعاتی خارج از محدوده ی ادراک عادی انسان ها هستند و مستقیم توسط انسان قابل مشاهده نیست. به عنوان مثال شامل اطلاعاتی همچون داده های مادون قرمز و فرابنفش، اشعه ی ایکس، آکوستیک یا راداری می‌باشند.

پردازش تصویر (Image Processing)

پردازش تصویر نوعی پردازش سیگنال می‌باشد که ورودی آن همواره یک تصویر است و خروجی بستگی به نوع پردازش دارد. در پردازش آنالوگ، خروجی مجددا یک تصویر است اما در پردازش دیجیتال خروجی میتواند یک تصویر، اطلاعاتی از ویژگی های تصویر و یا تغییراتی باشد که روی تصویر اعمال میکنیم.

پردازش تصویر

با توجه به بلوک ۱، اگر ورودی و خروجی تصویر باشند، آن را پردازش تصویر دیجیتال (Digital image processing) می‌نامند.

با توجه به بلوک ۲، اگر ورودی یک تصویر و خروجی نوعی اطلاعات یا توضیحات باشد، به آن بینایی ماشین (Computer Vision) می گویند.

با توجه به بلوک ۳، اگر ورودی، توضیحات یا کد بوده و خروجی تصویر باشد، به آن گرافیک کامپیوتری (Computer Graphics ) می گویند.

طبق بلوک ۴، اگر ورودی، توضیحات یا چند کلمه کلیدی یا کد بوده و خروجی توضیحات یا چند کلمه کلیدی باشد، به آن هوش مصنوعی (Artificial Intelligence) می گویند.

کاربردهای پردازش تصویر دیجیتال

فناوری پردازش تصویر در علوم زیر کاربردهای گسترده ای دارد که در ادامه به توضیح هرکدام می پردازیم:

وضوح تصویر و بازیابی

یکی از کاربردهای پردازش تصویر، ایجاد تغییرات در تصویر برای رسیدن به نتیجه ی دلخواه است. این کار عمدتا با فتوشاپ انجام می شود. این شامل بزرگنمایی، محو کردن، واضح کردن، تبدیل مقیاس خاکستری به رنگ، تشخیص لبه ها و بالعکس، بازیابی تصویر و تشخیص تصویر است.

رشته پزشکی

کاربردهای رایج DIP در زمینه پزشکی به شرح زیر می باشد:

  • تصویربرداری اشعه گاما
  • اسکن PET
  • تصویربرداری اشعه ایکس
  • سی تی پزشکی
  • تصویربرداری UV

بررسی دیابت با اسکنر پوست و هوش مصنوعی

تغییرات در رگ‌های خونی کوچک از پیامدهای رایج ابتلا به دیابت است. محققان دانشگاه فنی مونیخ (TUM) و هلمهولتز مونیخ اکنون روشی را توسعه داده اند که می تواند برای اندازه گیری این تغییرات میکروواسکولار در پوست – و در نتیجه ارزیابی شدت بیماری استفاده شود. برای دستیابی به این هدف، آنها هوش مصنوعی (AI) و فناوری نوآورانه تصویربرداری اپتوآکوستیک با وضوح بالا را ترکیب کردند. این اسکنر پوست که اسمش RSOM است، امکان اندازه گیری سریع تغییرات عروقی را فراهم می کند. آنجلوس کارلاس، متخصص بالینی می‌گوید:

Other optical methods do not achieve the depth or the detail reached by RSOM

سایر روش‌های نوری به عمق یا جزئیاتی که RSOM به آن دست می‌یابد، نمی‌رسند.

سنجش از دور

برخی اطلاعات مانند آسیب های ناشی از زلزله و تغییراتی که روی پوسته‌ی زمین ایجاد شده است را نمی‌توانیم به طور ساده و به وسیله‌ی نیروی انسانی اندازه گیری کنیم اما به کمک سیستم های هوشمند ماهواره‌ای و تصاویری که به طور مداوم جمع‌آوری میشوند، می‌توان اینگونه موارد زیست محیطی را تخمین زد.

انتقال و رمزگذاری

اولین تصویری که از طریق سیم منتقل شد از لندن به نیویورک از طریق کابل زیردریایی بود. عکس زیر می باشد.

تصویر بالا سه ساعت طول کشید از مبدا لندن به نیویورک برسد. حالا فقط تصور کنید که امروز می‌توانیم ویدیوی زنده یا فیلم‌های دوربین مداربسته زنده از قاره‌ای به قاره دیگر را تنها با چند ثانیه تأخیر ببینیم. این فرآیند علاوه بر انتقال داده به رمزگذاری روی آن هم توجه دارد. بسیاری از فرمت‌های مختلف برای پهنای باند بالا یا پایین، برای رمزگذاری عکس‌ها و سپس پخش آن از طریق اینترنت یا غیره ایجاد شده‌اند.

بینایی ماشین/ربات

یکی از بزرگترین چالش های هوش مصنوعی، افزایش دید ربات است. اینکه ربات بتواند اشیاء را ببیند، آنها را شناسایی کند، و یا موانع را تشخیص دهد و مواردی از این دست، از جمله قابلیتهای بینایی ماشین است.

پردازش رنگ

تشخیص موانع یکی از کارهای رایجی است که از طریق پردازش تصویر، با شناسایی انواع مختلف اشیاء در تصویر و سپس محاسبه فاصله بین ربات و موانع انجام می شود.

الگو شناسی

اکثر ربات‌های امروزی با دنبال کردن خط کار می‌کنند و به همین دلیل ربات‌های دنبال‌کننده خط نامیده می‌شوند. خط به ربات کمک می کند تا در مسیر خود حرکت کند و برخی وظایف را انجام دهد. این نیز از طریق پردازش تصویر به دست آمده است.

پردازش ویدئو

یک ویدیو چیزی نیست جز حرکت بسیار سریع تصاویر. کیفیت ویدیو به تعداد فریم/تصاویر در دقیقه و کیفیت هر فریم استفاده شده بستگی دارد. پردازش ویدیو شامل کاهش نویز، بهبود جزئیات، تشخیص حرکت، تبدیل نرخ فریم، تبدیل نسبت تصویر، تبدیل فضای رنگ و غیره است.

تصویربرداری میکروسکوپی

پردازش تصویر و یادگیری ماشینی می تواند برای توصیف مورفولوژیکی و تشخیص خودکار تصاویر سلولی گرفته شده از اسمیر خون محیطی مفید باشد.

تصویربرداری میکروسکوپی

خلق تصاویر دیجیتال!

سایت های جدیدی بر اساس هوش مصنوعی طراحی شده اند که به کمک آنها میتوانید پردازش تصویر در هوش مصنوعی را انجام داده و عکس دلخواه خود را ویرایش یا تصویر تازه ای طراحی کنید.

سایت های بسیاری در این زمینه وجود دارند اما متاسفانه هرکدام معایبی دارند. برخی اشتراک های گران قیمتی دارند و برخی بسیار کند هستند. با این وجود تعدادی از سایت هایی که بهترین عملکرد را دارند به شما معرفی میکنیم:

وبسایت Tome.app

Tome.app یک سایت رایگان چندکاره است که بسیار مناسب دانشجویان، دانش اموزان و اساتید است. زیرا علاوه بر خلق تصویر توانایی تولید متن و پاورپوینت را دارد.

وبسایت zoo.replicate.dev

zoo.replicate.dev سایت نیز رایگان بوده و ممکن است سرعت آن پایین باشد اما امکانات بیشتری را برای ویرایش تصویر در اختیار شما قرار می‌دهد.

وبسایت gencraft.com

gencraft گرافیک جذابی دارد و کاربری و استفاده از آن بسیار آسان بوده و از سرعت بالایی نیز برخوردار است.

مزایای پردازش دیجیتال

کیفیت تصویر بهبود یافته: الگوریتم‌های پردازش تصویر دیجیتال می‌توانند کیفیت بصری تصاویر را بهبود بخشند و آنها را واضح‌تر، شفاف‌تر و حاوی اطلاعات بیشتر کنند.

وظایف مبتنی بر تصویر خودکار: پردازش تصویر دیجیتال می‌تواند بسیاری از کارهای مبتنی بر تصویر مانند تشخیص اشیا، تشخیص الگو و اندازه‌گیری را خودکار کند.

افزایش کارایی: الگوریتم‌های پردازش تصویر دیجیتال می‌توانند تصاویر را بسیار سریع‌تر از انسان‌ها پردازش کنند و تجزیه و تحلیل حجم زیادی از داده‌ها را در مدت زمان کوتاهی ممکن می‌سازند.

افزایش دقت: الگوریتم های پردازش تصویر دیجیتال می توانند نتایج دقیق تری نسبت به انسان ها ارائه دهند، به خصوص برای کارهایی که نیاز به اندازه گیری دقیق یا تجزیه و تحلیل کمی دارند.

معایب پردازش تصویر دیجیتال

هزینه محاسباتی بالا: برخی از الگوریتم های پردازش تصویر دیجیتال از نظر محاسباتی فشرده هستند و به منابع محاسباتی قابل توجهی نیاز دارند.

تفسیرپذیری محدود: برخی از الگوریتم های پردازش تصویر دیجیتال ممکن است نتایجی را ایجاد کنند که تفسیر آنها برای انسان دشوار است، به ویژه برای الگوریتم های پیچیده یا پیچیده.

وابستگی به کیفیت ورودی: کیفیت خروجی الگوریتم های پردازش تصویر دیجیتال به شدت به کیفیت تصاویر ورودی بستگی دارد. تصاویر ورودی با کیفیت پایین می توانند خروجی با کیفیت پایینی داشته باشند.

محدودیت‌های الگوریتم‌ها: الگوریتم‌های پردازش تصویر دیجیتال مانند تشخیص اشیاء، در صحنه‌های بهم ریخته یا کم نور دشواری هایی دارند یا در تشخیص اشیاء با تغییر شکل یا انسداد، دارای محدودیت‌هایی هستند. مثلا در تصویر زیر وقتی گربه را به صورت تصویر ۱ برای الگوریتم تعریف کنیم نمیتواند تشخیص دهد که در تصاویر ۲ و ۳ نیز گربه وجود دارد.

محدودیت‌های الگوریتم‌ها

البته این صرفا یک محدودیت است و قابل حل می‌باشد. به طور کلی در ماشین لرنینگ تصویری را به عنوان گربه برای ماشین تعریف میکنیم و از طرفی تصاویر مشابهی را برای آن تعریف می‌کنیم و می‌گوییم این گربه نیست.

اینگونه ماشین با دیدن تصاویر متفاوت و افزایش داده ها، به مرور یاد می‌گیرد که چه تصاویری شامل گربه هست یا نیست.

وابستگی به داده های آموزشی خوب: عملکرد بسیاری از الگوریتم های پردازش تصویر دیجیتال به کیفیت داده های آموزشی مورد استفاده برای توسعه الگوریتم ها بستگی دارد. داده های آموزشی با کیفیت پایین می تواند منجر به عملکرد ضعیف الگوریتم شود.

و در پایان …

همانطور که در بالا مطالعه کردید پردازش تصویر در هوش مصنوعی یکی از جذابترین کاربردهای هوش مصنوعی است. علاقمندان به این موضوع می توانند با بکارگیری فناوری های نوین در این حوزه به نتایج و دستاوردهای مهمی دست یابند.

همین الان می‌تونی این مطلب رو به اشتراک بذاری

یک پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Read More