فهرست مطالب
Toggleپردازش تصویر در هوش مصنوعی برای تشخیص چهره و هویت افراد (مسائل امنیتی)، بازسازی تصاویر قدیمی و یا خلق تصویری که در ذهن داریم بسیار کمک می کند. در ادامه با بهترین ابزارهای Image Processing و نحوه ی عملکرد ماشین ها آشنا خواهید شد.
تصویر چیست؟
در مقاله پردازش تصویر در هوش مصنوعی می خوانیم: تصویر یک سیگنال دو بعدی است و همانند سیگنالها به دو دستهی آنالوگ و دیجیتال تقسیم بندی میشود. آنالوگ به معنی پیوسته بودن و دیجیتال به معنی گسسته بودن است. تمامی تصاویری که ما با چشم خود میبینیم تصویر آنالوگ هستند در این تصاویر سطوح مختلفی از روشنایی و رنگ ها را میبینیم. اما تصاویر دیجیتال که در کامپیوتر تعریف می شوند محدودیت هایی دارند و نمیتوانند پیوسته باشند. احتمالا برای شما نیز پیش آمده که روی عکس های خود زوم کنید و بخش های کوچک مربعی که تصویر دیجیتالی را تشکیل میدهند، ببینید.
تصاویر برای ماشین ها به عنوان یک تابع دو بعدی تعریف میشود. x و y مختصات فضایی هستند و دامنه ی تابع F شدت تصویر را در آن نقطه مشخص نشان میدهد. همانطور که گفته شد هنگامی که این مقادیر محدود باشند، یک تصویر دیجیتال داریم.
این نوع چیدمان که برای تصویر تعریف کردیم نشان میدهد که تصویر آرایه ای دو بعدی است که درایههای آن به طور خاصی در ردیف ها و ستون ها مرتب شدهاند و به همین دلیل تصاویر به عنوان ماتریس در نظر گرفته میشوند. هر تصویر دیجیتال دارای تعداد محدودی عنصر با ارزش خاصی است که به آنها پیکسل میگویند.
انواع تصویر دیجیتال
تصویر های دیجیتال به طور کلی به ۴ دسته تقسیم میشوند.
تصویر باینری
همانطور که از نامش پیداست فقط شامل دو عنصر پیکسلی ۰ و ۱ است که در آن ۰ به سیاه و ۱ اشاره به سفید دارد. این تصویر با نام تک رنگ نیز شناخته می شود.
تصویر سیاه و سفید یا خاکستری
وضوح آن نسبت به تصویر باینری بیشتر است. در این قالب، ۰ نشان دهنده ی رنگ سیاه و ۲۵۵ نشان دهنده ی رنگ سفید است و عناصری که بین ۰ و ۲۵۵ باند در طیف خاکستری قرار میگیرند.
تصویر رنگی
تصویر رنگی یک ماتریس ۳ بعدی است. که دارای سه کانال رنگی قرمز و سبز و آبی(RGB) میباشد. با کم و زیاد شدن شدت هر یک از این سه رنگ، رنگ های گوناگونی به وجود میآید.
تصویر رنگی کنتراست بالا
اینگونه تصاویر، تصاویر معمولی نیستند زیرا حاوی اطلاعاتی خارج از محدوده ی ادراک عادی انسان ها هستند و مستقیم توسط انسان قابل مشاهده نیست. به عنوان مثال شامل اطلاعاتی همچون داده های مادون قرمز و فرابنفش، اشعه ی ایکس، آکوستیک یا راداری میباشند.
پردازش تصویر (Image Processing)
پردازش تصویر نوعی پردازش سیگنال میباشد که ورودی آن همواره یک تصویر است و خروجی بستگی به نوع پردازش دارد. در پردازش آنالوگ، خروجی مجددا یک تصویر است اما در پردازش دیجیتال خروجی میتواند یک تصویر، اطلاعاتی از ویژگی های تصویر و یا تغییراتی باشد که روی تصویر اعمال میکنیم.
با توجه به بلوک ۱، اگر ورودی و خروجی تصویر باشند، آن را پردازش تصویر دیجیتال (Digital image processing) مینامند.
با توجه به بلوک ۲، اگر ورودی یک تصویر و خروجی نوعی اطلاعات یا توضیحات باشد، به آن بینایی ماشین (Computer Vision) می گویند.
با توجه به بلوک ۳، اگر ورودی، توضیحات یا کد بوده و خروجی تصویر باشد، به آن گرافیک کامپیوتری (Computer Graphics ) می گویند.
طبق بلوک ۴، اگر ورودی، توضیحات یا چند کلمه کلیدی یا کد بوده و خروجی توضیحات یا چند کلمه کلیدی باشد، به آن هوش مصنوعی (Artificial Intelligence) می گویند.
کاربردهای پردازش تصویر دیجیتال
فناوری پردازش تصویر در علوم زیر کاربردهای گسترده ای دارد که در ادامه به توضیح هرکدام می پردازیم:
وضوح تصویر و بازیابی
یکی از کاربردهای پردازش تصویر، ایجاد تغییرات در تصویر برای رسیدن به نتیجه ی دلخواه است. این کار عمدتا با فتوشاپ انجام می شود. این شامل بزرگنمایی، محو کردن، واضح کردن، تبدیل مقیاس خاکستری به رنگ، تشخیص لبه ها و بالعکس، بازیابی تصویر و تشخیص تصویر است.
رشته پزشکی
کاربردهای رایج DIP در زمینه پزشکی به شرح زیر می باشد:
- تصویربرداری اشعه گاما
- اسکن PET
- تصویربرداری اشعه ایکس
- سی تی پزشکی
- تصویربرداری UV
بررسی دیابت با اسکنر پوست و هوش مصنوعی
تغییرات در رگهای خونی کوچک از پیامدهای رایج ابتلا به دیابت است. محققان دانشگاه فنی مونیخ (TUM) و هلمهولتز مونیخ اکنون روشی را توسعه داده اند که می تواند برای اندازه گیری این تغییرات میکروواسکولار در پوست – و در نتیجه ارزیابی شدت بیماری استفاده شود. برای دستیابی به این هدف، آنها هوش مصنوعی (AI) و فناوری نوآورانه تصویربرداری اپتوآکوستیک با وضوح بالا را ترکیب کردند. این اسکنر پوست که اسمش RSOM است، امکان اندازه گیری سریع تغییرات عروقی را فراهم می کند. آنجلوس کارلاس، متخصص بالینی میگوید:
Other optical methods do not achieve the depth or the detail reached by RSOM
سایر روشهای نوری به عمق یا جزئیاتی که RSOM به آن دست مییابد، نمیرسند.
سنجش از دور
برخی اطلاعات مانند آسیب های ناشی از زلزله و تغییراتی که روی پوستهی زمین ایجاد شده است را نمیتوانیم به طور ساده و به وسیلهی نیروی انسانی اندازه گیری کنیم اما به کمک سیستم های هوشمند ماهوارهای و تصاویری که به طور مداوم جمعآوری میشوند، میتوان اینگونه موارد زیست محیطی را تخمین زد.
انتقال و رمزگذاری
اولین تصویری که از طریق سیم منتقل شد از لندن به نیویورک از طریق کابل زیردریایی بود. عکس زیر می باشد.
تصویر بالا سه ساعت طول کشید از مبدا لندن به نیویورک برسد. حالا فقط تصور کنید که امروز میتوانیم ویدیوی زنده یا فیلمهای دوربین مداربسته زنده از قارهای به قاره دیگر را تنها با چند ثانیه تأخیر ببینیم. این فرآیند علاوه بر انتقال داده به رمزگذاری روی آن هم توجه دارد. بسیاری از فرمتهای مختلف برای پهنای باند بالا یا پایین، برای رمزگذاری عکسها و سپس پخش آن از طریق اینترنت یا غیره ایجاد شدهاند.
بینایی ماشین/ربات
یکی از بزرگترین چالش های هوش مصنوعی، افزایش دید ربات است. اینکه ربات بتواند اشیاء را ببیند، آنها را شناسایی کند، و یا موانع را تشخیص دهد و مواردی از این دست، از جمله قابلیتهای بینایی ماشین است.
پردازش رنگ
تشخیص موانع یکی از کارهای رایجی است که از طریق پردازش تصویر، با شناسایی انواع مختلف اشیاء در تصویر و سپس محاسبه فاصله بین ربات و موانع انجام می شود.
الگو شناسی
اکثر رباتهای امروزی با دنبال کردن خط کار میکنند و به همین دلیل رباتهای دنبالکننده خط نامیده میشوند. خط به ربات کمک می کند تا در مسیر خود حرکت کند و برخی وظایف را انجام دهد. این نیز از طریق پردازش تصویر به دست آمده است.
پردازش ویدئو
یک ویدیو چیزی نیست جز حرکت بسیار سریع تصاویر. کیفیت ویدیو به تعداد فریم/تصاویر در دقیقه و کیفیت هر فریم استفاده شده بستگی دارد. پردازش ویدیو شامل کاهش نویز، بهبود جزئیات، تشخیص حرکت، تبدیل نرخ فریم، تبدیل نسبت تصویر، تبدیل فضای رنگ و غیره است.
تصویربرداری میکروسکوپی
پردازش تصویر و یادگیری ماشینی می تواند برای توصیف مورفولوژیکی و تشخیص خودکار تصاویر سلولی گرفته شده از اسمیر خون محیطی مفید باشد.
خلق تصاویر دیجیتال!
سایت های جدیدی بر اساس هوش مصنوعی طراحی شده اند که به کمک آنها میتوانید پردازش تصویر در هوش مصنوعی را انجام داده و عکس دلخواه خود را ویرایش یا تصویر تازه ای طراحی کنید.
سایت های بسیاری در این زمینه وجود دارند اما متاسفانه هرکدام معایبی دارند. برخی اشتراک های گران قیمتی دارند و برخی بسیار کند هستند. با این وجود تعدادی از سایت هایی که بهترین عملکرد را دارند به شما معرفی میکنیم:
وبسایت Tome.app
Tome.app یک سایت رایگان چندکاره است که بسیار مناسب دانشجویان، دانش اموزان و اساتید است. زیرا علاوه بر خلق تصویر توانایی تولید متن و پاورپوینت را دارد.
وبسایت zoo.replicate.dev
zoo.replicate.dev سایت نیز رایگان بوده و ممکن است سرعت آن پایین باشد اما امکانات بیشتری را برای ویرایش تصویر در اختیار شما قرار میدهد.
وبسایت gencraft.com
gencraft گرافیک جذابی دارد و کاربری و استفاده از آن بسیار آسان بوده و از سرعت بالایی نیز برخوردار است.
مزایای پردازش دیجیتال
کیفیت تصویر بهبود یافته: الگوریتمهای پردازش تصویر دیجیتال میتوانند کیفیت بصری تصاویر را بهبود بخشند و آنها را واضحتر، شفافتر و حاوی اطلاعات بیشتر کنند.
وظایف مبتنی بر تصویر خودکار: پردازش تصویر دیجیتال میتواند بسیاری از کارهای مبتنی بر تصویر مانند تشخیص اشیا، تشخیص الگو و اندازهگیری را خودکار کند.
افزایش کارایی: الگوریتمهای پردازش تصویر دیجیتال میتوانند تصاویر را بسیار سریعتر از انسانها پردازش کنند و تجزیه و تحلیل حجم زیادی از دادهها را در مدت زمان کوتاهی ممکن میسازند.
افزایش دقت: الگوریتم های پردازش تصویر دیجیتال می توانند نتایج دقیق تری نسبت به انسان ها ارائه دهند، به خصوص برای کارهایی که نیاز به اندازه گیری دقیق یا تجزیه و تحلیل کمی دارند.
معایب پردازش تصویر دیجیتال
هزینه محاسباتی بالا: برخی از الگوریتم های پردازش تصویر دیجیتال از نظر محاسباتی فشرده هستند و به منابع محاسباتی قابل توجهی نیاز دارند.
تفسیرپذیری محدود: برخی از الگوریتم های پردازش تصویر دیجیتال ممکن است نتایجی را ایجاد کنند که تفسیر آنها برای انسان دشوار است، به ویژه برای الگوریتم های پیچیده یا پیچیده.
وابستگی به کیفیت ورودی: کیفیت خروجی الگوریتم های پردازش تصویر دیجیتال به شدت به کیفیت تصاویر ورودی بستگی دارد. تصاویر ورودی با کیفیت پایین می توانند خروجی با کیفیت پایینی داشته باشند.
محدودیتهای الگوریتمها: الگوریتمهای پردازش تصویر دیجیتال مانند تشخیص اشیاء، در صحنههای بهم ریخته یا کم نور دشواری هایی دارند یا در تشخیص اشیاء با تغییر شکل یا انسداد، دارای محدودیتهایی هستند. مثلا در تصویر زیر وقتی گربه را به صورت تصویر ۱ برای الگوریتم تعریف کنیم نمیتواند تشخیص دهد که در تصاویر ۲ و ۳ نیز گربه وجود دارد.
البته این صرفا یک محدودیت است و قابل حل میباشد. به طور کلی در ماشین لرنینگ تصویری را به عنوان گربه برای ماشین تعریف میکنیم و از طرفی تصاویر مشابهی را برای آن تعریف میکنیم و میگوییم این گربه نیست.
اینگونه ماشین با دیدن تصاویر متفاوت و افزایش داده ها، به مرور یاد میگیرد که چه تصاویری شامل گربه هست یا نیست.
وابستگی به داده های آموزشی خوب: عملکرد بسیاری از الگوریتم های پردازش تصویر دیجیتال به کیفیت داده های آموزشی مورد استفاده برای توسعه الگوریتم ها بستگی دارد. داده های آموزشی با کیفیت پایین می تواند منجر به عملکرد ضعیف الگوریتم شود.
و در پایان …
همانطور که در بالا مطالعه کردید پردازش تصویر در هوش مصنوعی یکی از جذابترین کاربردهای هوش مصنوعی است. علاقمندان به این موضوع می توانند با بکارگیری فناوری های نوین در این حوزه به نتایج و دستاوردهای مهمی دست یابند.
یک پاسخ
کاربرد هوش مصنوعی در پردازش تصویر قسمت پزشکی بیشتر توضیح بدین .ممنون