فهرست مطالب
Toggleآزمون تورینگ هوش مصنوعی یک روش تحقیق در هوش مصنوعی (AI) است که تعیین می کند آیا یک کامپیوتر قادر است مانند یک انسان فکر کند یا خیر. این آزمون توسط آلن تورینگ دانشمند بریتانیایی طراحی شده است. در ادامه به توضیحات بیشتر در مورد نحوه برگزاری و چگونگی تست تورینگ میپردازیم.
آزمون تورینگ هوش مصنوعی
ماشین تورینگ هوش مصنوعی نوعی ارزیابی برای بررسی کارکرد و کیفیت ماشینهای وابسته به هوش مصنوعی است که در آن میزان عملکرد مثبت یک ماشین و ضریب خطا و پارامترهای متعدد دیگر بررسی میشود. اگر فیلم سینمایی بازی تقلید با بازی بندیکت کامبربچ (محصول سال ۲۰۱۴) را دیده باشید، با نام «بازی تقلید» یا همان Impation game آشنا هستید. الن تورینگ، دانشمند نابغه و جوان انگلیسی در طول جنگ جهانی دوم با طراحی ماشینی منحصربفرد توانست کدهای رمزنگاری شده آلمانیها را بشکند و به محتوای سری آنها که به زمان و مکان حملههای هوایی آلمانها مربوط میشد دست پیدا کند.
آزمون تورینگ چیست؟
آزمون تورینگ یا بازی تقلید با توجه به دقت تشخیص هوش مصنوعی در یک گفتگوی انسانی تعیین میکند که چه استانداردهایی در ساخت ماشین رعایت شده است. آزمون تورینگ بر اساس توانایی یک سیستم کامپیوتری در تقلید رفتار انسانی طراحی شده است. البته باید در نظر داشت که این آزمون در نسخههای ابتدایی خود، استفاده مستقیم از آنچه تحت هوش مصنوعی امروزی تعریف میشود، نداشته و در قالب یک مذاکره ۳ نفره انجام شده است. این آزمون متشکل از یک شرکت کنندهی مرد، یک داور و یک شرکت کنندهی زن بود که در ۳ اتاق مختلف قرار میگرفتند. روند آزمون به این شکل بود که شرکتکنندگان از طریق مکاتبه به وسیله کنسول رایانه تلاش می کردند تا داور را متقاعد سازند که شرکت کننده، جنسیت مرد دارد. شرکت کنندۀ مرد تلاش داشت تا مرد بودن خود را ثابت کند و در مقابل شرکت کننده زن نیز تظاهر به مرد بودن می کرد و تلاش می کرد تا داور را فریب دهد.
اما ارتباط این تست برای تشخیص هوش مصنوعی زمانی مشخص میشود که به جای یک مرد و یک زن، شرکتکنندگان یک انسان و یک کامپیوتر باشند. در این تست کامپیوتر تلاش میکند تا خود را به عنوان انسان جا بزند و انسان نیز تلاش می کند تا کامپیوتر نبودن خود را اثبات کند. در نهایت داور آزمون باید تشخیص دهد که کدامیک انسان و کدام کامپیوتر است. کامپیوتری که پس از بارها تست گرفتن، موفق به فریب داور شود را برنده آزمون دانسته و به عنوان ماشین هوشمند معرفی می شود.
در این آزمون چه پارامترهایی بررسی میشود؟
این تستها به گونه ای طراحی شده اند که عملکرد آنها تحت شرایط مختلف مورد سنجش قرار گیرد.
با استفاده از تست نفوذ، امنیت سامانه مورد سنجش قرار میگیرد و سعی میشود تا به صورت هدفمند به سیستم نفوذ شود تا نقاط ضعف مشخص شوند. در این تست بررسی و تحلیل کد منبع برنامه میتواند نقاط ضعف و باگهای پنهان را شناسایی کند. همچنین با اعمال فشارهای زیاد به سامانه، میتوان تحمل و عملکرد آن در شرایط جدی را سنجید.
این تست همچنین بررسی صحت و قابل اعتماد بودن دادههای ورودی و خروجی و نقاط ضعف در مدیریت داده را مورد برسی قرار میدهد. به طور خاص، اگر یک سیستم قادر به ارتباط با انسان به گونهای است که یک انسان نتواند تشخیص دهد که طرف مقابل یک ماشین است یا انسان، آن سیستم به عنوان یک سیستم منسجم دارای هوش مصنوعی معرفی میشود. آزمون تورینگ بر پایه این ایده است که آیا یک ماشین میتواند به گونهای هوشمندانه عمل کند که دیگران با مشاهده رفتار آن، تفاوتش را از یک انسان نتوانند تشخیص دهند. این عملکرد یکی از مباحث مهم و پایهای در زمینه هوش مصنوعی محسوب میشود.
در حال حاضر، با پیشرفت روزافزون در زمینه هوش مصنوعی، مفاهیم متنوعتری برای ارزیابی هوش ماشین در نظر گرفته میشود. آزمونها و بررسیهای جدید و متنوع، از جمله ارزیابی دقت تصمیمگیری، توانایی یادگیری ماشین، و تفاوتهای احتمالی با رفتار انسانی در شرایط خاص، بهعنوان معیارهای جایگزین نیز مورد استفاده قرار میگیرند.
خطاهای احتمالی انجام آزمون تورینگ
برخی معتقدند که تست تورینگ تنها یک جنبه از هوش را سنجیده و به فهم دقیقتر و چند بعدی هوش مصنوعی پرداخته نشده است. بسیاری از افراد فکر میکنند که هوش بیش از این است و نمیتواند تنها از طریق یک تست ساده ارزیابی شود. با پیشرفت فناوری و ایجاد سامانههای هوش مصنوعی پیشرفتهتر، برخی معتقدند که تست تورینگ قدرت ارزیابی مهارتهای هوش مصنوعی را به خوبی نمیتواند درک کند. این افراد فکر میکنند که نیاز به یک روش ارزیابی بهتر و بهروزتر وجود دارد. تست تورینگ ممکن است در شرایط مصنوعی و محدودیتهای خاص به خوبی عمل کند، اما در مواجهه با واقعیتهای گسترده و متنوع، ممکن است نتایج آن دقت خود را از دست بدهد. به طور مثال ممکن است به پیشفرضهای فرهنگی بستگی داشته باشد و در مواجهه با افرادی از فرهنگهای مختلف، نتایج ناعادلانهای تحویل دهد. برخی از افراد نیز از نظر حقوق بشر به تست تورینگ انتقاد دارند و معتقدند که به دلیل ناپایداری نتایج و ابهام در برخی موارد، استفاده از این تست برای اهداف حقوقی میتواند مشکلاتی را به وجود آورد.
محدودیت های آزمون تورینگ
آزمون تورینگ در طول سالها مورد انتقاد قرار گرفته است، به ویژه به این دلیل که از نظر تاریخی، ماهیت سؤال باید محدود میشد تا رایانه بتواند هوش انسان مانند، را نشان دهد. برای سالهای متمادی، یک کامپیوتر فقط در صورتی امتیاز بالایی میگرفت که پرسشگر، پرسشها را فرموله میکرد. بنابراین آنها پاسخهای «بله» یا «خیر» داشتند یا به حوزه محدودی از دانش مربوط میشدند. هنگامی که سؤالات باز بودند و نیاز به پاسخهای محاوره ای داشتند، کمتر احتمال داشت که برنامه رایانه بتواند سؤال کننده را با موفقیت فریب دهد.
علاوه بر این، برنامهای مانند ELIZA میتواند آزمون تورینگ را با دستکاری نمادهایی که به طور کامل درک نمیکند، پشت سر بگذارد. جان سرل استدلال کرد که این امر، هوش قابل مقایسه با انسان را تعیین نمی کند.
برای بسیاری از محققان، این سوال که آیا یک کامپیوتر میتواند آزمون تورینگ را قبول کند یا نه، بیاهمیت شده است. به جای تمرکز بر نحوه متقاعد کردن کسی که با یک انسان صحبت میکند و نه یک برنامه کامپیوتری، تمرکز واقعی باید بر این باشد که چگونه تعامل انسان و ماشین را شهودی و کارآمدتر کنیم. به عنوان مثال، با استفاده از یک رابط مکالمه میتوان این کار را انجام داد.
تغییرات و جایگزینهای آزمون تورینگ
برای مرتبطتر کردن تست تورینگ تغییرات زیادی وجود دارد. چنین نمونههایی عبارتند از:
تست تورینگ معکوس: جایی که یک انسان سعی میکند کامپیوتر را متقاعد کند که کامپیوتر نیست. نمونه ای از این CAPTCHA است.
تست تورینگ مجموع: تستی است که در آن پرسشکننده میتواند تواناییهای ادراکی و همچنین توانایی دستکاری اشیاء را آزمایش کند.
حداقل تست سیگنال هوشمند: در این تست فقط به سوالات پاسخ درست / غلط و بله / خیر داده میشود.
جایگزین تست تورینگ هوش مصنوعی
جایگزینهایی برای آزمونهای تورینگ بعداً ایجاد شد زیرا بسیاری آزمایش تورینگ را ناقص میدانند. این جایگزینها شامل تستهایی مانند:
تست مارکوس: در تست مارکوس برنامهای که میتواند یک برنامه تلویزیونی را «تماشا کند» با پرسیدن سؤالات معنی دار در مورد محتوای برنامه آزمایش میشود.
Lovelace Test 2.0: این آزمایشی برای تشخیص هوش مصنوعی از طریق بررسی توانایی آن در خلق هنر است.
چالش طرحواره وینوگراد: آزمونی است که سوالات چند گزینهای را در قالبی خاص میپرسد.
نمودار آزمون تورینگ
این آزمایش شامل دو انسان و یک ماشین است
امروزه از آزمون تورینگ چگونه استفاده می شود؟
با توجه به درک فعلی ما از هوش مصنوعی، فرمت اصلی آزمون هنوز هم تا به امروز استفاده میشود. به عنوان مثال، جایزه لوبنر از سال ۱۹۹۰ هر ساله به شبیهترین برنامه رایانهای که توسط هیئت داوران رأی داده شده است، اعطا میشود. این مسابقه از قوانین استاندارد آزمون تورینگ پیروی میکند. منتقدان مربوط بودن این جایزه اغلب آن را بیشتر به عنوان تبلیغات در مورد آن کم اهمیت میدانند تا اینکه واقعاً آزمایش کنند که آیا ماشین ها میتوانند فکر کنند.
در مسابقهای که توسط دانشگاه ریدینگ به مناسبت شصتمین سالگرد مرگ تورینگ در سال ۲۰۱۴ برگزار شد، یک چتبات به نام یوجین گوستمن که پسری ۱۳ ساله را شبیه سازی میکند، آزمون تورینگ را از نظر برخی، زمانی که ۳۳ درصد را فریب داد، گذراند. از داوران این به اصطلاح اولین قبولی با انتقادات زیادی از سوی کسانی مواجه شده است که استدلال میکنند که داوران کافی نبودند، ماشینهای دیگر در آزمون در گذشته عملکرد بهتری داشتند و این که آزمون فقط بعد از پنج دقیقه اعتبارش را از دست میدهد.
در سال ۲۰۱۸، Google Duplex با موفقیت در حضور ۷۰۰۰ نفر با یک آرایشگر، از طریق تلفن قرار ملاقات گذاشت. مسئول پذیرش نمیدانست که آنها با یک انسان واقعی صحبت نمیکنند. با وجود عدم تکیه بر فرمت واقعی آزمون همانطور که آلن تورینگ آن را طراحی کرده است، برخی آن را یک قبولی آزمون تورینگ مدرن میدانند.
GPT-3، یک مدل پردازش زبان طبیعی که توسط OpenAI ایجاد شده است، به عقیده برخی، بهترین شانس برای شکست دادن آزمون را در شکل واقعی آن نسبت به هر فناوری امروزی دارد. اما، حتی با وجود تواناییهای پیشرفته تولید متن، بسیاری از این دستگاه انتقاد کردهاند، زیرا میتوان آن را فریب داد تا به سؤالات بیمعنی پاسخ دهد و بنابراین در شرایطی، آزمون تورینگ دچار مشکل میشود.
علیرغم بحثهای فراوان در مورد ارتباط آزمون تورینگ امروزه و اعتبار مسابقاتی که حول آن برگزار میشود، این آزمون هنوز به عنوان یک نقطه شروع فلسفی برای بحث و تحقیق در مورد هوش مصنوعی است. همانطور که ما به پیشرفت در هوش مصنوعی ادامه میدهیم و درک بهتر و ترسیم عملکرد مغز انسان را داریم، تست تورینگ برای تعریف هوش پایه ای باقی میماند و مبنایی برای بحث در مورد اینکه چه چیزی باید از فناوریها انتظار داشته باشیم تا آنها به عنوان ماشینهای فکری در نظر گرفته شوند، است.
و در پایان…
همانطور که در این مقاله خواندید، آزمون تورینگ به این ایده استوار است که اگر یک کامپیوتر یا برنامه قادر باشد در یک گفتگو به گونهای که یک انسان تشخیص داده میشود، بتواند به عنوان یک انسان شناخته شود. این آزمون توسط آلن تورینگ ارائه شد و به عنوان یکی از مبانی فلسفی و تستهای معتبر در زمینه هوش مصنوعی معرفی شده است.