فهرست مطالب
Toggleهوش مصنوعی سخنگو به هر دستگاه، ماشین و رباتی که توانایی تعامل با شما را داشته باشد می گویند. از مهمترین قابلیت های هوش مصنوعی سخنگو می توان مقیاس پذیری، انعطاف پذیری، شناخت صدای فرد و… اشاره کرد. نرم افزارهای هوش مصنوعی سخنگو شامل Google assistant ،Siri ،Replica ،AI recognize robot می باشد. در ادامه به معرفی بیشتر هوش مصنوعی سخنگو میپردازیم.
معرفی هوش مصنوعی سخنگو
هوش مصنوعی سخنگو به هر ماشین و نرم افزاری گفته می شود که توانایی گفتگو با انسان را داشته باشد. اولین هوش مصنوعی سخنگو (Conversational AI) در سال ۱۹۶۶ در MIT طراحی و معرفی شد. نام این هوش مصنوعی الیزا است. با نگاهی به تاریخچه هوش مصنوعی در گذر زمان و روند توسعه آن، هوش مصنوعی سیری در سال ۲۰۱۰ دستیار صوتی اپل را عرضه کرد. از آن پس شرکتهای بسیاری در این راستا فعالیت خودشان را شروع کردند و دستیاران صوتی هوشمند مخصوص خودشان را عرضه کردند.
قابلیتهای دستیاران صوتی
- مقیاس پذیری
- انعطاف پذیری
- شناخت صدای فرد
- الویت بندی با استفاده از یادگیری ماشینی
- جستجو و جمع آوری اطلاعت
- شناسایی مخاطبین ثبت شده در گوشی
- نوشتاری هوشمند
- یادآوری و تنظیم برنامه زمانی
- تسلط بر نرمافزار
- تعامل با مشتری
مقیاس پذیری/ Scalability
مقیاسپذیری قدرتمند هوش مصنوعی، در فناوری دستیاران صوتی نیز قابل مشاهده است و تاثیر بسیاری بر میزان کارایی آنها دارد. به همین سبب باعث میشود که بسیاری از کسب و کارها به این فناوری اعتماد کنند و مشتریان خودشان را در اختیار خدمات این فناوری قرار دهند.
انعطاف پذیری
گرچه هوش مصنوعی سخنگو در دسته هوش مصنوعی محدود قرار میگیرد اما همچنان از انعطاف پذیری بالایی برخوردار است زیرا دامنه فعالیتهایی که دارد، بسیار وسیع و گسترده است. لازم به ذکر است که بعضی از این دستیاران صوتی، توانایی این را دارند که تنها با صدایتان بتوانید بیشتر از ۹۰ درصد قابلیتهای دستگاه را در دست بگیرید.
شناخت صدای فرد/ شخصی سازی
این فناوری با بررسی صدای صاحب گوشی، تناژ و جزئیات صدا را ثبت میکند. بنابراین تنها کسی که اختیارات دستیار هوشمند دستگاه را دارد، صاحب دستگاه است.
الویت بندی بر یادگیر ماشینی/ Machine learning
یادگیری ماشینی، با توجه به نیازات فرد، خود را طراحی و بروزرسانی میکند. یادگیری ماشین با توجه به نیاز محیط، فرد و… در گذشت زمان شروع به الویت بندی نیازها میکند و در نهایت، ارائه نیازهای فرد را در الویت قرار میدهد.
جستجو و جمعآوری اطلاعات
شما تنها با صدا کردن دستیار صوتی هوش مصنوعی، میتوانید از آن خواستار جستجو مطلب مورد نظرتان در موتورهای جستجوگر (گوگل، کروم، مایکروسافت وب، سافاری و…) باشید.
شناسایی مخاطبین ثبت شده در گوشی
یکی از قابلیتهای جذابی که سیری (دستیار صوتی هوشمند اپل) دارد، این است که میتواند افراد نزدیکتان را شناسایی کند.
برای مثال: زمانی که شما به سیری بگویید که با برادرم تماس بگیر، از شما میپرسد که برادرت را به چه نامی سیو کردهاید، پس از این پروسه، هرزمان که شما قصد تماس با برادرتان را داشته باشید، کافی است که به سیری بگویید که با برادرم تماس بگیر.
نوشتاری هوشمند/ تبدیل صدا به متن
قابلیت نوشتاری در دستیارن هوشمند، در راستای تبدیل صدا به متن است. نوشتاری هوشمند صدای شمارا به متن تبدیل میکند و شما میتوانید از این طریق، SMS یا PM خودتان را به مخاطب مدنظرتان برسانید.
شما با صدا کردن دستیار صوتی، اسم فرد و یا شماره تلفن مد نظر را بازگو میکنید و سپس قابلیت، زنگ زدن، پیام دادن و… را در اختیار شما میگذارد. حتی میتوانید برنامه پیام رسانی مانند تلگرام را در اختیار سیری قرار دهید و پیام خودتان ر ادر آن پیام رسان ارسال کنید. دستیار صوتی شما، همه این پروسه را تنها با صدای شما انجام میدهد.
لازم به ذکر است، دستیاران صوتی هوشمند، توان درک زبان فارسی را ندارند و شما باید به زبان انگلیسی، اسپانیایی و… با آنها گفت و گو کنید.
یادآوری و تنظیم برنامه زمانی
دیگر دغدغه فراموشی مسائل را نداشته باشید و یادآوری مناسبتها و برنامههایتان را به دستیار صوتی خود بسپارید. همچنین کوک کردن ساعت گوشی، یکی دیگر از قابلیتهایی است که میتوانید از دستیار صوتی خود بخواهید.
تسلط بر نرمافزار
بعضی از نرم افزارها، قابلیت همگرا شدن با دستیار صوتی گوشی را دارند و شما میتوانید علاوه بر امکانات گوشی، از امکانات آن نرم افزار نیز استفاده کنید. البته این بخش همچنان در حال گسترش است و شما اختیار تام و کامل را بر روی نرم افزارها ندارید. برای مثال، همگرایی تلگرام با سیری، تنها در جهت تبدیل صدا به متن است.
تعامل با مشتری
شرکتهای بزرگ زیادی هستند که از پاسخگویی هوشمند، در جهت تعامل با مشتری استفاده میکنند. دلایل زیادی وجود دارد که نشان میدهد که استفاده از هوش مصنوعی سخنگو برای تعامل با مشتری مفید است.
- پاسخگویی سریع
- نداشتن احساسات (عصبانیت، بی حوصلگی و…)
- پاسخگویی شبانه روزی
- پاسخگویی چندگانه (پاسخگویی به تماس دهها نفر، همزمان)
- نیاز کمتر به نیروکار
با توجه به این نمونه مزایایی که بررسی کردیم، استفاده از هوش مصنوعی سخنگو برای تعامل با مشتری بسیار منطقی است و کارفرما با خرج کمتر (حقوق و دستمزد)، توانایی تعامل ۲۴ ساعتهای را با مشتریان خود داشته باشد.
اما در نظر بگیرید که تعامل با مشتری از طریق هوش مصنوعی، محدودیتهایی را نیز دارد. زمانی که شما مسئلهای را بیان کنید که برای دستیار هوشمندتان تعریف نشده باشد، او قادر به پاسخگویی نخواهد بود. به همین دلیل برای استفاده از هوش مصنوعی سخنگو، باید تمام فیلدهای کاری مربوط به کسب و کار را برای دستیار صوتی، تعریف کرد.
اجزای هوش مصنوعی سخنگو
هوش مصنوعی سخنگو دارای اجزای اصلی است که به آن امکان پردازش، درک و ایجاد پاسخ به روشی طبیعی را میدهد.
یادگیری ماشینی (ML) زیرمجموعهای از هوش مصنوعی است که از مجموعهای از الگوریتمها، ویژگیها و مجموعه دادهها تشکیل شده است که به طور مداوم با تجربه بهبود مییابند. با افزایش ورودی، دستگاه پلت فرم هوش مصنوعی در تشخیص الگوها بهتر میشود و از آن برای پیشبینی استفاده میکند.
پردازش زبان طبیعی روش فعلی تجزیه و تحلیل زبان با کمک یادگیری ماشینی است که در هوش مصنوعی محاورهای استفاده میشود. قبل از یادگیری ماشینی، تکامل روشهای پردازش زبان از زبانشناسی به زبانشناسی محاسباتی و پردازش زبان طبیعی آماری تبدیل شده است. در آینده، یادگیری عمیق قابلیتهای پردازش زبان طبیعی هوش مصنوعی محاورهای را بیش از پیش ارتقا خواهد داد.
NLP از چهار مرحله تشکیل شده است: تولید ورودی، تجزیه و تحلیل ورودی، تولید خروجی و یادگیری تقویتی. دادههای بدون ساختار به قالبی تبدیل میشوند که میتواند توسط رایانه خوانده و سپس برای ایجاد پاسخ مناسب تجزیه و تحلیل شود. الگوریتمهای زیربنایی ML کیفیت پاسخ را در طول زمان با یادگیری بهبود میبخشند. این چهار مرحله NLP را میتوان به صورت مراحل زیر تقسیم کرد:
تولید ورودی: کاربران ورودی را از طریق یک وب سایت یا یک برنامه ارائه میکنند. فرمت ورودی میتواند صوتی یا متنی باشد.
تجزیه و تحلیل ورودی: اگر ورودی مبتنی بر متن باشد، برنامه هوش مصنوعی مکالمه از زبان طبیعی (NLU) برای رمزگشایی ورودی و استخراج هدف آن استفاده میکند. با این حال، اگر ورودی مبتنی بر گفتار باشد، از ترکیب تشخیص خودکار گفتار (ASR) و NLU برای تجزیه و تحلیل دادهها استفاده میشود.
مدیریت گفتگو: در طول این مرحله، تولید زبان طبیعی (NLG)، یکی از اجزای NLP، یک پاسخ را فرموله میکند.
یادگیری تقویتی: در نهایت، الگوریتمهای یادگیری ماشینی پاسخها را در طول زمان برای اطمینان از دقت اصلاح میکنند. این الگوریتم ها عبارتند از:
- Send feedback
- Side panels
- History
- Saved
- Contribute
نرمافزارهای هوش مصنوعی سخنگو
برای استفاده از دستیار صوتی بهتر است که از خود دستیاران تعریف شده بر روی دستگاهها استفاده کنید. اما در این خصوص نرمافزارهایی نیز طراحی شدهاند که در ادامه معرفی میکنیم.
- Google assistant (پیش فرض اندروید)
- Siri (پیش فرض آیفون)
- Replica (دانلود از گوگل پلی)
- AI recognize robot (دانلود از گوگل پلی)
- Jasper Chat
- Perplexity
- Tidio Lyro
- Kommunicate
- HubSpot Chatbot Builder
- Intercom
- SmythOS
- Watson Assistant
- Drift
- Infobip
- Appy Pie Chatbot
- Zendesk Answer Bot
- Salesforce Einstein
- LivePerson
- Ada
- ChatSpot
فناوری های لازم برای طراحی هوش مصنوعی سخنگو
برای اینکه دستیار صوتی شما، صدایتان را به متن تبدیل کند باید در چند مرحله به پردازش آن بپردازد. در بخش اول، ماشین باید صدای شما را بفهمد و برای این کار از فناوری Automatic Speech Recognition که همان تشخیص خودکار گفتار (ASR) است استفاده میکند. از طریق این فناوری سیگنالهای صوتی، سخنان ما را به دادههای قابل پردازش تبدیل میکند و اینگونه دستگاه متوجه حرف زدن ما میشود.
حال که ماشین متوجه صحبتهای ما شده است، باید آن را تبدیل به زبان ماشینی کند. برای این کار از فناوری Natural Language Processing (NLP) یا همان پردازش زبان طبیعی استفاده میشود. این فناوری شروع به نسخه برداری از کلمات کلیدی جملههای گفته شده، میکنند و بر اساس همان کلمات کلیدی، دستیار صوتی، متوجه خواسته ما میشود.
در ادامه هر جوابی که دستیار صوتی برای شما آماده کرده باشد، از طریق NPL ترجمه و به شما نمایش داده میشود.
و در پایان…
هوش مصنوعی سخنگو با بهرهمندی از چهار شاخه تبدیل خودکار گفتار، پردازش زبان طبیعی، یادگیری ماشین و یادگیری عمیق، دستیاران صوتی پیشرفتهای را برای ماشینها و گوشیها و دستگاهها طراحی کرده است. برای اطلاعات بیشتر مقالات سایت ما را دنبال کنید. هوش مصنوعی علاوه بر پردازش صوت قادر به پردازش تصویر نیز هست. در مقاله پردازش تصویر با هوش مصنوعی می توانید اطلاعات بیشتری در این باره کسب کنید. این مقاله را می توانید در بخش وبلاگ سایت سی آی پی جی نیز جستجو کنید.