فناوری هایی که هم اکنون جادویی به نظر می آیند به زودی عادی تلقی خواهند شد و دیگر حتی درباره جذابیت آنها و نحوه عملکردشان فکر نخواهیم کرد. دستیارهای خانگی دیجیتال همچون الکسا آمازون و خانه گوگل و برخی رقبای دیگر که در حال ورود به عرصه رقابت هستند، آنقدر در کنار ما بوده اند که قدرت فهم آنها از کلام، دستورهای داده شده به آنها و سوالاتی که از آنها میپرسیم حتی در صورت وجود نویز در محیط اطراف، عادی فرض شود. اما بد نیست لحظه ای درنگ کنیم و به فناوری که عامل شکل گیری چنین عجایبی است بپردازیم: پردازش سیگنال. این فناوری از مهمترین و سریعترین حوزه های در حال رشد در دنیای فناوری است و فعالیت به عنوان یک مهندس پردازش سیگنال شما را به عنوان بخشی از شبکه افراد متخصصی که این دستیارهای دیجیتال را ‌طراحی میکنند و فناوریهای جدید در آینده را محقق میسازند، در می آورد.

یکی از دلایلی که باعث میشود ما در مورد نحوه تشخیص هویت افراد و کلام آنها توسط دستیارهای دیجیتال خیلی فکر نکنیم آن است که این کار مدت زمانی است توسط رایانه ها و گوشی های تلفن همراه هوشمند انجام میشود (به طور مثال فناوری سیری در اپل) اما چیزی که ممکن است فراموش کنیم آن است که این ابزارها به دلیل فاصله ای که فرد با آنها دارد، کار بسیار دشوارتری برای تشخیص کلام نسبت به رایانه یا گوشی تلفن همراه دارند زیرا در چنین شرایطی تداخل صوتی بسیار بیشتر است. آنها علاوه بر گفتار باید بازتاب های صوتی و نویز تداخل کننده همچون صدای تلویزیون، ابزارهای برقی و کلام شنیده شده از سایر افراد را  که باعث کاهش دقت تشخیص میشود، پردازش کنند. اینجاست که پردازش سیگنال وارد میشود.

الکسا و خانه گوگل به تشخیص گفتار از نوع میدان دور احتیاج دارند که خود مبتنی بر دو روش مختلف پردازش سیگنال است. روش اول پردازش گفتار چندکاناله است که از تعداد مشخصی میکروفون برای ارتقا سیگنال در برخی جهت ها و حذف برخی دیگر استفاده میکند. این روش سیگنالهای نویزی تداخلی را حذف و بر روی جهتی که صدای شخص از آن مسیر شنیده میشود، تمرکز میکند. (به همین دلیل الکسا در جهتی که صدا را دریافت میکند شروع به روشن-خاموش کردن یک چراغ  آبی رنگ میکند). روش دوم، آموزش چندشرطی است که ابزار مورد نظر را برای پیدا کردن دستور ارسالی در میان امواج صوتی مختلف آموزش میدهد.

مهندسین گوگل به منظور تولید سیگنالهای مشابه در فضاهای مختلفی که میتواند کوچک، بزرگ، نویزی و یا مقاوم در برابر انعکاس صوتی باشند، اتاق شبیه سازی ساخته اند. به کمک آموزش دستیارهای دیجیتال با این روش، این ابزارها قادر خواهند بود که به صداهای مناسب دقت کرده و به آنها پاسخ دهند. مهندسین پردازش سیگنال این دو روش را ادغام کرده و به کمک اصول یادگیری ماشین، دستیارهای دیجیتال خانگی را برای درک دستورهای صوتی برنامه ریزی میکنند.

استفاده از پردازش سیگنال و یادگیری ماشین در دستیارهای دیجیتال اگرچه ممکن است چندان برای مصرف کننده عام این ابزارها قابل درک نباشد ولی جهش بزرگی در فناوری است که چند سال پیش تقریبا غیرممکن تصور میشد. در کمترین سطح ممکن، نقش پردازش سیگنال در ایجاد چنین ابزارهای کاربردی قابل تامل است. بدین ترتیب، اگر ایده فناوری که دائم در حال تحول و توسعه است شما را هیجان زده میکند، جستجوی فرصت شغلی در حوزه پردازش سیگنال ممکن است ارزش آن را داشته باشد. همانطور که یک مهندس عمران میتواند به یک پل یا تونل اشاره کرده و بگوید “من کمک کرده ام تا این اثر ساخته شود” روزی شما نیز قادر   خواهید بود که به الکسا یا خانه گوگل دستور دهید و سپس رو به دوستان خود بگویید “من کمک کرده ام تا این فناوری امکان پذیر شود” .

 

منبع: www.signalprocessingsociety.org