صداهای مصنوعی همه گیر شده اند. آنها صبح ها دستورالعمل های رزانه را به ما یادآور می شوند، در طول روز از طریق تماس های تلفنی ما را به کار روزانه رهنمون می کنند و شب ها اخبار را از بلندگوهای هوشمند خود پخش می کنند. با پیشرفت فناوری به کار رفته در ساخت آنها ، این صداها بیشتر و بیشتر به گوش انسان می رسند. این مرز نهایی در گفتار مصنوعی نه تنها آنچیزی است که ما می گوییم بلکه نحوه گفتن و احسای کلمات ماست.
روپال پاتل سرپرست یک گروه تحقیقاتی است که به مطالعه عروض گفتار می پردازد – . او در مورد تغییرات صدا ، بلندی صدا و مدت زمانی که ما برای انتقال قصد و احساسات از طریق صدا استفاده می کنیم، توضیح می دهد: “گاهی اوقات مردم آن را به عنوان چیزی فراتر می دانند” “شما یک پیامی دارید ، و اکنون نحوه تنظیم آن پیام است ، اما من واقعاً فکر می کنم این چهارچوب است که به پیام خود معنی می دهد.”
پاتل می گوید که بعد از اینکه متوجه شد عروض تنها عنصر ارتباط صوتی است که به نظر می رسد در دسترس افراد مبتلا به انواع اختلالات گفتاری شدید است علاقه مند شد. این بیماران حتی اگر نمی توانستند واضح صحبت کنند قادر به تولید صداهای رسا بودند. در سال ۲۰۱۴ پاتل شرکتی را تأسیس کرد تا صداهای مصنوعی سفارشی را برای افراد لال ایجاد کند. VocaliD از آن زمان به یک مارک تجاری و تأثیرگذار گسترش یافته است.
گفتار مصنوعی طی سالهای گذشته مسیری طولانی را طی کرده است. ، سیری اکنون در سن نه سالگی مسن ترین دستیار مجازی است – اما در دنیای دستگاه های گفتاری ، او یک کودک به حساب می آید. حداقل از قرن هجدهم میلادی ، هنگامی که یک مخترع اتریشی-مجارستانی ماکت خام دستگاه صوتی انسان را ساخت که می تواند کل عبارات را بیان کند (البته بصورت یکنواخت) ، مردم سعی در سنتز گفتار دارند.
تکنیک های فعلی یادگیری ماشین می توانند گفتار انسان را کامل کند ، با مکث های ناشیانه ودر ظاهر لبخند به لب. هنوز هم ، آموزش روی هزاران نمونه برای یک ثانیه برای اکثر سیستم های دنیای واقعی، بسیار گران تما می شود با این حال محققان ، از جمله محققان VocaliD ، به طور مداوم روش های جدیدتر و کارآمدتری را گسترش می دهند.
همانطور که شکافهای باقی مانده بین گفتار انسانی و گفتار هوش مصنوعی در حال تنگتر شدن هستند ، عروض واقعی حتی در پیچیده ترین سیستم ها نیز فاقد توانایی است. شاید آنچه هنوز از تکامل است نیاز به ماشین آلات نه برای تقلید و تکرار گفتار انسانها بلکه احساس کلمات مثل آدم ها دارد.