چگونه مولدهای صدا به ارتقای شهرهای هوشمند کمک میکنند؟
مولدهای صدا (Voice generators) ابزارهای پیشرفتهای هستند که متن را به گفتار تبدیل میکنند. این فناوری مزایای بسیاری در حوزههای مختلف دارد، از جمله در شهرهای هوشمند که در آن ارتباطات، دسترسیپذیری و فراگیری میتواند با استفاده از فناوریهای تبدیل متن به گفتار (TTS) به طور چشمگیری بهبود یابد. این مقاله به بررسی مولدهای صدا و موارد استفاده گوناگون آنها در شهرهای هوشمند میپردازد.
چالشهای پیش روی شهرهای هوشمند
مدیران شهری به طور فزایندهای طرحهای شهر هوشمند را برای امنتر کردن، کاهش آلودگی و افزایش کیفیت زندگی در شهرهایشان به اجرا میگذارند. با این حال، با تبدیل شدن شهرداریها به شهرهای هوشمند، آنها با چالشهای مختلفی روبرو هستند. برای مثال، در مواقع اضطراری، برقراری ارتباط سریع و واضح با جمعیت زیاد میتواند دشوار باشد. با رشد شهرها، سیستمهای حمل و نقل و سایر خدمات شهری تحت فشار قرار میگیرند. موانع زبانی نیز یک چالش مهم است، زیرا جمعیتهای چندزبانه – و همچنین گردشگران خارجی – ارتباطات را پیچیدهتر میکنند.
مولدهای صدا چگونه میتوانند کمک کنند؟
چالشهای فوق را میتوان با استفاده از مولدهای صدا که به قابلیتهای تبدیل متن به گفتار (TTS) مجهز هستند، برطرف کرد. رونن رابینوویچی، بنیانگذار TTSReader و Speechnotes که راهکار خود را با نام TTSReader – Online Text To Speech ارائه میدهند، میگوید: «موارد متعددی وجود دارد که سنتز گفتار مبتنی بر هوش مصنوعی – چه به صورت لحظهای و چه به صورت از پیش تولید شده (برای صرفهجویی در هزینهها و افزایش دسترسی و قابلیت اطمینان) – در محیطهای شهر هوشمند بسیار مؤثر و سودمند است.»
ارتباطات اضطراری
در مواقع اضطراری، مولدهای صدا میتوانند به صورت فوری و خودکار، هشدارهای چندزبانه تولید و پخش کنند. این ویژگی، مولدهای صدا را به راهحلی بسیار مؤثرتر از سیستمهای اطلاعرسانی عمومی (PA) سنتی تبدیل میکند.
روهان پاوولوری، مدیر ارشد کسبوکار در Speechify، میگوید: «سیستمهای PA سنتی به پیامهای از پیش ضبطشده محدود بودند یا به یک گوینده زنده نیاز داشتند. با تولید صدا، پیامها میتوانند به صورت لحظهای و با محتوای پویا بر اساس رویدادهای جاری ایجاد شوند. گفتار میتواند به طور خودکار به زبانهای مختلف با لهجههای بومی محلیسازی شود. لحن و میزان اضطرار پیام نیز میتواند به صورت برنامهریزیشده تنظیم شود – پیامهای فوری جدی به نظر میرسند؛ در حالی که بهروزرسانیهای روزانه لحنی خنثی یا دوستانه دارند. ورودی متن میتواند از داشبوردهای شهری، سیستمهای اضطراری یا محرکهای خودکار – مانند سنسورها، فیدهای آبوهوا یا تأخیر در حملونقل – دریافت شود.»
کیوسکهای اطلاعاتی
کیوسکهای اطلاعاتی مبتنی بر صدا به طور فزایندهای در شهرها دیده میشوند. این پایانههای تعاملی، مجهز به گفتار و چندزبانه که در فضاهای عمومی قرار گرفتهاند، اطلاعات لحظهای، قابل دسترس و کاربرپسندی را به ساکنان و بازدیدکنندگان ارائه میدهند. پاوولوری میگوید: «کیوسکهای مجهز به صدا اغلب از مولدهای صدای هوش مصنوعی برای ارائه پیامها به صورت واضح و طبیعی استفاده میکنند. این کیوسکها ممکن است اطلاعات حملونقل، راهنماییهای توریستی یا ویژگیهای دسترسیپذیری را فراهم کنند. تبدیل متن به گفتار در اینجا یک استاندارد است که ورودیهای متنی آن از سیستمهای خودکار، پلتفرمهای مدیریت محتوا (CMS) یا فیدهای لحظهای – برای مثال، برنامههای زمانی حملونقل و APIها – تأمین میشود. با ابزارهای Speechify، از جمله API آن، شهرها میتوانند پیامها را به طور مداوم تنظیم کنند. برخی کیوسکها امکان ورود پویای اطلاعات توسط کارمندان شهری، نمایندگان خدمات مشتری یا برگزارکنندگان رویدادها را نیز فراهم میکنند.»
ایستگاههای حمل و نقل عمومی و خطوط تلفن
مولدهای صدا همچنین میتوانند نقشی کلیدی در ایستگاههای حمل و نقل عمومی برای افزایش دسترسیپذیری، ایمنی و ارتباطات لحظهای ایفا کنند. این سیستمها از TTS برای پخش اطلاعات یا پاسخ به نیازهای اطلاعاتی به صورت گفتاری استفاده میکنند که هم به مسافران روزانه و هم به مسافران گذری کمک میکند.
سایر موارد استفاده
کاربردهای دیگری نیز در شهر هوشمند وجود دارد. رابینوویچی میگوید: «این موارد شامل مدارس و محیطهای آموزشی فوق برنامه، به ویژه برای دانشآموزان مبتلا به نارساخوانی (dyslexia) و کسانی که تفاوتهای یادگیری دارند، میشود – شنیدن متنی که با صدای بلند خوانده میشود، درک و یادگیری را بهبود میبخشد. در کتابخانهها نیز بازدیدکنندگان میتوانند به کتابها و مطالب به صورت صوتی گوش دهند که دسترسی را برای کسانی که با خواندن مشکل دارند، گسترش میدهد.»
ترویج فراگیری و دسترسیپذیری
در واقع، مولدهای صدا میتوانند فراگیری و دسترسیپذیری را در شهرهای هوشمند ترویج دهند. شهرها و کلانشهرها محل زندگی گروههای متنوعی از مردم هستند، از جمله افراد کمبینا، افراد دارای معلولیت و غیربومیان. مولدهای صدا میتوانند به خوبی به این گروهها خدمترسانی کنند.
پاوولوری میگوید: «مولدهای صدای هوش مصنوعی با خدمترسانی به افراد کمبینا که به دسترسی شنیداری متکی هستند؛ کمک به افراد مبتلا به نارساخوانی، ADHD یا اختلالات شناختی برای درک آسانتر مطالب نوشتاری؛ حمایت از افراد غیربومی با ارائه گفتار واضح و محلیسازی شده به زبان دلخواهشان؛ و ایجاد تجربیات چندوجهی – برای مثال، ترکیب صدا با لمس یا نشانههای بصری برای کیوسکها یا اپلیکیشنها – فراگیری را افزایش میدهند. Speechify به طور مشخص کار خود را به عنوان ابزاری برای دانشآموزان با چالشهای خواندن آغاز کرد و دسترسیپذیری همچنان محور اصلی مأموریت ماست.»

