کاربرد مولدهای صدا و فناوری تبدیل متن به گفتار (TTS) در شهرهای هوشمند

چگونه مولدهای صدا به ارتقای شهرهای هوشمند کمک می‌کنند؟

مولدهای صدا (Voice generators) ابزارهای پیشرفته‌ای هستند که متن را به گفتار تبدیل می‌کنند. این فناوری مزایای بسیاری در حوزه‌های مختلف دارد، از جمله در شهرهای هوشمند که در آن ارتباطات، دسترسی‌پذیری و فراگیری می‌تواند با استفاده از فناوری‌های تبدیل متن به گفتار (TTS) به طور چشمگیری بهبود یابد. این مقاله به بررسی مولدهای صدا و موارد استفاده گوناگون آن‌ها در شهرهای هوشمند می‌پردازد.

 

چالش‌های پیش روی شهرهای هوشمند

مدیران شهری به طور فزاینده‌ای طرح‌های شهر هوشمند را برای امن‌تر کردن، کاهش آلودگی و افزایش کیفیت زندگی در شهرهایشان به اجرا می‌گذارند. با این حال، با تبدیل شدن شهرداری‌ها به شهرهای هوشمند، آن‌ها با چالش‌های مختلفی روبرو هستند. برای مثال، در مواقع اضطراری، برقراری ارتباط سریع و واضح با جمعیت زیاد می‌تواند دشوار باشد. با رشد شهرها، سیستم‌های حمل و نقل و سایر خدمات شهری تحت فشار قرار می‌گیرند. موانع زبانی نیز یک چالش مهم است، زیرا جمعیت‌های چندزبانه – و همچنین گردشگران خارجی – ارتباطات را پیچیده‌تر می‌کنند.

 

مولدهای صدا چگونه می‌توانند کمک کنند؟

چالش‌های فوق را می‌توان با استفاده از مولدهای صدا که به قابلیت‌های تبدیل متن به گفتار (TTS) مجهز هستند، برطرف کرد. رونن رابینوویچی، بنیان‌گذار TTSReader و Speechnotes که راهکار خود را با نام TTSReader – Online Text To Speech ارائه می‌دهند، می‌گوید: «موارد متعددی وجود دارد که سنتز گفتار مبتنی بر هوش مصنوعی – چه به صورت لحظه‌ای و چه به صورت از پیش تولید شده (برای صرفه‌جویی در هزینه‌ها و افزایش دسترسی و قابلیت اطمینان) – در محیط‌های شهر هوشمند بسیار مؤثر و سودمند است.»

 

ارتباطات اضطراری

در مواقع اضطراری، مولدهای صدا می‌توانند به صورت فوری و خودکار، هشدارهای چندزبانه تولید و پخش کنند. این ویژگی، مولدهای صدا را به راه‌حلی بسیار مؤثرتر از سیستم‌های اطلاع‌رسانی عمومی (PA) سنتی تبدیل می‌کند.

روهان پاوولوری، مدیر ارشد کسب‌وکار در Speechify، می‌گوید: «سیستم‌های PA سنتی به پیام‌های از پیش ضبط‌شده محدود بودند یا به یک گوینده زنده نیاز داشتند. با تولید صدا، پیام‌ها می‌توانند به صورت لحظه‌ای و با محتوای پویا بر اساس رویدادهای جاری ایجاد شوند. گفتار می‌تواند به طور خودکار به زبان‌های مختلف با لهجه‌های بومی محلی‌سازی شود. لحن و میزان اضطرار پیام نیز می‌تواند به صورت برنامه‌ریزی‌شده تنظیم شود – پیام‌های فوری جدی به نظر می‌رسند؛ در حالی که به‌روزرسانی‌های روزانه لحنی خنثی یا دوستانه دارند. ورودی متن می‌تواند از داشبوردهای شهری، سیستم‌های اضطراری یا محرک‌های خودکار – مانند سنسورها، فیدهای آب‌وهوا یا تأخیر در حمل‌ونقل – دریافت شود.»

 

کیوسک‌های اطلاعاتی

کیوسک‌های اطلاعاتی مبتنی بر صدا به طور فزاینده‌ای در شهرها دیده می‌شوند. این پایانه‌های تعاملی، مجهز به گفتار و چندزبانه که در فضاهای عمومی قرار گرفته‌اند، اطلاعات لحظه‌ای، قابل دسترس و کاربرپسندی را به ساکنان و بازدیدکنندگان ارائه می‌دهند. پاوولوری می‌گوید: «کیوسک‌های مجهز به صدا اغلب از مولدهای صدای هوش مصنوعی برای ارائه پیام‌ها به صورت واضح و طبیعی استفاده می‌کنند. این کیوسک‌ها ممکن است اطلاعات حمل‌ونقل، راهنمایی‌های توریستی یا ویژگی‌های دسترسی‌پذیری را فراهم کنند. تبدیل متن به گفتار در اینجا یک استاندارد است که ورودی‌های متنی آن از سیستم‌های خودکار، پلتفرم‌های مدیریت محتوا (CMS) یا فیدهای لحظه‌ای – برای مثال، برنامه‌های زمانی حمل‌ونقل و APIها – تأمین می‌شود. با ابزارهای Speechify، از جمله API آن، شهرها می‌توانند پیام‌ها را به طور مداوم تنظیم کنند. برخی کیوسک‌ها امکان ورود پویای اطلاعات توسط کارمندان شهری، نمایندگان خدمات مشتری یا برگزارکنندگان رویدادها را نیز فراهم می‌کنند.»

 

ایستگاه‌های حمل و نقل عمومی و خطوط تلفن

مولدهای صدا همچنین می‌توانند نقشی کلیدی در ایستگاه‌های حمل و نقل عمومی برای افزایش دسترسی‌پذیری، ایمنی و ارتباطات لحظه‌ای ایفا کنند. این سیستم‌ها از TTS برای پخش اطلاعات یا پاسخ به نیازهای اطلاعاتی به صورت گفتاری استفاده می‌کنند که هم به مسافران روزانه و هم به مسافران گذری کمک می‌کند.

 

سایر موارد استفاده

کاربردهای دیگری نیز در شهر هوشمند وجود دارد. رابینوویچی می‌گوید: «این موارد شامل مدارس و محیط‌های آموزشی فوق برنامه، به ویژه برای دانش‌آموزان مبتلا به نارساخوانی (dyslexia) و کسانی که تفاوت‌های یادگیری دارند، می‌شود – شنیدن متنی که با صدای بلند خوانده می‌شود، درک و یادگیری را بهبود می‌بخشد. در کتابخانه‌ها نیز بازدیدکنندگان می‌توانند به کتاب‌ها و مطالب به صورت صوتی گوش دهند که دسترسی را برای کسانی که با خواندن مشکل دارند، گسترش می‌دهد.»

 

ترویج فراگیری و دسترسی‌پذیری

در واقع، مولدهای صدا می‌توانند فراگیری و دسترسی‌پذیری را در شهرهای هوشمند ترویج دهند. شهرها و کلان‌شهرها محل زندگی گروه‌های متنوعی از مردم هستند، از جمله افراد کم‌بینا، افراد دارای معلولیت و غیربومیان. مولدهای صدا می‌توانند به خوبی به این گروه‌ها خدمت‌رسانی کنند.

پاوولوری می‌گوید: «مولدهای صدای هوش مصنوعی با خدمت‌رسانی به افراد کم‌بینا که به دسترسی شنیداری متکی هستند؛ کمک به افراد مبتلا به نارساخوانی، ADHD یا اختلالات شناختی برای درک آسان‌تر مطالب نوشتاری؛ حمایت از افراد غیربومی با ارائه گفتار واضح و محلی‌سازی شده به زبان دلخواه‌شان؛ و ایجاد تجربیات چندوجهی – برای مثال، ترکیب صدا با لمس یا نشانه‌های بصری برای کیوسک‌ها یا اپلیکیشن‌ها – فراگیری را افزایش می‌دهند. Speechify به طور مشخص کار خود را به عنوان ابزاری برای دانش‌آموزان با چالش‌های خواندن آغاز کرد و دسترسی‌پذیری همچنان محور اصلی مأموریت ماست.»

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *