موتورهای قوانین مبتنی بر زبان طبیعی به کاربران امکان میدهند تا فقط با وارد کردن یک دستور متنی، آلارمها و الگوریتمهایی را ایجاد کنند. راهحلهای مرتبط در نظارت تصویری ظهور کردهاند. در همین حال، چالشها همچنان باید حل شوند.
موتورهای قوانین مبتنی بر زبان طبیعی به کاربران اجازه میدهند تا فقط با وارد کردن یک دستور متنی، آلارمها و الگوریتمها را ایجاد کنند. راهحلهای مرتبط قبلاً در نظارت تصویری ظهور کردهاند. در حالی که چنین فناوریهایی برای کاربران راحتی ایجاد میکنند، چالشها همچنان باقی هستند که باید حل شوند.
تنظیم قوانین یا آلارمها با زبان طبیعی در امنیت مورد توجه قرار گرفته است، به ویژه در میان ظهور مدلهای زبان طبیعی، مدلهای هوش مصنوعی در مقیاس بزرگ و ChatGPT. با موتورهای قوانین مبتنی بر زبان طبیعی، آلارمها میتوانند در مدت زمان کوتاهتری توسط افرادی که لزوماً در این زمینه آموزش ندیدهاند، ایجاد شوند. تمام کاری که آنها باید انجام دهند این است که یک دستور متنی را وارد کنند، برای مثال “اگر ماشینی بیش از 5 دقیقه در منطقه بارگیری توقف کرد، به من هشدار بده.” این فناوری میتواند به سازمانهای کاربر نهایی در بازارهای عمودی مختلف کمک کند.
آلبرت استپانیان، رئیس و مدیر عامل شرکت Scylla AI، گفت: “موارد استفاده اولیه شامل جستجوی ویدئویی و پیکربندی هشدار در عملیات امنیتی است.” وی افزود که بخشهایی مانند مراقبتهای بهداشتی، آموزش، خردهفروشی و زیرساختهای حیاتی از این فناوری بهرهمند خواهند شد، زیرا کارکنان غیرفنی میتوانند به طور موثر نظارت را بدون آموزش تخصصی پیکربندی و مدیریت کنند.
راهحلهای مرتبط
با توجه به محبوبیت و پتانسیل موتورهای قوانین مبتنی بر زبان طبیعی، راهحلهای مرتبط قبلاً ظهور کردهاند. در ادامه نگاهی به برخی از آنها میاندازیم.
Dahua Dahua مدلهای هوش مصنوعی در مقیاس بزرگ Xinghan خود را راهاندازی کرده است که ویژگی اصلی آن “آلارمهای تعریفشده توسط متن” (Text-defined Alarms) است. به گفته Dahua، با فناوریهای هوش مصنوعی متداول فعلی، توسعه الگوریتمهای جدید گران است، به سرمایهگذاری قابل توجهی در منابع انسانی و مادی نیاز دارد و مشمول چرخههای طولانی سفارشیسازی است. در مقابل، آلارمهای تعریفشده توسط متن Xinghan از مسلحسازی سفارشی از طریق توضیحات متنی پشتیبانی میکنند. الگوریتمهای جدید را میتوان از طریق متن دستور (prompt text) توسعه داد که به شدت آستانه توسعه را کاهش میدهد. علاوه بر این، پس از ایجاد یک الگوریتم جدید با استفاده از آلارمهای تعریفشده توسط متن در ضبطکنندهها (IVSS)، کاربر میتواند مستقیماً آموزش محلی را در همان دستگاه انجام دهد تا در زمان و هزینه صرفهجویی کند.
Network Optix Network Optix (Nx) از Nx AI Manager، جدیدترین افزوده به مجموعه فناوری Toolkit Nx، رونمایی کرده است. Nx AI Manager برای کمک به توسعهدهندگان برای استقرار، مدیریت و بهینهسازی مدلهای هوش مصنوعی در طیف گستردهای از شتابدهندههای سختافزاری طراحی شده است. در میان ویژگیهای مختلف آن، Nx AI Manager میتواند با CLIP جفت شود تا تشخیص انعطافپذیر زبان طبیعی را مستقیماً در لبه (edge) فعال کند. CLIP یا Contrastive Language–Image Pretraining یک مدل زبانی مبتنی بر بینایی است که توسط OpenAI توسعه یافته و میتواند ارزیابی کند که یک تصویر چقدر با یک دستور متنی مشخص مطابقت دارد. هنگامی که CLIP چیزی را تشخیص میدهد که با یک دستور مطابقت دارد، موتور قوانین رویدادها کنترل را به دست میگیرد و سیستم را قادر میسازد تا به طور خودکار یک هشدار را فعال کند، یک ایمیل ارسال کند یا یک اعلان را در زمان واقعی نمایش دهد.
Hikvision جستجو با متن یکی دیگر از کاربردهای زبان طبیعی است که اخیراً در امنیت محبوبیت پیدا کرده است. در این زمینه، Hikvision از AcuSeek NVR با استفاده از مدلهای هوش مصنوعی در مقیاس بزرگ Guanlan خود رونمایی کرده است. این راهحل به دنبال رسیدگی به یک چالش حیاتی صنعت است که در آن پرسنل امنیتی اغلب ساعتها را صرف بررسی دستی فریم به فریم فیلمها در طول تحقیقات حوادث میکنند. با راهحل Hikvision، کاربران میتوانند به سادگی یک عبارت یا کلمه کلیدی مانند “وانت سفید” یا “شخصی که سگ را قدم میزند” را وارد کنند و سیستم به سرعت ویژگیهای سوژه را از فیلم ویدئویی استخراج میکند و امکان بازیابی دقیق ویدئو و تصویر را در عرض چند ثانیه فراهم میآورد.
چالشها
با وجود مزایای ارائه شده توسط موتورهای قوانین مبتنی بر زبان طبیعی، چندین چالش هنوز وجود دارد که باید بر آنها غلبه کرد. یکی ابهام در زبان است – به عنوان مثال، گفتن “نزدیک ورودی” در مقایسه با دادن مختصات دقیق، مبهم است. پیچیدگی ترجمه پرسوجوهای کاربر به اقدامات دقیق سیستم نیز میتواند یک چالش باشد.
استپانیان گفت: “این موارد را میتوان از طریق رابطهای NLP هدایتشده که به کاربران کمک میکند تا قوانین را به وضوح بیشتری بیان کنند، همراه با پشتوانههای بینایی کامپیوتری قوی برای اطمینان از تشخیص قابل اعتماد، حل کرد.”
چالشها به کنار، استفاده از زبان طبیعی برای ایجاد آلارمها، قوانین و الگوریتمها به یک روند در نظارت تصویری تبدیل خواهد شد. استپانیان گفت: “این بخشی از یک روند روشن به سمت تحلیلهای در دسترستر و کاربرپسندتر است. تمرکز در حال تغییر به سمت آسانتر کردن استفاده از سیستمهای نظارت تصویری بدون تکیه بیش از حد بر مدلهای NLP سنگین است – با بینایی کامپیوتری و تنظیمات ترکیبی لبه-ابر که دقت و کارایی را تضمین میکنند.”

