موتورهای قوانین زبان طبیعی: چه ابزارهایی در دسترس است و چه مواردی نیاز به بهبود دارند؟

 

موتورهای قوانین مبتنی بر زبان طبیعی به کاربران امکان می‌دهند تا فقط با وارد کردن یک دستور متنی، آلارم‌ها و الگوریتم‌هایی را ایجاد کنند. راه‌حل‌های مرتبط در نظارت تصویری ظهور کرده‌اند. در همین حال، چالش‌ها همچنان باید حل شوند.

موتورهای قوانین مبتنی بر زبان طبیعی به کاربران اجازه می‌دهند تا فقط با وارد کردن یک دستور متنی، آلارم‌ها و الگوریتم‌ها را ایجاد کنند. راه‌حل‌های مرتبط قبلاً در نظارت تصویری ظهور کرده‌اند. در حالی که چنین فناوری‌هایی برای کاربران راحتی ایجاد می‌کنند، چالش‌ها همچنان باقی هستند که باید حل شوند.

تنظیم قوانین یا آلارم‌ها با زبان طبیعی در امنیت مورد توجه قرار گرفته است، به ویژه در میان ظهور مدل‌های زبان طبیعی، مدل‌های هوش مصنوعی در مقیاس بزرگ و ChatGPT. با موتورهای قوانین مبتنی بر زبان طبیعی، آلارم‌ها می‌توانند در مدت زمان کوتاه‌تری توسط افرادی که لزوماً در این زمینه آموزش ندیده‌اند، ایجاد شوند. تمام کاری که آن‌ها باید انجام دهند این است که یک دستور متنی را وارد کنند، برای مثال “اگر ماشینی بیش از 5 دقیقه در منطقه بارگیری توقف کرد، به من هشدار بده.” این فناوری می‌تواند به سازمان‌های کاربر نهایی در بازارهای عمودی مختلف کمک کند.

آلبرت استپانیان، رئیس و مدیر عامل شرکت Scylla AI، گفت: “موارد استفاده اولیه شامل جستجوی ویدئویی و پیکربندی هشدار در عملیات امنیتی است.” وی افزود که بخش‌هایی مانند مراقبت‌های بهداشتی، آموزش، خرده‌فروشی و زیرساخت‌های حیاتی از این فناوری بهره‌مند خواهند شد، زیرا کارکنان غیرفنی می‌توانند به طور موثر نظارت را بدون آموزش تخصصی پیکربندی و مدیریت کنند.

راه‌حل‌های مرتبط

با توجه به محبوبیت و پتانسیل موتورهای قوانین مبتنی بر زبان طبیعی، راه‌حل‌های مرتبط قبلاً ظهور کرده‌اند. در ادامه نگاهی به برخی از آن‌ها می‌اندازیم.

Dahua Dahua مدل‌های هوش مصنوعی در مقیاس بزرگ Xinghan خود را راه‌اندازی کرده است که ویژگی اصلی آن “آلارم‌های تعریف‌شده توسط متن” (Text-defined Alarms) است. به گفته Dahua، با فناوری‌های هوش مصنوعی متداول فعلی، توسعه الگوریتم‌های جدید گران است، به سرمایه‌گذاری قابل توجهی در منابع انسانی و مادی نیاز دارد و مشمول چرخه‌های طولانی سفارشی‌سازی است. در مقابل، آلارم‌های تعریف‌شده توسط متن Xinghan از مسلح‌سازی سفارشی از طریق توضیحات متنی پشتیبانی می‌کنند. الگوریتم‌های جدید را می‌توان از طریق متن دستور (prompt text) توسعه داد که به شدت آستانه توسعه را کاهش می‌دهد. علاوه بر این، پس از ایجاد یک الگوریتم جدید با استفاده از آلارم‌های تعریف‌شده توسط متن در ضبط‌کننده‌ها (IVSS)، کاربر می‌تواند مستقیماً آموزش محلی را در همان دستگاه انجام دهد تا در زمان و هزینه صرفه‌جویی کند.

Network Optix Network Optix (Nx) از Nx AI Manager، جدیدترین افزوده به مجموعه فناوری Toolkit Nx، رونمایی کرده است. Nx AI Manager برای کمک به توسعه‌دهندگان برای استقرار، مدیریت و بهینه‌سازی مدل‌های هوش مصنوعی در طیف گسترده‌ای از شتاب‌دهنده‌های سخت‌افزاری طراحی شده است. در میان ویژگی‌های مختلف آن، Nx AI Manager می‌تواند با CLIP جفت شود تا تشخیص انعطاف‌پذیر زبان طبیعی را مستقیماً در لبه (edge) فعال کند. CLIP یا Contrastive Language–Image Pretraining یک مدل زبانی مبتنی بر بینایی است که توسط OpenAI توسعه یافته و می‌تواند ارزیابی کند که یک تصویر چقدر با یک دستور متنی مشخص مطابقت دارد. هنگامی که CLIP چیزی را تشخیص می‌دهد که با یک دستور مطابقت دارد، موتور قوانین رویدادها کنترل را به دست می‌گیرد و سیستم را قادر می‌سازد تا به طور خودکار یک هشدار را فعال کند، یک ایمیل ارسال کند یا یک اعلان را در زمان واقعی نمایش دهد.

Hikvision جستجو با متن یکی دیگر از کاربردهای زبان طبیعی است که اخیراً در امنیت محبوبیت پیدا کرده است. در این زمینه، Hikvision از AcuSeek NVR با استفاده از مدل‌های هوش مصنوعی در مقیاس بزرگ Guanlan خود رونمایی کرده است. این راه‌حل به دنبال رسیدگی به یک چالش حیاتی صنعت است که در آن پرسنل امنیتی اغلب ساعت‌ها را صرف بررسی دستی فریم به فریم فیلم‌ها در طول تحقیقات حوادث می‌کنند. با راه‌حل Hikvision، کاربران می‌توانند به سادگی یک عبارت یا کلمه کلیدی مانند “وانت سفید” یا “شخصی که سگ را قدم می‌زند” را وارد کنند و سیستم به سرعت ویژگی‌های سوژه را از فیلم ویدئویی استخراج می‌کند و امکان بازیابی دقیق ویدئو و تصویر را در عرض چند ثانیه فراهم می‌آورد.

چالش‌ها

با وجود مزایای ارائه شده توسط موتورهای قوانین مبتنی بر زبان طبیعی، چندین چالش هنوز وجود دارد که باید بر آن‌ها غلبه کرد. یکی ابهام در زبان است – به عنوان مثال، گفتن “نزدیک ورودی” در مقایسه با دادن مختصات دقیق، مبهم است. پیچیدگی ترجمه پرس‌وجوهای کاربر به اقدامات دقیق سیستم نیز می‌تواند یک چالش باشد.

استپانیان گفت: “این موارد را می‌توان از طریق رابط‌های NLP هدایت‌شده که به کاربران کمک می‌کند تا قوانین را به وضوح بیشتری بیان کنند، همراه با پشتوانه‌های بینایی کامپیوتری قوی برای اطمینان از تشخیص قابل اعتماد، حل کرد.”

چالش‌ها به کنار، استفاده از زبان طبیعی برای ایجاد آلارم‌ها، قوانین و الگوریتم‌ها به یک روند در نظارت تصویری تبدیل خواهد شد. استپانیان گفت: “این بخشی از یک روند روشن به سمت تحلیل‌های در دسترس‌تر و کاربرپسندتر است. تمرکز در حال تغییر به سمت آسان‌تر کردن استفاده از سیستم‌های نظارت تصویری بدون تکیه بیش از حد بر مدل‌های NLP سنگین است – با بینایی کامپیوتری و تنظیمات ترکیبی لبه-ابر که دقت و کارایی را تضمین می‌کنند.”

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *