آرشیو برچسب: سیسمتهای آنالیز ویدئویی

ویدئوها و آنالیتیک ها در سال 2019

با به پایان رسیدن سال 2018 همه ی افراد منتظرند که ببینند چه تکنولوژی هایی تبدیل به روندهای رایج امنیتی در سال 2019 خواهند شد. تا جایی که سیستم های نظارت ویدئویی مسئله موردبحث باشند، انتظار میرود که در سال 2019 سیستم های تجزیه و تحلیل محتوای ویدئویی، سیستم های تشخیص چهره و سیستم های محاسباتی اج-محور برجسته تر از قبل خودی نشان دهند.

تجزیه و تحلیل محتوای ویدئویی

تجزیه و تحلیل محتوای ویدئویی پیشرفت زیادی داشته و از تکنولوژی های اغراق-شده ی گذشته به نوآوری هایی اساسی که باعث بهبود وضع امنیت و همچنین هوشمندی بیزنسی میشوند تغییر شکل یافته است. انتظار میرود که در سال 2019 این تکنولوژی نقش پررنگ تری را در امنیت ایفا نماید.

در حال حاضر نرم افزارهای تجزیه و تحلیل محتوای ویدئویی که هوش مصنوعی ﴿AI﴾ و تکنولوژی یادگیری عمیق را در خود جای داده اند به مراتب ارزشمندتر از بررسی های پس از وقوع رخدادها تلقی میشوند. به خاطر سرعت باورنکردنی و قابلیت های هوشمند این سیستم ها، بسیاری از افراد درحال یافتن راه هایی جدید برای استفاده از آنها هستند. به عنوان مثال، بیزینس های خرده-فروشی در حال استفاده از این تکنولوژی جهت برنامه ریزی های کنش گرایانه و استراتژیک هستند تا تجربه ی بهتری را برای مشتریان فراهم ساخته و در نتیجه باعث افزایش میزان فروش خود و وفاداری آنها شوند؛ سازمان های درمانی و بهداشتی نیز از این تکنولوژی جهت رسیدگی به مسائل عملیاتی همچون یافتن افراد غیرمجاز در مناطقی با تاسیسات محدود استفاده می نمایند؛ و قطب-های حمل و نقل از این تکنولوژی ها جهت بهبود جریان مسافران استفاده کرده و شهرداری ها به صورت کنشگرایانه برای امن تر نگاه داشتن خیابان های شهری بهره میگیرند.

علیرغم صحبت های موجود مبنی بر فقدان یک عامل پیشبینی کننده در آنالیتیک های امروزی (این سیستم ها قادر به پیش بینی اینکه فردی قصد انجام کار بدی را دارد یا خیر نیستند!)، پیشرفت های صورت گرفته درآنالیتیک ها منجر به پیشگیری بهتر از وقوع جرائم میگردد. به عنوان مثال از طریق استفاده از بیگ دیتا یا کلان داده ها، مجاری قانونی بهتر میتوانند به تجزیه و تحلیل الگوی جرائم و روندهای آنها بپردازند و بدین شکل محل وقوع رخدادهای امنیتی را پیشبینی کرده و طبق این داده ها، نیروهای خود را به کار بگیرند. استفاده از ویدئوآنالیتیک ها در بررسی ها و تحقیقات صورت گرفته پس از وقوع رخدادها به عنوان امری مهم برای یافتن مجرمین، فهم بهتر صحنه جرائم و تعیین محل افراد گم شده تلقی میگردد و این داده ها هوشمندی لازم برای پیشگیری کنشگرایانه ی جرائم را فراهم میسازند.

سیستم های تشخیص چهره

سیستم های تشخیص چهره پیشرفتی جدید تلقی میشوند. با استفاده از تکنولوژی های یادگیری عمیق و تکنولوژی هوش مصنوعی ﴿AI﴾، سیستم های تشخیص چهره قادر به صدور اجازه ی ورود به گوشی هوشمند بوده و همچنین میتوانند دوستان شما را در تصاویر منتشرشده در شبکه های مجازی تشخیص بدهند. در حالی که به سیستم های تجزیه و تحلیل محتواهای ویدئویی فکر میکنیم، سیستم های تشخیص چهره بیشتر از هر زمان دیگری در حال ایفای نقشی پررنگ هستند. در سال 2019 شاهد استفاده ی بیشتر ارگان های اجرایی قانون از آنالیتیک های ویدئویی و سیستم های تشخیص چهره خواهیم بود تا بدین شکل وقایع صورت گرفته با سرعت بیشتری حل و فصل شوند. با استفاده از این تکنولوژی ها خرده فروشان به سرعت میتوانند به تشخیص سارقین وسایل موجود در فروشگاه ها بپردازند. از آنجایی که این تکنولوژی در حجم بالا در سراسر جهان به کار گرفته شده و بیشتر از هر زمان دیگری در دسترس افراد قرار دارد، انتظار میرود که این تکنولوژی به شکل قابل توجهی در سال 2019 بکار گرفته شود.

علیرغم وجود برخی نگرانی ها یا مسائل اخلاقی حول سیستم های تشخیص چهره، این سیستم ها راه هایی مناسب برای رسیدگی به این دست از مسائل خواهند بود.

سیستم های تشخیص چهره موارد کاربرد معناداری را ارائه میکنند؛ یکی از این کاربردها تطبیق چهره ها بر اساس تصویری در یک ویدئو یا تصویری بیرون از سیستم مربوطه ﴿ به عنوان بخشی از لیست افراد تحت تعقیب یا به عنوان یک تصویر منفرد﴾ میباشد. افراد شاهد ارجاعات زیادی از نوع فیلم “گزارش اقلیت” به کارگردانی استیون اسپیلبرگ به سیستم های تشخیص چهره بوده-اند؛ محور اصلی این فیلم روی سیستمی است که بر مبنای ۳ انسان کار می‌کند و می‌تواند جرایم را پیش از وقوع پیش‌بینی کند و بدین ترتیب مأموران اجرایی پیش از وقوع جنایت جلوی آن را می‌گیرند و بدین ترتیب مدت‌هاست که دیگر جنایتی رخ نداده است. اما همین سیستم پیچیده هم ممکن است فریب بخورد. زمانی که ماشین پیش‌بینی می‌کند در زمان مشخصی یکی از مأموران اصلی پروژه دست به قتل خواهد زد، او با این پرسش مواجه می‌شود که آیا خود اراده تغییر آینده خود را دارد یا مجبور است به تقدیر تن در دهد و در این راه معمای پیچیده‌ای را باز می‌کند. حقیقت آن است که وضع تصاویر هیچ پیشرفتی نداشته، هیچگونه ارتباطی با داده های فردی وجود نداشته و هیچگونه ارتباطی بین سایر تصاویر فرد موردنظر در خارج از ویدئویی که چهره ی وی با آن تطبیق داده شده وجود ندارد. با توجه به آنچه گفته شد، به احتمال زیاد شاهد نظارت قدرتمندتر از سوی دولت ها خواهیم بود تا بدین شکل سیاست هایی برای تنظیم استفاده از این تکنولوژی ها و تعریف حقوق انتخاب برای دنبال شدن به صورت دیجیتال را تعیین کنند.

پردازش اج-محور و محاسبات ابری

در آخر، پردازش اج-محور و محاسبات ابری نقشی به مراتب پررنگتر را در افزایش سرعت بکارگیری آنالیتیک های پیشرفته محتوای ویدئویی ایفا خواهند نمود. با ادامه یافتن شهرت ویدئوها، نیاز به حفظ پهنای باند در حال ایجاد موجی از مهاجرت ابری و محاسبات اج-محور است. این امر امکان آنالیتیک های پیشرفته محتواهای ویدئویی را فراهم میسازد؛ این آنالیتیک ها داده های جمع-آوری شده از دوربین ها و دستگاه ها را مورد پردازش قرار میدهند. پیشبینی میشود که در سال 2019 مهاجرت به سوی سیستم های محاسبات ابری و پردازش اج-محور همچنان ادامه پیدا کند و در نتیجه آن شاهد بکارگیری بیشتر آنالیتیک های AI-محور محتواهای ویدئویی در بسیاری از صنایع باشیم؛ این صنایع شامل صنعت حمل و نقل، آموزش عالی، مراکز بهداشتی و درمانی، خرده فروشی-ها و بسیاری از صنایع دیگر میشوند.

برگرفته از مجله a&s و دانشنامه آزاد ویکی پدیا

چهره ی تکنولوژی ویدئویی در سال 2019

تنها در طول چند دهه، صنعت نظارت ویدئویی شاهد تغییراتی اساسی در زمینه تکنولوژی بوده است؛ گذار از دوربین های آنالوگ و سیستم های مداربسته به سوی سیستم های دیجیتال و تکنولوژی های ویدئویی IP که قدرت هوش مصنوعی ﴿AI﴾ را تحت کنترل خود در آورده اند.

بدون شک صنعت تولید سیستم های مدیریت ویدئویی VMS صنعتی رو به رشد است که طبق پیش بینی های صورت گرفته انتظار میرود تا سال 2019 ارزش این صنعت به 5.0$ میلیارد دلار در منطقه آسیا-اقیانوسیه برسد.

هر چه دوربین ها و سنسورها پیشرفته تر شده و تکنولوژی های نوظهوری چون اینترنت اشیاء ﴿IoT﴾ در حجم گسترده تری با سیستم های مدیریت ویدئویی تلفیق میشوند، انتظار میرود که تکنولوژی های مربوط به سیستم های ویدئویی به یک اندازه روی بیزینس ها و بازارها تاثیر بگذارند.

بنابراین در سال پیش رو از صنعت تکنولوژی ویدئویی چه انتظاری باید داشت؟ در این مقاله سه روندی که همچنان باعث تغییر زاویه دید و رویکرد ما در سال 2019 و پس از آن میشود مورد بحث و بررسی قرار خواهد گرفت.

هوش مصنوعی :عامل استمرار تغییر در بازار نظارت ویدئویی

هوش مصنوعی همچنان به بهبود وضعیت دوربین های نظارتی کمک خواهد نمود – این تکنولوژی دوربین ها را مجهز به مغزهایی دیجیتال میسازد که با چشمان آنها هماهنگ بوده و سیستم ها را قادر میسازد تا ویدئوهای زنده و ضبط شده را در حجم های بالاتر آنالیز کنند.

در گذشته از دوربین ها به عنوان اجسامی منفعل و مجهول یاد میشد، اما با کمک تحلیل رفتاری و بینش های پیشگیرانه همان دوربین ها حال به سرمایه هایی فعال و ارزشمند تبدیل شده اند. به عنوان مثال در شهرهایی چون سنگاپور و گویانگ کره، سیستم-های مجهز به تکنولوژی ویدئوی هوشمند در حال بکار گرفته شدن در مراکز فرماندهی و مراکز نظارتی هستند تا با کارایی و کارآمدی بیشتری به مبارزه با جرائم پرداخته شود.

در شهر سنگاپور، با کمک آگاهی نسبت به شبکه های عظیمی از دوربین های نظارتی موجود در جزیره های این کشور، تکنولوژی تشخیص چهره در حال مورد آزمایش قرار گرفتن است. سیستم ویدئویی مجهز به هوش مصنوعی قادر به تشخیص چهره ی افراد در یک محیط شلوغ و همچنین جدا کردن افراد موردنظر در لیست پیگیری نیروهای پلیس میباشد.

در شهر گویانگ نیز بکارگیری و مدیریت یکپارچه  و 24 ساعته سیستم های نظارتی-امنیتی به کمک سیستم های مجهز به هوش مصنوعی امکان پذیر شده است؛ این سیستم ها با استفاده از آنالیتیک های ویدئویی به انجام این دست کارهای دشوار میپردازند و به هر یک از کارکنان اجازه میدهند تا به بازبینی همزمان حدود 100 دوربین  پرداخته و به حفظ منابع ارزشمند شهری کمک کنند.

با پیشرفت صنعت نظارت، تکنولوژی ویدئویی مجهز به هوش مصنوعی تاثیر به مراتب بیشتر و عمیقتری روی صنعت نظارت ویدئویی میگذارد. طبق تخمین های صورت گرفته، تا سال 2020 حدود 1 میلیارد دوربین ویدئویی متصل به پلتفرم های  هوش مصنوعی وجود خواهد داشت و در سال 2019 این روند به صورت گسترده شروع به قدرت گرفتن خواهد نمود.

تکنولوژی ویدئویی: یک باید در استراتژی آی.تی هر شرکت

در شرکت های مدرن امروزی، پیشگامان بیزینسی و تصمیم گیرندگان کلیدی علاوه بر اهمیت قائل شدن برای ایمنی و امنیت سرمایه های کمپانی ها، روی آگاهی بهتر نسبت به فرآیندها و محیط های بیزینسی تاکید میکنند. دقیقا اینجاست که تکنولوژی ویدئویی هوشمند قادر به بهبود عملکرد بیزینسی و کاستن هزینه های عملیاتی خواهد بود.

بخش خرده فروشی نمونه ای از صنعتی است که به صورت کامل آماده ی استفاده از مزیت های تکنولوژی ویدئویی پیشرفته میباشد.

این صنعت راه زیادی را از گذشته تا به کنون آمده است؛ درگذشته به دوربین های ویدئویی تنها به عنوان سرمایه های ایمنی و امنیتی نگاه میشده است. در واقع خرده فروشان امروزی از گستره ی عظیمی از ابزارآلات و قابلیت های قدرتمند برخوردار هستند؛ اینترنت اشیاء (IoT) و سیستم های آنالیتیک ویدئویی از جمله این ابزارآلات و قابلیت ها هستند که به خرده فروشان اجازه میدهند تا آگاهی بیشتری نسبت به رفتار مشتریان خود و مسیر حرکت آنها در داخل مغازه کسب کنند.

به عنوان مثال، ویدئوی هوشمند قادر به تشخیص ورود یک فرد به فروشگاه و دنباله روی حرکات او در داخل فروشگاه میباشد. این کار باعث شکل گرفتن نقشه ای حرارتی میشود که به خرده فروشان اجازه میدهد تا متوجه شوند که هر یک از افراد به چه مدتی به یک ویترین نگاه کرده اند، قسمت های موردپسند فروشگاه کجا هستند و اینکه خریداران کدام قسمت ها را نادیده گرفته اند. این موضوع به خرده فروشان کمک میکند تا متوجه شوند چه کسی محصولات را بهتر معرفی و ارائه کرده و به صورت کارآمدتری شروع به انجام کارهای فروشگاه میکند و همچنین اینکه چه کسی روی کمپین های بازاریابی تاثیر بیشتری میگذارد.

همچنین ویدئوها قادر به تشخیص صف افراد هستند، بدین شکل خرده فروشان میتوانند زمان های بخصوصی که به پرسنل بیشتری نیاز است را متوجه شوند و در زمان هایی که به صورت غیرمنتظره سر پرسنل با تعداد زیاد مشتریان شلوغ میشود به پرسنل خود نسبت به باز کردن یک گیشه ی جدید آموزش دهند. همه ی این موارد به خرده فروشان کمک میکند تا از منابع انسانی خود به صورت بهینه استفاده کنند.

برای خرده فروشان، چنین استراتژی داده-محوری باعث کاهش هزینه های مربوط به نگهداری از مشتریان و زمان لازم برای ایجاد پروفایل های کاربران میشود. از سوی دیگر با کمک این استراتژی، مشتریان مزایای مضاعفی از لحاظ خدمات و محصولات بهتر دریافت میکنند.

ویدئو و اینترنت اشیاء نیروهای متصل به یکدیگری که از طریق نوآوری های تکنولوژی باعث تغییر بیزینس ها میشوند.

با افزایش تعداد دستگاه های متصل به یکدیگر از طریق تکنولوژی IoT و فوران کل داده های تولید شده، آنالیتیک های ویدئویی باعث افزایش سرعت خودکارسازی حجم بالای داده های غیرساختارمند میشوند؛ بدین شکل بینش و دانشی ایجاد میگردد که به کمک آن میتوان کاری انجام داد و ارزش های بیزینسی را قفل گشایی نمود.

طبق پیش بینی گارتنر، تا سال 2020 به جای آنالیز محتواهای (ویدئویی/تصویری) شرکتی توسط انسانها، حدود 99 درصد از این محتواها توسط ماشین ها آنالیز میگردند، بیشتر از 30 درصد در سال 2018. این پیش بینی با کمک جمع آوری پیشرفته داده ها و اتوماسیون سیستم ها، سرویس و نرم افزارها به واقعیت تبدیل خواهد شد، چرا که این کارها همچنان باعث افزایش میزان ویدئوها و نوآوری های آنالیتیکی ویدئویی میشوند.

به عنوان مثال در هارتفورد، ایالت کانکتیکات آمریکا، مجریان قانون این منطقه با بکارگیری تکنولوژی ویدئویی توانستند یک مرکز مواد مخدر را با کمک حجم بالای ترافیک مشکوک اطراف آن خانه شناسایی کنند. کارگاهان مربوطه، به جای بکارگیری تعداد زیادی از منابع خود برای تحت نظر گرفتن محل موردنظر در خودروها و یا در پشت بام ها توانستند در کمتر از یک دقیقه شواهد کافی را برای حمله به خانه موردنظر به دست آورند و بدین شکل حدود 32 ساعت کاری در انجام این ماموریت صرفه-جویی کنند.

آینده ی ویدئوها

پیشرفت های صورت گرفته در صنعت نظارت ویدئویی، ارگان های مختلف را بر آن داشته است که روی رویکرد خود نسبت به سیستم های ویدئویی تجدیدنظر کنند. از امن نگه داشتن شهرهای هوشمند گرفته تا بهینه سازی فروشگاه های خرده فروشی، آینده-ی ویدئوها امیدوارکننده به نظر میرسد. هنگامی که بیزینس ها شروع به دیدن موارد کاربرد بخصوص و عملی سیستم های نظارت ویدئویی میکنند، شاهد بکارگیری وسیع ویدئوهایی فراتر از امنیت در صنایع مختلف خواهیم بود.

منبع: مجله a&s

کارخانه هوشمند چیست؟

شاید یکی از رایجترین کلمات این دهه، واژه “هوشمند” باشد. هیچ صنعتی از این مفهوم مستثنی نیست. از تلفن ها گرفته تا منازل و ساختمان ها همگی در تلاش برای گنجاندن این مفهوم و برچسب در خود هستند. یکی از صنایعی که به صورت جدی نسبت به این امر علاقه نشان داده، صنعت تولید است. شناخته شده با عناوینی چون هوشمند، کارخانه های هوشمند و مفهوم گسترده تری چون صنعت 4.0، آهسته آهسته بخش تولید شاهد انقلابی است که میتواند روی بسیاری از بخش های دیگر تاثیرگذار باشد.

در قلب کارخانه های هوشمند موضوع هوشمندی قرار دارد و هوشمندی مکانی بخش مهمی از این کارخانه ها را تشکیل میدهد: در صورتی که چیزی حرکت کند و فرآیند انجام آن از اهمیت بالایی برخوردار باشد، ابتدا باید دید که این اتفاق در کدام مکان به وقوع پیوسته و در حال انجام چه کاری است. صنعت 4.0 محیطی را توصیف میکند که در آن فرآیندهای انعطاف پذیر و هوشمند با بهره گیری از داده های به دست آمده از سنسورهای متصل به تمامی بخش های یک زنجیره ی ارزش به صورت همزمان با وقوع رخداد استفاده میکند تا فرآیندهای بیزینسی بهینه سازی شوند. این سیستم های سایبری-فیزیکی از قدرت آنالیتیک های کلان داده ای برای ترجمه دید عملیاتی کامل به سرعت عمل و کارآمدی بی سابقه در امر تولید استفاده میکنند.

اما همواره گروهی از افراد وجود دارند که معتقدند بسته به مکان مورد بررسی از اصطلاحات متفاوتی استفاده میشود، با این حال مفهوم اصلی همچنان ثابت باقی می ماند.

بسته به منطقه و مکانی که این موضوع در آن مطرح میگردد، تعاریف مختلفی میتوان ارائه کرد. با این حال با انداختن نگاهی فراتر ازتعاریف مرسوم ارائه شده برای اصطلاحاتی چون “کارخانه هوشمند” یا “صنعت 4.0″، این اصطلاحات منعکس کننده ی تغییرات بنیادینی با توجه به چگونگی تغییر چهره ی فرآیندهای تولید از طریق “ساختارهای متصل به یکدیگر” هستند. امروزه مراحل مختلف فرآیندهای تولید، از همان ابتدا از پایین ترین سطح یک ماشین یا تجهیزات، مستقیما از طریق سنسورها/اینترنت اشیاء (IoT﴾ به یکدیگر متصل شده و مستقیما قادر به تعامل با یکدیگر هستند و در نتیجه این امر کل زنجیره ی تولید شفاف و کارآمدتر میشود. در حال حاضر این ماشین ها و تجهیزات را میتوان طوری برنامه ریزی کرد که علاوه بر تعامل با یکدیگر، با سیستم های بالاتر و پایین تر خود نیز به تعامل بپردازند و مستقل از مداخله نیروی انسانی، تصمیماتی هوشمندانه اتخاذ کنند. این دقیقا تعریف کارخانه هوشمند مدرن است.

کارخانه هوشمند به صنعتی گفته میشود که از دستگاه های متصل به اینترنت اشیاء ﴿IoT) برای بهبود کارایی، پیوستگی و امنیت عملیات های خود بهره میگیرد. تعامل به صورت همزمان و دورادور بین اجزای تولید و اپراتورها، کارخانه جات را به ویترینی برای اتوماسیون و اتوماتیک سازی تبدیل میکند. مفهوم کارخانه هوشمند را میتوان در دو فاز مجزا تعریف نمود. به عنوان مثال، کارخانه هوشمند بخشی از صنعت 4.0 است. صنعت 4.0 شامل فاز طراحی، فاز تولید و فاز لجستیک میشود. تمام این فازها به عنوان صنعت 4.0 نامیده میشوند، اما کارخانه هوشمند به نقطه ی میانی این فرآیند تبدیل میشود.

کارخانه های هوشمند حداقل به چهار عنصر نیاز دارند. عنصر اول، یکپارچه سازی ماشین با ماشین (M2M﴾ است. عنصر دوم مربوط به دانش حوزه مربوطه میشود. عنصر سوم مربوط به هوشمندی بیزینسی در بخش های بیرونی و داخلی این کارخانه ها است. عنصر چهارم نیز به تقاضای بازار برمیگردد.

این چهار عنصر از چهار حوزه ی متفاوت می آیند؛ این بدان معناست که اگر بخواهیم کارخانه هوشمند را در یک کلمه تعریف کنیم، میتوانیم از آن به عنوان تلفیق و یکپارچه سازی یاد کنیم.

ایده ی تقسیم این مفهوم به چهار دسته مختلف به نظر میرسد که در این صنعت بسیار شناخته شده باشد. صنعت 4.0 شامل چهار ستون میشود که کارخانه هوشمند یکی از این ستون ها را تشکیل میدهد. علاوه بر کارخانه هوشمند، تجربه دیجیتال مشتریان، زنجیره ی تامین متصل به یکدیگر و تشکیلات دیجیتال سایر ستون های صنعت 4.0 را تشکیل میدهند. هر صنعت 4.0 ابتدا با یکی از این ستون ها شروع میشود و سپس به سرعت به سوی سایر حوزه های دارای هم پوشانی حرکت میکند.

نقش دوربین ها در کارخانه های هوشمند

کارخانه های هوشمند میتوانند از دامنه ی گسترده ای از اطلاعات ورودی برای تغذیه قابلیت های تصمیم گیری خود استفاده کنند – ویدئوهای ضبط شده یکی از این منابع را تشکیل میدهند. از این ویدئوها میتوان برای سنجش و برای کنترل فرآیند استفاده کرد ﴿به عنوان مثال، اطمینان حاصل نمودن از اینکه برخی مناطق مشخص که در آن فرآیندهای تولید صورت میگیرند توسط اشیاء خارجی مسدود نشده باشند﴾، به علاوه اینکه این ویدئوها برای تست و آزمایش نیز کارایی دارند ﴿به عنوان مثال، اطمینان حاصل نمودن از اینکه تمام پیچ های موردنیاز برای سر هم کردن یک کیس در کالای تولید شده تعبیه شده است.﴾

داده های ویدئویی نیازمند تفاسیر زیادی هستند و زمانی بهترین عملکرد را از خود نشان میدهند که فرآیند و توضیحات مربوط به آن به خوبی محدود شده باشند و در نتیجه به الگوریتم های پردازش تصاویر امروزی اجازه دهند که با نرخ های خطای پایین عمل کنند. در مواردی که این فرآیندها به آن اندازه محدود نشده باشند، روش های مستقیم شناسایی و تشخیص اشیاء، یعنی سیستم های RFID ترجیح داده میشوند.

دوربین های داخل کارخانه های هوشمند برای کاربری هایی چون جلوگیری از ضرر، بازبینی دورادور، فرآیندهای عملیاتی، ایمنی و امنیت مورد استفاده قرار میگیرند. به عنوان مثال شرکت مارلنکا اینترنشنال که یک شرکت تولیدکننده کیک های عسلی واقع در کشور جمهوری چک است، به خاطر الزامات استانداردهای صنعتی، با قرار دادن دوربین در بالای خطوط تولید اقدام به بازبینی حرکات تسمه نقاله ای و فرآیند پخت خمیر نموده است. بخش های دیگری از این شرکت که در آنها از دوربینها استفاده شده است، بخش بسته بندی محصولات و بخش ارسال، برای بازبینی میزان ترافیک میباشد.

به عنوان مثال دیگری از چگونگی بکارگیری دوربین ها در تاسیسات هوشمند میتوان به شرکت زامپرا اسپول، یک شرکت مهندسی بین المللی واقع در کشور جمهوری چک اشاره کرد. این شرکت عمدتا به دلایل امنیتی مرسوم و همیشگی، همچون محافظت از فضاهای پیرامونی، جلوگیری از سرقت و بازبینی، از دوربین ها استفاده نموده است. این دوربین ها در امر بازبینی امنیت در کار و برخی از فرآیندهای کاری مشخص خود را نشان داده اند؛ با بکارگیری این دوریبن ها، تعداد صدمات ناشی از کار و غیاب های گزارش نشده در محیط کار کاهش یافته است. با این وجود خیلی زود مشخص شد که کیفیت مثال زدنی و قابلیت های نرم افزاری دوربین های بکار گرفته شده، همچون جستجوی آسان برای فایل های ضبط شده، این کار را ممکن ساخت که از این دوربین ها برای اقدامات دیگری که تا حد زیادی باعث بهینه سازی عملیات های تولید میشدند استفاده نمود.

از زمان بکارگیری دوربین ها در این کارخانه ها، افزایش قابل توجهی در کیفیت تولید، رشد در تولید و کاهش صدمات کاری و غیاب های گزارش نشده در محیط کار مشاهده شد.

در کارخانه جات هوشمند از دوربین ها در دو سناریوی مختلف استفاده میشود. سناریوی اول، کنترل و بررسی بروز هرگونه خطا. کار اصلی دوربین های صنعتی، بررسی و کنترل میزان دقت یا مقاومت موردنیاز است. سناریوی دوم ، بحث نظارت است که کاربرد استاندار برای امنیت تلقی میگردد.

برگرفته از مجله a&s

http://www.didarc.com/fa/news/how-to-define-smart-factories

دوربین های چندسنسوره برای چه صنایعی مناسب اند؟

دوربین های چندسنسوره از مزیت های بسیاری برخورداند. در مقایسه با نصب چند دوربین ثابت مختلف، با گنجاندن چندین لنز مختلف در یک دستگاه واحد، یک دوربین چندسنسوره قادر به پوشش دهی منطقه ای گسترده است. این روزها، دوربین های چندسنسوره در صنایع مختلفی بکار گرفته میشوند و کاربران میتوانند از ویژگی های منحصربفرد این دوربین ها بهره مند شوند.

به صورت کلی، دوربین های چندسنسوره برای کاربرانی که فضاهای باز وسیعی را در اختیار دارند بسیار مناسب تلقی میشود. این فضاها شامل محوطه های پارکینگ، فرودگاه ها، کارخانه جات و استادیوم های بزرگ میشوند. در چنین فضاهایی، به جای استفاده از سه یا چهار دوربین در هر یک از کنج های موجود، تنها با داشتن سه دوربین یا کمتر میتوانید همان منطقه را با تعداد نقاط کور کمتر پوشش دهید.

ساختمان های تجاری، هتل ها، مناطق مسکونی، مدارس و فرودگاه ها دارای فضاهای بازی چون لابی، کافه تریا و باشگاه خود هستند. این فضاهای باز معمولا سقف های بلندی دارند که همین موضوع باعث دشواری نصب دوربین ها میشود. در چنین مناطقی، نصب یک دوربین که کار چندین دوربین مختلف را انجام دهد بسیار مطلوب است، چرا که این کار باعث کم شدن زحمت نصب دوربین های متعدد میگردد. علاوه بر این، اینگونه فضاها دارای راهروهای زیادی داخل ساختمان خود هستند که دوربین های چندسنسوره میتوانند زوایای مختلف راهروها را به خوبی پوشش دهند.

با توجه به آنچه گفته شد، صنایع زیر از جمله مواردی هستند که میتوانند از مزایای دوربین های چندسنسوره بهره مند شوند.

نظارت شهری

از آنجایی که شهرهای بزرگ معمولا دارای فضاهای بزرگ هستند، دوربین های چندسنسوره میتوانند برای کاربردهای نظارت شهری بسیار ایده آل باشند. خطر تروریسم نیز در دور و اطراف همه افراد احساس میشود. از اینرو، تمامی فضاهای باز باید بدون هیچگونه نقاط کوری موردبازبینی و مانیتور قرار بگیرند. راه حل این کار، استفاده از دوربین های چندسنسوره با رزولوشن بالا است.

چهار لنز با قابلیت جابجایی که هر کدام دارای سنسور تصویر 4K باشند، تصاویر واضح و شفافی را به دست میدهند. مزیت چنین قابلیتی این است که نقاط کور به حداقل میزان ممکن رسیده و دوربین ها میتوانند خود را با تقاطع های با اشکال مختلف و مناطق بازبینی موجود در مراکز شهر تطبیق دهند.

نظارت حمل و نقل

حمل و نقل از جمله صنایع دیگری است که میتواند از مزیت های دوربین های چندسنسوره بهره مند شود. دوربین های چندسنسوره در بازبینی چهارراه ها یا ایستگاه های مترویی که ساختار مسیریابی ﴿روی زمین/زیرزمین﴾ پیچیده ای دارند بسیار سودمندند.

در این قسمت به بررسی یک مثال میپردازیم. در این مورد، مشتری مربوطه توانست تنها با کمک یک دوربین چندسنسوره به بازبینی یک خیابان بزرگ و طولانی بپردازد. این درحالی است که در صورت استفاده کردن از دوربین های قدیمی، حداقل به سه دوربین نیاز بود. با بکارگیری دوربین های چندسنسوره، علاوه بر کاهش تعداد کلی دوربین ها، کار نصب و نگهداری از سیستم ها تا حد زیادی آسان میگردد؛ چرا که برای این کار تنها یک دوربین باید نصب گردد و به تنها یک دسته کابل نیاز است.

علاوه بر این موارد، با استفاده از دوربین های پانوراما میتوان به راحتی به دنباله روی اشیاء در سراسر مسیر پرداخت و با اطمینان خاطر تمام جزئیات اساسی و مهم را به صورت تمام وقت ثبت و ضبط نمود. این درحالی است که در صورت استفاده از دوربین های معمولی، افراد برای مشاهده ی رخدادها ناگزیر به مراجعه به تصاویر ضبط شده توسط دوربین های مختلف میشدند.

مراکز دولتی

مراکز دولتی بخش دیگری از صنایع ذکر شده هستند که میتوانند از مزایای وجود دوربین های چندسنسوره بهره مند شوند. دوربین های چندسنسوره قادر به بازبینی کنج های یک ساختمان دولتی و ارائه ی دیدی 180 درجه ای از این مناطق هستند. تکنیک هایی چون اتصال تصاویر به یکدیگر و اعوجاج گیری آنها به افراد اجازه میدهد که با تعداد دوربین های کمتر به بازبینی کنج ها بپردازند. همچنین با کمک این دوربین ها میتوان مناطق پیرامونی ورودی های ساختمان را موردبازبینی قرار داد. فرودگاه ها در ارتباط نزدیکی با مراکز دولتی هستند. با کمک دوربین های چندسنسوره در فرودگاه ها میتوان به بازبینی مناطق گسترده ای چون محل تحویل بار و باند فرودگاه ها پرداخت.

مراکز آموزشی و بهداشتی

مراکز آموزشی و بهداشتی دو مورد دیگر از صنایعی هستند که از مزایا و کمک های ارائه شده توسط دوربین های چندسنسوره بهره مند شده اند. به عنوان مثال، در محوطه ی یک دانشگاه ممکن است که به نصب و بکارگیری یک دوربین چندسنسوره در محدوده یک باجه تلفن اضطراری احتیاج باشد تا بدین شکل، قبل از وقوع یک رخداد و در حین وقوع آن، پوشش دهی گسترده ای از آن منطقه به عمل آید. به عنوان مثالی دیگر، بیمارستان ها میتوانند با استفاده از دوربین های چندسنسوره، میزان بازدهی و محافظت ارائه شده به بیمارستان ها را در مناطقی چون لابی های بزرگ موجود در ورودی یا در طبقه ی بیماران ارتقاء دهند.

دوربین های چندسنسوره قادر به ارائه ی تصاویر بهتر و پوشش دهی ببیشتر هستند و در نتیجه به تعداد دوربین های کمتری نیاز خواهد بود.

در حقیقت، مزیتی که دوربین های چندسنسوره برای این صنایع به ارمغان می آورند، مسئله ی مهمی است که موردتوجه اینگونه مراکز قرار دارد. برای بازارهایی چون مراکز آموزشی و بهداشتی که بودجه ی زیادی برای بخش امنیت ندارند، داشتن دوربین های چندسنسوره میتواند بار هزینه های وارده را تا حد زیادی کم و یا حتی رفع کند.

به جای سرمایه گذاری روی دوربین های معمولی مختلف، به دوربین های چندسنسوره فکر کنید. این دوربین ها چندین سنسور مختلف را در خود جای داده اند که این به معنای افرایش میدان دید و حذف نقاط کور است، بدون آنکه هزینه های کلی افزایش پیدا کنند.

نرم افزارهای خود دوربین

علاوه بر آنچه تا به اینجا گفته شد، دوربین های چندسنسوره قادر به کار با انواع نرم افزارها و آنالیتیک ها هستند و آگاهی موقعیتی و پیش آگاهی به مراتب بهتری را در اختیار کاربران قرار میدهند. از آنجایی که کاربران باید در عین بازبینی مناطق گسترده، رخدادهای به وقوع پیوسته را به سرعت تشخیص دهند، به دنبال آنالیتیک های ویدئویی مختلف هستند. با کمک نرم افزارهای پشتیبان بیشتر میتوان در صورت روئیت و تشخیص وقوع رخدادها، وجود صداهای غیرطبیعی یا رفتارهای غیرعادی همچون افتادن یا درگیر شدن افراد، آلارم های موجود را به صدا درآورد.

دوربین های چندسنسوره میتوانند نرم افزارهایی را در خود گنجانده باشند که بدون اشغال فضای زیاد، تصاویری باکیفیت و پرجزئیات ارائه کنند. با ادغام هر دوی این تقاضاها در یک دوربین کارآمد واحد، گزینه های زیادی در اختیار کاربران قرار میگیرد تا بدین شکل سیستم های نظارتی امنیتی خود را بهبود ببخشند.

 

منبع: مجله a&s

http://www.didarc.com/fa/%3F-news/what-verticals-are-multisensor-cameras-suitable-for

یادگیری عمیق چیست؟

این روزها یادگیری عمیق به موضوعی داغ تبدیل شده است و در طیف گسترده ای از صنایعی که در حال سرمایه گذاری روی زمینه هایی چون هوش مصنوعی، کلان داده و آنالیتیکها هستند ریشه دوانده است. به عنوان مثال شرکت گوگل از یادگیری عمیق در الگوریتم های تشخیص صدا و تصویر استفاده نموده است، این در حالی است که شرکت هایی چون نتفیلیکس و آمازون در حال استفاده از آن برای فهم رفتار مشتریان خود هستند. شاید باور آن برای شما دشوار باشد، اما محققین دانشگاه ام.آی.تی در تلاش برای پیش بینی آینده با استفاده از یادگیری عمیق هستند. حال به این موضوع فکر کنید که یادگیری عمیق از چه پتانسیلی برای راه اندازی انقلاب در جهان و نحوه ی کار ما با چیزهای اطرافمان برخوردار است. قبل از صحبت از یادگیری عمیق باید رابطه ی آن را با یادگیری ماشین و هوش مصنوعی متوجه شد. راحت ترین راه برای فهم این ارتباط، مراجعه به دیاگرام زیر است:

  • هوش مصنوعی – مهندسی ساخت ماشین ها و برنامه های هوشمند
  • یادگیری ماشین – قابلیت یادگیری بدون آنکه مشخصا برنامه ریزی صورت گرفته باشد
  • یادگیری عمیق – یادگیری بر اساس شبکه های عصبی عمیق

طبق شکل بالا متوجه خواهید شد که یادگیری ماشین زیرمجموعه ای از هوش مصنوعی است. این بدین معناست که میتوانیم ماشین هایی هوشمندی را بسازیم که قادر به یادگیری بر اساس داده های ارائه شده هستند. علاوه بر این، یادگیری عمیق زیرمجموعه ای از یادگیری ماشین است که در آن از الگوریتم های یادگیری ماشین مشابهی برای آموزش شبکه های عصبی استفاده شده است؛ این کار برای کسب دقت بیشتر در مواردی انجام میشود که یادگیری عمیق  قادر به ارائه عملکرد کافی نبوده است. موضوعات زیر در ادامه مقاله مورد بررسی قرار خواهند گرفت:

  • هوش مصنوعی
  • یادگیری ماشین
  • نقاط ضعف یادگیری ماشین

1. هوش مصنوعی

اصطلاح هوش مصنوعی در سال 1956 توسط جان مک کارتی ساخته شد؛ وی پدر هوش مصنوعی نام گرفته است. ایده ی پشت طرح هوش مصنوعی بسیار ساده و شگفت انگیز است. هدف از طرح هوش مصنوعی ساختن ماشین های هوشمندی بوده است که قادر به تصمیم گیری هستند. شاید این طرح همچون نوعی فانتزی علمی به نظر برسد، اما با توجه به پیشرفتهای اخیر صورت گرفته در تکنولوژی و قدرت محاسبات، این ایده هر روز بیشتر از پیش در حال نزدیک شدن به واقعیت است.

2. یادگیری ماشین: گامی به سوی هوش مصنوعی

حال که با مفهوم هوش مصنوعی آشنا شده اید، نوبت آن است که در مورد یادگیری ماشین صحبت شود و اینکه برنامه دهی ماشین ها برای یادگیری به چه معناست. ابتدا با تعریفی مشهور از یادگیری ماشین شروع میکنیم:

تعریف تام میشل از دانشگاه­ کارنژی ملون: «زمانی میتوان گفت که یک برنامه کامپیوتری از تجربه E با توجه به وظیفه T و ارزیابی عملکرد P یاد میگیرد که طبق ارزیابی P، عملکرد آن روی T، با کمک تجربه E بهبود یابد».

بنابراین در صورتی که بخواهید برنامه شما الگوهای ترافیکی موجود در یک تقاطع شلوغ ﴿وظیفه T﴾ را پیشبینی کند، از طریق الگوریتم های یادگیری ماشین و با کمک داده های موجود در مورد الگوهای ترافیکی قدیمی ﴿تجربه E﴾ میتوانید این کار را انجام دهید. دقت پیشبینی صورت گرفته ﴿ارزیابی عملکرد P﴾ به این بستگی دارد که آیا برنامه مربوطه موفق به استفاده از مجموع داده های موجود شده است یا خیر ﴿تجربه E﴾.

اساسا یادگیری ماشین به نوعی هوش مصنوعی اطلاق میشود که در آن کامپیوترها بدون نیاز به حجم زیادی از داده برای برنامه ریزی شدن، قدرت یادگیری پیدا میکنند. قانون و قاعده اصلی پشت یادگیری ماشین، یادگیری از مجموع داده ها و تلاش برای حداقل رساندن خطاها و به حداکثر رساندن احتمال به وقع پیوستن پیشبینی های آنها است.­

3. نقاط ضعف یادگیری ماشین

به هنگام کار با داده های بُعد-بالا، یعنی زمانی که با تعداد زیادی ورودی و خروجی سر و کار داشته باشیم، الگوریتم های یادگیری ماشین قدیمی چندان کاربرد ندارند. به عنوان مثال به هنگام تشخیص دست خط افراد، مقادیر زیادی ورودی موجود است­ که در آن انواع مختلفی ورودی که­ تداعی کننده انواع دست خط ها هستند وجود خواهد داشت. چالش اصلی دوم فهماندن این موضوع به کامپیوتر است که باید به دنبال چه ویژگی هایی باشد که نقشی مهم در پیش بینی نتیجه و همچنین کسب دقت بیشتر در حین انجام این کار ایفا خواهد کرد. به این فرآیند استخراج ویژگی گفته میشود.

دادن داده های خام به الگوریتم ها به ندرت کارایی داشته و به همین دلیل است که استخراج ویژگی بخش مهمی از جریان کاری یادگیری ماشین قدیمی را تشکیل میدهد. بنابراین بدون استخراج ویژگی، چالش های پیش روی برنامه نویس مربوطه افزایش پیدا میکند، چرا که کارایی الگوریتم ها تا حد زیادی به بینش برنامه نویس آن بستگی دارد. ­

از این رو بکارگیری این مدل یادگیری ماشین یا الگوریتم ها در برنامه هایی چون تشخیص اشیاء، تشخیص دست خط، پردازش زبان های طبیعی NLP و غیره بسیار دشوار است.

برگرفته از edureka

http://www.didarc.com/fa/news/what-is-deep-learning

ساز و کار یادگیری عمیق

یادگیری عمیق یکی از تنها متدهایی است که با آن میتوان بر چالش های استخراج ویژگی غلبه کرد؛ به این دلیل که مدل های یادگیری عمیق قادر به یادگیری تمرکز روی ویژگی های مناسب بوده و به راهنمایی کمی از سوی برنامه نویس نیازمند هستند. اساسا یادگیری عمیق از نحوه ی عملکرد مغز تقلید میکند، به عبارت دیگر از تجربه ها یاد میگیرد. همانطور که میدانید مغز ما از میلیاردها عصب تشکیل شده که به ما امکان انجام کارهای خارق العاده ای را میدهد.  حتی مغز یک بچه یک ساله نیز قادر به حل مشکلات پیچیده ای است که حل آنها برای سوپرکامپیوترها هم بسیار دشوار است. به عنوان مثال:

  • تشخیص چهره والدین خود و همچنین اشیاء مختلف.
  • تشخیص صداهای مختلف از یکدیگر و شناسایی افراد بر اساس صدای آنها.
  • فهم حس و حال چهره سایر افراد و بسیاری از کارهای دیگر.

در حقیقت مغز ما در طول سالیان مختلف و به صورت نیمه خودآگاه خود را برای انجام چنین چیزهایی آموزش داده است. در حال حاضر، سوالی که پیش می آید این است که یادگیری عمیق چگونه از عملکرد مغز تقلید میکند؟ یادگیری عمیق از مفهوم عصب های مصنوعی که عملکردی مشابه عصب های های بیولوژیکی مغز انسانها دارند استفاده میکنند. بنابراین میتوان گفت که یادگیری عمیق زیرمجموعه ای از یادگیری ماشین است که خود به الگوریتم های الهام گرفته از ساختار و عملکرد مغز که شبکه های عصبی مصنوعی نامیده میشوند وابسته است.

حال برای روشن شدن این موضوع به مثال زیر نگاهی بیاندازید. ساختن سیستمی را متصور شوید که قادر به تشخیص چهره ی چندین فرد مختلف در یک تصویر باشد. در صورتی که این مشکل را به عنوان یک مشکل یادگیری ماشین معمولی حل کنیم، ویژگی های چهره ای چون چشم، دماغ،‌ گوش ها و غیره را تعریف خواهیم کرد و سپس سیستم تشخیص خواهد داد که کدام یک از ویژگی ها برای کدام یک از افراد حائزاهمیت است.

در حال حاضر یادگیری عمیق این کار را یک مرحله پیشتر برده است. یادگیری عمیق به صورت خودکار ویژگی های حائزاهمیت برای طبقه بندی را با کمک شبکه های عصبی عمیق خود پیدا میکند، این در حالی است که در یادگیری ماشین، این ویژگی ها باید به صورت دستی تعریف شوند.­

همانطور که در تصویر بالا نشان داده شده است، یادگیری عمیق به شکل زیر عمل میکند: در پایین ترین سطح، شبکه روی الگوهای کنتراست داخلی به عنوان موضوعی مهم تمرکز میکند. لایه بعدی قادر به استفاده از آن الگوهای کنتراست داخلی برای تمرکز روی چیزهایی که مشابه چشم ها، دماغ ها و دهان ها است. در آخر، لایه نهایی قادر به بکارگیری آن ویژگی های چهره در قالب های چهره است. یک شبکه عصبی عمیق قادر به ساخت ویژگی های پیچیده و پیچیده تری در هر یک از لایه های بعدی خود است.

آیا تا به حال این سوال برای شما پیش آمده است که فیسبوک چگونه به صورت خودکار تمامی افراد حاضر در یک تصویر آپلود شده توسط شما را لیبل و برچسب گذاری میکند؟ فیسبوک همچون مثال قبل که پیشتر ذکر شد از یادگیری عمیق استفاده میکند. قابلیت های یادگیری عمیق و اینکه چگونه در مواردی که از اثر یک سری از ویژگی ها بیخبر بوده ایم یادگیری عمیق توانسته از لحاظ عملکرد از یادگیری ماشین سبقت بگیرد از جمله مواردی هستنند که شاید تا به اکنون متوجه آنها شده باشید. ­

در نتیجه شبکه های عمیق میتوانند با بهره جویی از مجموع داده های شامل داده های ورودی فاقد برچسب گذاری مناسب، از پس نقاط ضعف یادگیری ماشین برآیند.

شبکه عصبی چیست؟

همانطور که از نام آن برمی آید، یادگیری عمیق زیرمجموعه ای از یادگیری ماشین است. یادگیری عمیق برای پرداختن به مشکلات یادگیری ماشین، بیشتر درگیر استفاده از شبکه های عصبی مصنوعی عمیق (الگوریتم ها/مدل های محاسباتی که تا حدودی از مغز انسان الهام گرفته اند) شده است.

حال سوالی که ذهن افراد را درگیر میکند این است که اصلا شبکه عصبی چیست و چه کاری در یادگیری عمیق انجام میدهد؟ به مقایسه زیر توجه کنید: شبکه ی عصبی را همچون یک سری درب که پشت سر یکدیگر قرار گرفته اند در نظر بگیرید و خود را به عنوان یک “ورودی” به شبکه عصبی موجود ببینید. هر زمان که یکی از این درب ها را باز میکنید، تبدیل به یک فرد جدید میشوید (به عبارت دیگر، به نحوی یک تغییر در شما اتفاق می افتد). و زمانی که به آخرین درب میرسید، به یک فرد کاملا متفاوت تبدیل شده اید. هنگامی که از درب آخر خارج میشوید، به “خروجی” شبکه عصبی تبدیل میشوید. در این مورد، هر یک از درب ها نشان دهنده ی یک لایه هستند. بنابراین یک شبکه عصبی مجموعه ای از لایه هایی است که به نحوی ورودی موردنظر را تغییر داده و به ایجاد خروجی پرداخته است.

هر یک از لایه های موجود در شبکه ی عصبی شامل “وزن ها” و “جهت گیری ها”ی خاص خود هستند – این موارد تنها اعدادی هستند که بر ورودی افزوده میشوند. عملکرد کلی شبکه های عصبی به این شکل است که تعدادی ورودی دریافت کرده (معمولا مجموعه ای از اعداد که نمایش دهنده ی چیزی هستند، به عنوان مثال، مقادیر قرمز-سبز-آبی پیکسل ها در یک تصویر)، با استفاده از وزن ها و جهت گیری های لایه های خود یک سری تغییرات محاسبه شده انجام داده و در نهایت یک خروجی را بیرون میدهد. در صورتی که قبلا یک سری کلاس جبر گذرانیده باشید میتوانید به این ورودی ها، خروجی ها و وزن ها به عنوان یک سری ماتریس نگاه کنید. ماتریس ورودی توسط یک سری ماتریس تغییر داده شده (به عبارت دیگر، ماتریس های وزن و جهت گیری های لایه مربوطه) و به خروجی شما تبدیل میشود. البته ذکر این نکته حائز اهمیت است که توصیف ارائه شده توضیحی بسیار ساده از نحوه عملکرد یک شبکه عصبی بوده و تنها برای فهم بهتر آن مطرح شده است.

یک شبکه عصبی عمیق تنها یک شبکه عصبی با تعداد لایه های زیاد است (با قرار دادن لایه ها روی یکدیگر، شبکه ی عصبی شما شروع به “عمیق تر” شدن میکند. ایده ی اولیه یادگیری عمیق، استفاده از شبکه های عصبی به همراه چندین لایه مختلف بوده است).

حال سوالی که مطرح میشود این است: شبکه ی عصبی چگونه یاد میگیرد؟ از طریق “پس انتشار. این واژه به روش معمول برای آموزش یک شبکه عصبی گفته میشود که در آن خروجی اولیه سیستم با خروجی دلخواه مقایسه شده و تا جایی که تفاوت بین آنها به حداقل برسد، سیستم مربوطه تنظیم میشود. همانطور که قبلا گفته شد شبکه های عصبی از لایه هایی تشکیل شده اند که وزن ها و جهت گیری های خاص خود (که تنها مجموعه ای از اعدادند) را شامل میشوند. در جریان فاز آموزش، شبکه های عصبی در جهت یافتن وزن ها/جهت گیری های درستی تلاش میکنند که قادر به ارائه ی دقیقترین خروجی ها باشند. این کار با استفاده از روشی تحت عنوان پس انتشار انجام میشود. پیش از آموزش دادن یک شبکه عصبی، وزن ها/ جهت گیری ها یا به صورت رندوم و یا با توجه به یک مدل آموزش دیده شده ی قبلی آماده سازی میشوند. در هر دو صورت هنگامی که آموزش صورت میگیرد، شبکه ی عصبی آن وزن ها و جهت گیری ها را با توجه به آنچه که “یاد میگیرد” تغییر میدهد. هنگامی که یک شبکه ی عصبی میسازیم، باید روی چیزی به عنوان تابع هزینه تصمیم گیری (به عبارت دیگر، انتخاب یا طراحی) کنیم. تابع هزینه اساسا به نوعی تابع ریاضی گفته میشود که خروجی را از یک شبکه ی عصبی (برای یک ورودی معین) و داده ی عینی (به عبارت دیگر، خروجی مورد انتظار از شبکه ی عصبی برای ورودی مشخص شده) دریافت و میزان غلط/بد بودن نتیجه حاصل از شبکه های عصبی را محاسبه میکند.

با استفاده از تکنیک های بهینه سازی همچون گرادیان کاهشی، کامپیوتر شما چگونگی تغییر وزن ها و جهت گیری ها را یاد میگیرد تا بدین شکل تابع هزینه را به حداقل برساند. اما گرادیان کاهشی به چه معناست؟ گرادیان کاهشی یک الگوریتم بهینه‌سازی مرتبه اول الگوریتم تکرار شونده است. برای یافتن کمینه محلی یک تابع با استفاده از این الگوریتم، گام‌هایی متناسب با منفی گرادیان (یا گرادیان تخمینی) تابع در محل فعلی برداشته خواهد شد. اگر در استفاده از این الگوریتم، گام‌هایی متناسب با جهت مثبت گرادیان برداشته شود، به بیشینه محلی تابع نزدیک می‌شویم که به این فرایند گرادیان افزایشی گفته می‌شود. سیستم مربوطه با یاد گرفتن با توجه به داده های بیشتر و بیشتر به انجام این کار ادامه میدهد (خروجی را از شبکه ی عصبی دریافت، هزینه را محاسبه و برای تغییر وزن ها کار “پس انتشار” را که پیشتر توضیح داده شد انجام میدهد). به مرور زمان، وزن ها و جهت گیری های سیستم با توجه به داده ها تنظیم میشوند و در آخر شبکه ای عصبی با دقت خروجی بالا در دست خواهید داشت. به یاد داشته باشید که کارایی عملی یا دقت یک شبکه عصبی تا حد زیادی به داده های استفاده شده برای آموزش آن وابسته است: بنابراین این موضوع بسیار حائزاهمیت است که بانک اطلاعاتی مجموع داده های شما به درستی ساخته یا انتخاب شده باشد. بدون وجود داده ی خوب (و میزان داده ی خوب) کار آموزش یک شبکه ی عصبی دقیق بسیار دشوار تمام خواهد شد.

به علاوه، تابع هزینه اساسا میزان عدم دقت شبکه ی عصبی مربوطه را اندازه گیری میکند؛ با به حداقل رساندن تابع هزینه به وسیله تغییر وزن ها/جهت گیری ها، شبکه ی عصبی شما از لحاظ عددی بسیار دقیقتر خواهد شد. با این حال، دقت شبکه عصبی وابسته به داده ای است که بر اساس آن آموزش داده میشود؛ بنابراین یک هزینه پایین ضرورتا به معنای یک شبکه ی عصبی آموزش دیده به قدر کافی نیست.

موارد کاربرد یادگیری عمیق

1. تشخیص صدا

شاید اسم سیری به گوش شما خورده باشد؛ سیری یک راهنمای هوشمند صوتی در محصولات شرکت اپل است. همچون سایر غول های بازار، شرکت اپل نیز روی یادگیری عمیق سرمایه گذاری کرده تا بدین شکل بتواند خدمات خود را با کیفیت بیشتری در مقایسه با گذشته ارائه کند. در زمینه تشخیص صدا و راهنمای هوشمند صدایی چون سیری، افراد میتوانند با استفاده از شبکه های عصبی عمیق مدلهای صوتی دقیقتری را بسازند. در حال حاضر این زمینه یکی از فعالترین زمینه ها برای بکارگیری یادگیری عمیق است. به بیان ساده، با کمک این تکنولوژی شما قادر به ساخت سیستمی هستید که میتواند ویژگی های جدید یاد بگیرد و یا با توجه به شما خود را تغییر دهد. بنابراین با پیش بینی تمام احتمالات از قبل، به نحو بهتری راهنمایی در اختیار شما قرار میگیرد.

2. ترجمه ماشینی خودکار

همه ما میدانیم که گوگل قادر به ترجمه فوری بین 100 زبان مختلف بوده و سرعت آن به قدری است که همچون یک معجزه به نظر می آید. تکنولوژی پشت گوگل ترنزلیت ترجمه ماشینی نامیده میشود و برای افرادی که به خاطر تفاوت زبانشان قادر به برقراری ارتباط با یکدیگر نبوده اند همچون یک نجات دهنده عمل کرده است. حال ممکن است که این سوال برایتان پیش آید: « این ویژگی برای مدت های زیادی است که وجود دارد، پس دیگر چه چیز جدیدی برای ارائه میتواند داشته باشد؟» در طول چند سال گذشته، گوگل با کمک یادگیری عمیق رویکرد موجود نسبت به ترجمه ماشینی را در گوگل ترنزلیت خود به کلی دگرگون کرد. ­در حقیقت پژوهشگران یادگیری عمیقی که تقریبا چیزی در مورد ترجمه ماشینی نمیدانند، با ارائه و بکارگیری راهکارهای یادگیری ماشینی ساده توانسته اند بهترین و پیشرفته ترین سیستم های ترجمه زبانی در جهان را شکست دهند. ترجمه متون در این سیستم ها بدون نیاز به پیش پردازش توالی متون انجام میگیرد و به الگوریتم ها اجازه میدهد که ارتباط بین کلمات و معادل آنها را در زبان جدید یاد بگیرند. شبکه های فشرده ای از شبکه های عصبی متناوب و بزرگ برای انجام این ترجمه لازم است.

3. ترجمه بصری فوری

همانطور که میدانید یادگیری عمیق برای مواردی چون تشخیص تصاویری که دارای حروف اند و یا در مکانهایی که حروف ­در یک صحنه حضور دارند استفاده میشود. به محض شناسایی، این تصاویر را میتوان به متن تبدیل و ترجمه کرد و تصاویری با متن ترجمه شده از نو ایجاد نمود. حال شرایطی را تصور کنید که به کشور دیگری که زبان آن را نمیدانید سفر کرده اید. هیچ جای نگرانی نیست! با استفاده از اپلیکیشن های مختلفی چون گوگل ترنزلیت میتوانید برای خواندن علامت ها و یا تابلوهای خرید نوشته شده به زبان دیگر به سرعت ترجمه بصری انجام دهید.

4. خودروهای بدون راننده و اتوماتیک

شرکت گوگل در تلاش است که با استفاده از یادگیری عمیق مقدمات ساخت خودروهای بدون راننده خود ﴿معروف به WAYMO﴾ را فراهم و به سطح جدیدی از تکامل برساند. بنابراین به جای استفاده از الگوریتم های کدگذاری شده به صورت دستی، افراد میتوانند سیستم را طوری برنامه ریزی کنند که با استفاده از داده های ارائه شده توسط سنسورهای مختلف به خودی خود همه چیز را یاد بگیرند. در حال حاضر یادگیری عمیق به عنوان بهترین رویکرد نسبت به اکثر عملیات های ادراکی و همچنین بسیاری از عملیات های کنترلی سطح-پایین تلقی میگردد. ­از این رو در حال حاضر حتی افرادی که رانندگی بلد نبوده و یا ناتوان از رانندگی هستند نیز میتوانند بدون نیاز به سایر افراد وسیله نقلیه خود را برانند.

موارد ذکر شده تنها برخی از موارد مطرح استفاده از یادگیری عمیق بوده است که در آنها از این تکنولوژی به صورت گسترده استفاده شده و نتایج مطلوبی به دست آمده است. در بسیاری از حوزه هایی که جای بررسی و تامل دارند، یادگیری عمیق کاربری های دیگری نیز دارد.

برگرفته از edureka و towardsdatascience

http://www.didarc.com/fa/news/deep-learning-mechanism