آرشیو برچسب: آنالتیک

هوش مصنوعی و خودروهای خودگردان

هوش مصنوعی (AI)، صنعت خودروسازی را تحت کنترل خود گرفته است تا بدین شکل تولید خودروهای خودگردان سطح-4 و سطح-5 کلید بخورد. شاید این سوال برای شما پیش بیاید که چرا علیرغم پیدایش و مطرح شدن هوش مصنوعی از سال 1950، این تکنولوژی به تازگی سر زبانها افتاده و شهرت یافته است؟ به صورت ساده شاید بتوان گفت که دلیل رشد سریع تکنولوژی هوش مصنوعی، وجود حجم بالای داده هایی است که امروزه در اختیار افراد قرار دارد. با کمک دستگاه ها و سرویس های متصل به هم، افراد میتوانند در هر صنعتی به جمع آوری داده ها بپردازند و در نتیجه آنچه را که برای آغاز انقلاب هوش مصنوعی AI لازم است تامین کنند. علیرغم تلاش های صورت گرفته برای بهبود سریع سنسورها و دوربین ها برای تولید داده های مربوط به خودروهای خودگردان، شرکت انویدیا در ماه اکتبر سال 2017 از نخستین کامپیوتر هوش مصنوعی خود پرده برداری کرد تا امکان یادگیری عمیق، بینایی رایانه ای و الگوریتمهای محاسباتی موازی را فراهم سازد. تکنولوژی هوش مصنوعی AI به بخش مهمی از تکنولوژی خودروهای خودگردان تبدیل شده است و دانستن چگونگی کارکرد این تکنولوژی در خودروهای خودگردان و متصل به یکدیگر حائزاهمیت است.

هوش مصنوعی چیست؟

مهندس کامپیوتری به نام جان مک کارتی، اصطلاح «هوش مصنوعی» را در سال 1955 ساخت. تعریفی که از هوش مصنوعی ارائه میشود بدین شرح است: توانایی یک برنامه کامپیوتری یا ماشین برای فکر کردن، یادگیری و اتخاذ تصمیمات. در استفاده ی کلی، این اصطلاح به معنای ماشینی است که قوه ی فهم انسانی را جعل میکند. با کمک تکنولوژی هوش مصنوعی AI، برنامه های کامپیوتری و ماشین ها قادر به انجام کارهایی میشوند که پیشتر انسان ها انجام میداده اند. این برنامه ها و ماشین ها با حجم زیادی از داده های تجزیه و تحلیل و پردازش شده تغذیه میشوند تا در نهایت قادر به تفکر به صورت منطقی  و انجام کارهای انسانی شوند. فرآیند خودکارسازی کارهای تکراری انسان ها تنها بخش کوچکی از کوه یخی بزرگ به نام هوش مصنوعی را تشکیل میدهد. تجهیزات مربوط به تشخیص بیماریها و خودروهای خودگردان همگی با هدف نجات جان انسانها، شروع به بکارگیری تکنولوژی هوش مصنوعی AI نموده اند.

رشد هوش مصنوعی در صنعت خودروسازی

طبق گزارش های موجود پیش بینی شد که در سال 2017 بازار AI در صنعت خودروسازی ارزشی برابر 783$ میلیون دلار داشته و تا سال 2025 با ترکیب نرخ رشد سالانه ای برابر 38.5٪ این ارزش به 11$ هزار میلیون دلار خواهد رسید.  طبق پیش بینی آی.اچ.اس مارکیت، در مقایسه با نرخ بکارگیری ۸ درصدی سیستم های AI-محور در خودروهای جدید، انتظار میرود که تا سال 2025 این نرخ تا 109٪ افزایش پیدا کند. سیستم هایAI-محور در خودروهای جدید تبدیل به یک استاندارد خواهند شد، مخصوصا در دو دسته زیر:

  1.   واسط سرگرمی و اطلاع رسانی بین انسان و ماشین که شامل تشخیص صدا، تشخیص رفتار، دنباله روی مسیر حرکت چشم و بازبینی راننده، راهنمای مجازی و واسط های زبان طبیعی (پردازش زبان‌های طبیعی یکی از زیرشاخه‌های بااهمیت در حوزه گسترده علوم رایانه، هوش مصنوعی است که به تعامل بین کامپیوتر و زبان‌های (طبیعی) انسانی می‌پردازد) میشود. سیستم های پیشرفته راهنمای راننده ﴿ADAS﴾ و خودروهای خودگردان که شامل سیستم های دید ماشینی دوربین-محور، واحدهای تشخیص رادار-محور، ارزیابی شرایط راننده و واحدهای کنترل موتور و ترکیب سنسورها میشود.
  2.          تکنولوژی یادگیری عمیق که یک تکنیک برای بکارگیری یادگیری ماشین ﴿رویکردی برای رسیدن به هوش مصنوعی AI﴾ است، انتظار میرود که بزرگترین و پرسرعت ترین تکنولوژی از لحاظ رشد در بازار هوش مصنوعی خودروها باشد. در حال حاضر این تکنولوژی در حال بکار گرفته شدن در بخش هایی چون تشخیص صدا، جستجوی صدا، موتورهای پیشنهادکننده و توصیه گر، تجزیه و تحلیل احساسات، تشخیص تصاویر و تشخیص حرکت در خودروهای خودگردان میباشد.

چگونگی کارکرد هوش مصنوعی در خودروهای خودگردان

این روزها واژه ی هوش مصنوعی به اصطلاحی رایج تبدیل شده است، اما سوالی که پیش می آید این است که این تکنولوژی دقیقا چطور در خودروهای خودگردان عمل میکند؟

نخست باید به زاویه دید یک انسان نسبت به راندن یک خودرو با استفاده از عملکردهای حسی چون بینایی و شنوایی برای دیدن جاده و سایر خودروهای موجود در جاده نگاهی انداخت. هنگامی که در مقابل یک چراغ قرمز ترمز میکنیم یا منتظر عبور یک عابر پیاده از عرض خیابان هستیم، در واقع در حال استفاده ازحافظه خود برای اتخاذ چنین تصمیات سریعی هستیم. تجربه ی  به دست آمده از سالها رانندگی، ما را نسبت به جستجو برای چیزهای کوچکی که اغلب در جاده ها با آنها مواجه میشویم ﴿ شاید یک راه بهتر برای رسیدن به اداره و یا شاید یک برآمدگی بزرگ در مسیر جاده﴾ عادت میدهد.

خودروهای خودگردانی که خودشان کار راندن را انجام میدند در حال تولید و ساخته شدن هستند، اما چیزی که حائزاهمیت است ساختن خودروهایی است که همچون رانندگان انسانی به راندن خودروها میپردازند. این به معنای تعبیه نمودن یک سری عملکرد در این وسایل نقلیه است که عملکردهای حسی، عملکردهای فکری ﴿حافظه، تفکر منطقی، تصمیم گیری و یادگیری﴾ و قابلیت های اجرایی که انسانها برای راندن وسایل نقلیه مورد استفاده قرار میدهند را شامل شود. صنعت خودروسازی به صورت مداوم در حال رشد و تکامل است تا در طی چند سال اخیر موفق به نیل این هدف شود.

به نقل از گارتنر تا سال 2020 حدود 250 میلیون خودرو قادر خواهند شد که از طریق سیستم های مختلف V2X (تکنولوژی ارتباط خودرو با همه چیز) به یکدیگر و زیرساخت های پیرامون خود متصل شوند. فناوری V2Xیا Vehicle-to-Everything ارتباط بین یک خودرو را با هر چیزی که دراطرافش از آن تأثیر می‌گیرد، ممکن می‌سازد که این ارتباط می‌تواند شامل «سایر خودروها» یا خودرو با خودرو/ V2V، زیرساخت‌های مرتبط و پیرامون خودرو/ V2I یا حتی موبایل / V2P باشد که درنتیجه سیستم خودرو با یک فرد موبایل به‌دست به‌عنوان عابر یا راننده خودروی کناری ارتباط برقرار کرده و بدین ترتیب خودروی شما با هر چیز ممکنی به‌صورت لحظه‌ای ارتباط می‌گیرد تا تعاریف استاندارد را اجرا کند. هر چه میزان داده های داده شده به واحدهای IVI ﴿in-vehicle infotainment به مجموعه ای از سخت افزارها و نرم افزارهای موجود در خودردوها گفته میشود که سرگرمی های صوتی و ویدئویی را ارائه میکنند﴾ یا سیستم های برقراری ارتباط از راه دور بیشتر شود، خودروها بیشتر قادر خواهند شد که به صورت همزمان با وقوع رخداد به ضبط و به اشتراک گذاری وضعیت داخلی سیستم ها و داده های مربوط به مکان خودرو و هرگونه تغییرات صورت گرفته در اطراف خودرو بپردازند. خودروهای خودگردان در حال مجهز شدن به دوربین ها، سنسورها و سیستم های ارتباطی هستند تا وسیله نقلیه مربوطه را قادر به تولید حجم بالایی از داده ها کنند. با بکارگیری تکنولوژی هوش مصنوعی AI، وسایل نقلیه قادر به دیدن، شنیدن، فکر کردن و اتخاذ تصمیماتی چون تصمیمات رانندگان انسانی میشوند.

چرخه درک عمل AI در خودروهاي خودگردان

هنگامي كه خودروي خودگردان از فضاي اطراف خود داده توليد ميكند و اين داده ها را در اختيار يك عامل هوشمند قرار ميدهد، يك لوپ تكرارشونده به نام چرخه درک عمل ايجاد ميشود. در مبحث هوش مصنوعی، عامل هوشمند به موجودی گفته می‌شود که در یک محیط، اطراف خود را شناخته و اعمالی را روی محیط انجام می‌دهد و کلیه اعمالی که انجام می‌دهد در جهت نیل به اهدافش می‌باشد. این سیستم‌ها امکان یادگیری دارند و سپس از دانش اکتسابی خود برای انجام اهداف خود استفاده می‌کنند. این کنشگرها ممکن است بسیار ساده یا پیچیده باشند. بطور مثال ماشین‌های کوکی که با برخورد به دیوار، راه خود را عوض می‌کنند نمونه‌ای از کنشگرهای هوشمند هستند. با توجه به تعریف اراده شده، این عامل هوشمند با استفاده از داده هاي ارائه شده شروع به تصميم گيري كرده و خودروي خودگردان موردنظر را قادر به انجام يك سري عمليات خاص در آن محيط ميسازد. اين فرايند به سه بخش اصلي تقسيم ميشود:

بخش ١: سيستم هاي جمع آوري داده و سيستم هاي ارتباطي داخل خودرو

خودروهای خودگردان مجهز به تعداد زیادی سنسور، رادار و دوربین هستند که برای تولید حجم عظیمی از داده های محیطی مورد استفاده قرار میگیرند. تمامی این سیستم ها به وسیله نقلیه خودگردان کمک میکنند تا به دیدن، شنیدن و حس کردن جاده، زیربناهای جاده ای، سایر وسایل نقلیه و هرشیء دیگر موجود در/نزدیک جاده کمک میکند؛ دقیقا همانطوری که یک راننده ی انسانی به هنگام رانندگی به جاده توجه میکند. این داده ها در مرحله ی بعد توسط سوپرکامپیوترها مورد پردازش قرار میگیرند و سیستم های ارتباطی داده ها برای تبادل امن اطلاعات (ورودی) ارزشمند به پلتفرم ابری رانندگی خوگردان استفاده میشوند. وسیله نقلیه خودگردان ابتدا فضای رانندگی و/یا شرایط رانندگی بخصوص را به پلتفرم رانندگی خودگردان مخابره میکند.

بخش ٢: پلتفرم رانندگي خودگردان (ابري)

پلتفرم رانندگي خودگردان كه در فضاهاي ابري قرار دارد داراي يك عامل هوشمند است كه از الگوريتم هاي هوش مصنوعي براي اتخاذ تصميمات منطقي و معنادار استفاده ميكند. اين پلتفرم به عنوان سياست كنترل يا مغز خودروهاي خودگردان عمل ميكند. عامل هوشمند نيز به يك پايگاه داده متصل ميشود كه به عنوان يك حافظه كه تجربيات رانندگي هاي پيشين در آن ذخيره ميگردد عمل ميكند. اين داده ها به همراه  داده هاي ورودي همزمان با وقوع رخداد ارائه شده توسط خودروي خودگردان و محيط اطراف آن، به عامل هوشمند كمك ميكنند تا تصميمات دقيقي در رانندگي بگیرد. حال خودروي خودگردان دقيقا ميداند كه براي رانندگي در چنين فضاهايي و يا در برخي شرايط بخصوص چه كاري بايد انجام بدهد

بخش ٣: عملكردهاي AI-محور در خودروهاي خودگردان

بر اساس تصميمات گرفته شده توسط عامل هوشمند، خودروي خودگردان قادر به تشخيص اشياء در خيابان، داشتن عملكرد در ترافيك آن هم بدون دخالت افراد و ايمن رسيدن به مقصد موددنظر خود ميباشد. همچنين خودروهاي خودگردان مجهز به سيستم هاي كاربردي AI-محوري چون تشخيص صدا و كلام، كنترل حالت بدن، دنباله روي مسير چشم و ساير سيستم هاي بازبيني رانندگي، راهنماي مجازي و سيستم هاي تشخيص مسير و مكان و سيستم هاي امنيتي ميباشند. اين سيستم هاي كاربردي تنها برخي از سيستم هاي بكار گرفته شده در خودروهاي خودگردان هستند. همچنين اين عملكردها بر اساس تصميمات اتخاذشده توسط عامل هوشمند موجود در پلتفرم رانندگي خودگردان انجام ميشوند. اين سيستم ها ساخته شده اند تا يك تجربه ي كاربري عالي را به مشتريان خود ارائه كنند و از آنها در جاده ها محافظت كنند. تجربه هاي رانندگي به دست آمده از هر بار رانندگي، ضبط و در پايگاه داده ذخيره ميشوند تا به عامل هوشمند در تصميم گيريهاي دقيقتر در آينده كمك كنند

اين لوپ داده كه چرخه درک عمل نيز ناميده ميشود به صورت مداوم تكرار ميشود. هر چه تعداد دفعات تكرار چرخه های درک عمل بيشتر باشد، عامل هوشمند مربوطه هوشمندتر شده و در نتيجه تصميات مربوطه، مخصوصا در شرايط رانندگي دشوار با دقت بيشتري گرفته ميشود. هر چه تعداد دستگاه هاي متصل شده بيشتر باشد، تعداد تجربيات رانندگي بيشتري ضبط ميشود. اين تجربيات به عامل هوشمند كمك ميكنند تا بر اساس داده هاي ايجادشده توسط چندين دستگاه خودگردان مختلف تصميم گيري كند. اما اين موضوع بدان معنا نيست كه هر دستگاه خودگردان لزوما بايد در يك شرايط رانندگي پیچيده قرار بگيرد پيش از آنكه قادر به فهمیدن آن شود

هوش مصنوعي، مخصوصا شبكه هاي نوروني و  يادگيري عميق به موضوعي اساسي در عملكرد درست و ايمنی خودروهاي خودگردان تبديل شده است. هوش مصنوعي در حال باز كردن راه براي راه اندازي خودروهاي خودگردان سطح ٥ است. در اين نوع خودروها ديگر نيازي به فرمان، پدال گاز يا ترمزها نخواهد بود

ساز و کار یادگیری عمیق

یادگیری عمیق یکی از تنها متدهایی است که با آن میتوان بر چالش های استخراج ویژگی غلبه کرد؛ به این دلیل که مدل های یادگیری عمیق قادر به یادگیری تمرکز روی ویژگی های مناسب بوده و به راهنمایی کمی از سوی برنامه نویس نیازمند هستند. اساسا یادگیری عمیق از نحوه ی عملکرد مغز تقلید میکند، به عبارت دیگر از تجربه ها یاد میگیرد. همانطور که میدانید مغز ما از میلیاردها عصب تشکیل شده که به ما امکان انجام کارهای خارق العاده ای را میدهد.  حتی مغز یک بچه یک ساله نیز قادر به حل مشکلات پیچیده ای است که حل آنها برای سوپرکامپیوترها هم بسیار دشوار است. به عنوان مثال:

  • تشخیص چهره والدین خود و همچنین اشیاء مختلف.
  • تشخیص صداهای مختلف از یکدیگر و شناسایی افراد بر اساس صدای آنها.
  • فهم حس و حال چهره سایر افراد و بسیاری از کارهای دیگر.

در حقیقت مغز ما در طول سالیان مختلف و به صورت نیمه خودآگاه خود را برای انجام چنین چیزهایی آموزش داده است. در حال حاضر، سوالی که پیش می آید این است که یادگیری عمیق چگونه از عملکرد مغز تقلید میکند؟ یادگیری عمیق از مفهوم عصب های مصنوعی که عملکردی مشابه عصب های های بیولوژیکی مغز انسانها دارند استفاده میکنند. بنابراین میتوان گفت که یادگیری عمیق زیرمجموعه ای از یادگیری ماشین است که خود به الگوریتم های الهام گرفته از ساختار و عملکرد مغز که شبکه های عصبی مصنوعی نامیده میشوند وابسته است.

حال برای روشن شدن این موضوع به مثال زیر نگاهی بیاندازید. ساختن سیستمی را متصور شوید که قادر به تشخیص چهره ی چندین فرد مختلف در یک تصویر باشد. در صورتی که این مشکل را به عنوان یک مشکل یادگیری ماشین معمولی حل کنیم، ویژگی های چهره ای چون چشم، دماغ،‌ گوش ها و غیره را تعریف خواهیم کرد و سپس سیستم تشخیص خواهد داد که کدام یک از ویژگی ها برای کدام یک از افراد حائزاهمیت است.

در حال حاضر یادگیری عمیق این کار را یک مرحله پیشتر برده است. یادگیری عمیق به صورت خودکار ویژگی های حائزاهمیت برای طبقه بندی را با کمک شبکه های عصبی عمیق خود پیدا میکند، این در حالی است که در یادگیری ماشین، این ویژگی ها باید به صورت دستی تعریف شوند.­

همانطور که در تصویر بالا نشان داده شده است، یادگیری عمیق به شکل زیر عمل میکند: در پایین ترین سطح، شبکه روی الگوهای کنتراست داخلی به عنوان موضوعی مهم تمرکز میکند. لایه بعدی قادر به استفاده از آن الگوهای کنتراست داخلی برای تمرکز روی چیزهایی که مشابه چشم ها، دماغ ها و دهان ها است. در آخر، لایه نهایی قادر به بکارگیری آن ویژگی های چهره در قالب های چهره است. یک شبکه عصبی عمیق قادر به ساخت ویژگی های پیچیده و پیچیده تری در هر یک از لایه های بعدی خود است.

آیا تا به حال این سوال برای شما پیش آمده است که فیسبوک چگونه به صورت خودکار تمامی افراد حاضر در یک تصویر آپلود شده توسط شما را لیبل و برچسب گذاری میکند؟ فیسبوک همچون مثال قبل که پیشتر ذکر شد از یادگیری عمیق استفاده میکند. قابلیت های یادگیری عمیق و اینکه چگونه در مواردی که از اثر یک سری از ویژگی ها بیخبر بوده ایم یادگیری عمیق توانسته از لحاظ عملکرد از یادگیری ماشین سبقت بگیرد از جمله مواردی هستنند که شاید تا به اکنون متوجه آنها شده باشید. ­

در نتیجه شبکه های عمیق میتوانند با بهره جویی از مجموع داده های شامل داده های ورودی فاقد برچسب گذاری مناسب، از پس نقاط ضعف یادگیری ماشین برآیند.

شبکه عصبی چیست؟

همانطور که از نام آن برمی آید، یادگیری عمیق زیرمجموعه ای از یادگیری ماشین است. یادگیری عمیق برای پرداختن به مشکلات یادگیری ماشین، بیشتر درگیر استفاده از شبکه های عصبی مصنوعی عمیق (الگوریتم ها/مدل های محاسباتی که تا حدودی از مغز انسان الهام گرفته اند) شده است.

حال سوالی که ذهن افراد را درگیر میکند این است که اصلا شبکه عصبی چیست و چه کاری در یادگیری عمیق انجام میدهد؟ به مقایسه زیر توجه کنید: شبکه ی عصبی را همچون یک سری درب که پشت سر یکدیگر قرار گرفته اند در نظر بگیرید و خود را به عنوان یک “ورودی” به شبکه عصبی موجود ببینید. هر زمان که یکی از این درب ها را باز میکنید، تبدیل به یک فرد جدید میشوید (به عبارت دیگر، به نحوی یک تغییر در شما اتفاق می افتد). و زمانی که به آخرین درب میرسید، به یک فرد کاملا متفاوت تبدیل شده اید. هنگامی که از درب آخر خارج میشوید، به “خروجی” شبکه عصبی تبدیل میشوید. در این مورد، هر یک از درب ها نشان دهنده ی یک لایه هستند. بنابراین یک شبکه عصبی مجموعه ای از لایه هایی است که به نحوی ورودی موردنظر را تغییر داده و به ایجاد خروجی پرداخته است.

هر یک از لایه های موجود در شبکه ی عصبی شامل “وزن ها” و “جهت گیری ها”ی خاص خود هستند – این موارد تنها اعدادی هستند که بر ورودی افزوده میشوند. عملکرد کلی شبکه های عصبی به این شکل است که تعدادی ورودی دریافت کرده (معمولا مجموعه ای از اعداد که نمایش دهنده ی چیزی هستند، به عنوان مثال، مقادیر قرمز-سبز-آبی پیکسل ها در یک تصویر)، با استفاده از وزن ها و جهت گیری های لایه های خود یک سری تغییرات محاسبه شده انجام داده و در نهایت یک خروجی را بیرون میدهد. در صورتی که قبلا یک سری کلاس جبر گذرانیده باشید میتوانید به این ورودی ها، خروجی ها و وزن ها به عنوان یک سری ماتریس نگاه کنید. ماتریس ورودی توسط یک سری ماتریس تغییر داده شده (به عبارت دیگر، ماتریس های وزن و جهت گیری های لایه مربوطه) و به خروجی شما تبدیل میشود. البته ذکر این نکته حائز اهمیت است که توصیف ارائه شده توضیحی بسیار ساده از نحوه عملکرد یک شبکه عصبی بوده و تنها برای فهم بهتر آن مطرح شده است.

یک شبکه عصبی عمیق تنها یک شبکه عصبی با تعداد لایه های زیاد است (با قرار دادن لایه ها روی یکدیگر، شبکه ی عصبی شما شروع به “عمیق تر” شدن میکند. ایده ی اولیه یادگیری عمیق، استفاده از شبکه های عصبی به همراه چندین لایه مختلف بوده است).

حال سوالی که مطرح میشود این است: شبکه ی عصبی چگونه یاد میگیرد؟ از طریق “پس انتشار. این واژه به روش معمول برای آموزش یک شبکه عصبی گفته میشود که در آن خروجی اولیه سیستم با خروجی دلخواه مقایسه شده و تا جایی که تفاوت بین آنها به حداقل برسد، سیستم مربوطه تنظیم میشود. همانطور که قبلا گفته شد شبکه های عصبی از لایه هایی تشکیل شده اند که وزن ها و جهت گیری های خاص خود (که تنها مجموعه ای از اعدادند) را شامل میشوند. در جریان فاز آموزش، شبکه های عصبی در جهت یافتن وزن ها/جهت گیری های درستی تلاش میکنند که قادر به ارائه ی دقیقترین خروجی ها باشند. این کار با استفاده از روشی تحت عنوان پس انتشار انجام میشود. پیش از آموزش دادن یک شبکه عصبی، وزن ها/ جهت گیری ها یا به صورت رندوم و یا با توجه به یک مدل آموزش دیده شده ی قبلی آماده سازی میشوند. در هر دو صورت هنگامی که آموزش صورت میگیرد، شبکه ی عصبی آن وزن ها و جهت گیری ها را با توجه به آنچه که “یاد میگیرد” تغییر میدهد. هنگامی که یک شبکه ی عصبی میسازیم، باید روی چیزی به عنوان تابع هزینه تصمیم گیری (به عبارت دیگر، انتخاب یا طراحی) کنیم. تابع هزینه اساسا به نوعی تابع ریاضی گفته میشود که خروجی را از یک شبکه ی عصبی (برای یک ورودی معین) و داده ی عینی (به عبارت دیگر، خروجی مورد انتظار از شبکه ی عصبی برای ورودی مشخص شده) دریافت و میزان غلط/بد بودن نتیجه حاصل از شبکه های عصبی را محاسبه میکند.

با استفاده از تکنیک های بهینه سازی همچون گرادیان کاهشی، کامپیوتر شما چگونگی تغییر وزن ها و جهت گیری ها را یاد میگیرد تا بدین شکل تابع هزینه را به حداقل برساند. اما گرادیان کاهشی به چه معناست؟ گرادیان کاهشی یک الگوریتم بهینه‌سازی مرتبه اول الگوریتم تکرار شونده است. برای یافتن کمینه محلی یک تابع با استفاده از این الگوریتم، گام‌هایی متناسب با منفی گرادیان (یا گرادیان تخمینی) تابع در محل فعلی برداشته خواهد شد. اگر در استفاده از این الگوریتم، گام‌هایی متناسب با جهت مثبت گرادیان برداشته شود، به بیشینه محلی تابع نزدیک می‌شویم که به این فرایند گرادیان افزایشی گفته می‌شود. سیستم مربوطه با یاد گرفتن با توجه به داده های بیشتر و بیشتر به انجام این کار ادامه میدهد (خروجی را از شبکه ی عصبی دریافت، هزینه را محاسبه و برای تغییر وزن ها کار “پس انتشار” را که پیشتر توضیح داده شد انجام میدهد). به مرور زمان، وزن ها و جهت گیری های سیستم با توجه به داده ها تنظیم میشوند و در آخر شبکه ای عصبی با دقت خروجی بالا در دست خواهید داشت. به یاد داشته باشید که کارایی عملی یا دقت یک شبکه عصبی تا حد زیادی به داده های استفاده شده برای آموزش آن وابسته است: بنابراین این موضوع بسیار حائزاهمیت است که بانک اطلاعاتی مجموع داده های شما به درستی ساخته یا انتخاب شده باشد. بدون وجود داده ی خوب (و میزان داده ی خوب) کار آموزش یک شبکه ی عصبی دقیق بسیار دشوار تمام خواهد شد.

به علاوه، تابع هزینه اساسا میزان عدم دقت شبکه ی عصبی مربوطه را اندازه گیری میکند؛ با به حداقل رساندن تابع هزینه به وسیله تغییر وزن ها/جهت گیری ها، شبکه ی عصبی شما از لحاظ عددی بسیار دقیقتر خواهد شد. با این حال، دقت شبکه عصبی وابسته به داده ای است که بر اساس آن آموزش داده میشود؛ بنابراین یک هزینه پایین ضرورتا به معنای یک شبکه ی عصبی آموزش دیده به قدر کافی نیست.

موارد کاربرد یادگیری عمیق

1. تشخیص صدا

شاید اسم سیری به گوش شما خورده باشد؛ سیری یک راهنمای هوشمند صوتی در محصولات شرکت اپل است. همچون سایر غول های بازار، شرکت اپل نیز روی یادگیری عمیق سرمایه گذاری کرده تا بدین شکل بتواند خدمات خود را با کیفیت بیشتری در مقایسه با گذشته ارائه کند. در زمینه تشخیص صدا و راهنمای هوشمند صدایی چون سیری، افراد میتوانند با استفاده از شبکه های عصبی عمیق مدلهای صوتی دقیقتری را بسازند. در حال حاضر این زمینه یکی از فعالترین زمینه ها برای بکارگیری یادگیری عمیق است. به بیان ساده، با کمک این تکنولوژی شما قادر به ساخت سیستمی هستید که میتواند ویژگی های جدید یاد بگیرد و یا با توجه به شما خود را تغییر دهد. بنابراین با پیش بینی تمام احتمالات از قبل، به نحو بهتری راهنمایی در اختیار شما قرار میگیرد.

2. ترجمه ماشینی خودکار

همه ما میدانیم که گوگل قادر به ترجمه فوری بین 100 زبان مختلف بوده و سرعت آن به قدری است که همچون یک معجزه به نظر می آید. تکنولوژی پشت گوگل ترنزلیت ترجمه ماشینی نامیده میشود و برای افرادی که به خاطر تفاوت زبانشان قادر به برقراری ارتباط با یکدیگر نبوده اند همچون یک نجات دهنده عمل کرده است. حال ممکن است که این سوال برایتان پیش آید: « این ویژگی برای مدت های زیادی است که وجود دارد، پس دیگر چه چیز جدیدی برای ارائه میتواند داشته باشد؟» در طول چند سال گذشته، گوگل با کمک یادگیری عمیق رویکرد موجود نسبت به ترجمه ماشینی را در گوگل ترنزلیت خود به کلی دگرگون کرد. ­در حقیقت پژوهشگران یادگیری عمیقی که تقریبا چیزی در مورد ترجمه ماشینی نمیدانند، با ارائه و بکارگیری راهکارهای یادگیری ماشینی ساده توانسته اند بهترین و پیشرفته ترین سیستم های ترجمه زبانی در جهان را شکست دهند. ترجمه متون در این سیستم ها بدون نیاز به پیش پردازش توالی متون انجام میگیرد و به الگوریتم ها اجازه میدهد که ارتباط بین کلمات و معادل آنها را در زبان جدید یاد بگیرند. شبکه های فشرده ای از شبکه های عصبی متناوب و بزرگ برای انجام این ترجمه لازم است.

3. ترجمه بصری فوری

همانطور که میدانید یادگیری عمیق برای مواردی چون تشخیص تصاویری که دارای حروف اند و یا در مکانهایی که حروف ­در یک صحنه حضور دارند استفاده میشود. به محض شناسایی، این تصاویر را میتوان به متن تبدیل و ترجمه کرد و تصاویری با متن ترجمه شده از نو ایجاد نمود. حال شرایطی را تصور کنید که به کشور دیگری که زبان آن را نمیدانید سفر کرده اید. هیچ جای نگرانی نیست! با استفاده از اپلیکیشن های مختلفی چون گوگل ترنزلیت میتوانید برای خواندن علامت ها و یا تابلوهای خرید نوشته شده به زبان دیگر به سرعت ترجمه بصری انجام دهید.

4. خودروهای بدون راننده و اتوماتیک

شرکت گوگل در تلاش است که با استفاده از یادگیری عمیق مقدمات ساخت خودروهای بدون راننده خود ﴿معروف به WAYMO﴾ را فراهم و به سطح جدیدی از تکامل برساند. بنابراین به جای استفاده از الگوریتم های کدگذاری شده به صورت دستی، افراد میتوانند سیستم را طوری برنامه ریزی کنند که با استفاده از داده های ارائه شده توسط سنسورهای مختلف به خودی خود همه چیز را یاد بگیرند. در حال حاضر یادگیری عمیق به عنوان بهترین رویکرد نسبت به اکثر عملیات های ادراکی و همچنین بسیاری از عملیات های کنترلی سطح-پایین تلقی میگردد. ­از این رو در حال حاضر حتی افرادی که رانندگی بلد نبوده و یا ناتوان از رانندگی هستند نیز میتوانند بدون نیاز به سایر افراد وسیله نقلیه خود را برانند.

موارد ذکر شده تنها برخی از موارد مطرح استفاده از یادگیری عمیق بوده است که در آنها از این تکنولوژی به صورت گسترده استفاده شده و نتایج مطلوبی به دست آمده است. در بسیاری از حوزه هایی که جای بررسی و تامل دارند، یادگیری عمیق کاربری های دیگری نیز دارد.

برگرفته از edureka و towardsdatascience

http://www.didarc.com/fa/news/deep-learning-mechanism

مزایای یادگیری عمیق برای صنعت امنیت

به دلیل استفاده ی گسترده از مانیتورینگ با وضوح بالا، در یک بازه ی زمانی کوتاه میزان داده های موردنیاز برای نظارت امنیتی به شکل قابل توجهی افزایش پیدا کرده است. جمع آوری کارآمد، تجزیه و تحلیل و بکارگیری داده ها و استفاده هوشمندانه از آنها بیشتر از هر زمان دیگری در این صنعت به موضوعی جدی تبدیل شده است.  بنابراین ارتقاء سطح هوشمندی ویدئویی، هدفی ناگزیر و همه گیر در این صنعت به نظر میرسد. کاربران امنیتی امیدوارند که سرمایه گذاری آنها روی محصولات جدید، مزایایی فراتر از دنباله روی و جستجوی ساده علایق افراد و جمع آوری شواهد پس از یک رخداد امنیتی برای آنها به ارمغان آورد. به جای آن نیاز به یافتن راه های چه بسا کارآمدتر که به نظارت اجازه ی گذار از جستجو پس از وقوع رخداد به هشدارهایی حین وقوع رخداد و یا حتی هشدارهایی پیش از وقوع رخداد به شدت احساس میشود. برای برآورده سازی این نیازها، تکنولوژی های جدیدی لازم است. نظارت ویدئویی هوشمند برای سالهای زیادی در دسترس بوده است. با این حال، نتایج بکارگیری آن چندان ایده آل واقع نشده است. ظهور یادگیری عمیق، امکان تحقق این نیازها را برآورده ساخته است.

عدم کفایت الگوریتم های هوشمند قدیمی

نظارت ویدئویی هوشمند قدیمی دارای الزامات بسیار دقیقی برای پس زمینه ی یک صحنه است. دقت شناسایی و تجزیه و تحلیل هوشمند در سناریوهای مشابه به صورت یکنواخت باقی نمی ماند.

ویژگی های موجود در الگوریتم های هوشمند قدیمی توسط انسانها طراحی شده اند و همیشه به شدت فردی بوده اند. ذات این سیستم های به گونه ای است که ویژگی های غیر شهودی تر (ویژگی هایی که فهم و توصیف آنها برای انسانها دشوارند) در آنها نادیده گرفته میشوند. در فرآیند یادگیری طبقه بندی، با بالا رفتن تعداد دسته های موجود برای طبقه بندی، سطح دشواری نیز بالا میرود.

الگوریتم های هوشمند قدیمی معمولا از مدلهای یادگیری سطحی برای حل و فصل شرایطی با میزان داده های بزرگ در طبقه بندی های پیچیده استفاده میکنند. نتایج این تجزیه و تحلیل با شرایط ایده آل بسیار فاصله دارد. از سوی دیگر، این نتایج مستقیما وسعت و عمق کاربری های هوشمند و پیشرفت بیشتر آنها را محدود میسازد. از این رو برای صنعت امنیت، نیاز به افزایش “عمق” هوشمندی در کلان داده ها در حال پدیدار شدن است.

مزایای یادگیری عمیق و الگوریتم های آن

الگوریتم های هوشمند قدیمی توسط انسانها طراحی شده اند. این سیستم ها چه در صورتی که خوب طراحی شده باشند و چه برعکس، تا حد زیادی وابسته به تجربه و حتی شانس هستند و این فرآیند نیازمند زمان بسیار زیادی است. بنابراین آیا میتوان با این ماشین ها کاری کرد که به صورت خودکار برخی از این ویژگی ها را یاد بگیرند؟ بله! در واقع این کار هدف هوش مصنوعی (AI﴾ است.
طرح تکنولوژی یادگیری عمیق از شبکه های عصبی مغز یک انسان الهام گرفته شده است. به مغز ما انسانها میتوان به چشم یک مدل یادگیری عمیق پیچیده نگاه کرد. شبکه های عصبی مغز متشکل از میلیاردها عصب به یکدیگر متصل هستند؛ یادگیری عمیق این ساختار را شبیه سازی میکند. این شبکه های چندلایه ای قادر به جمع آوری اطلاعات و انجام فعالیت های متناظر واز قابلیت تشخیص و بازآفرینی سوژه برخوردار هستند.

یادگیری عمیق به صورت ذاتی با الگوریتم های دیگر متفاوت است. نحوه ی حل و برطرف سازی عدم کفایت الگوریتم های سنتی توسط یادگیری عمیق در جنبه های ذیل گنجانده شده است.

نخست، از “سطحی” به “عمیق”

مدل الگوریتمی یادگیری عمیق از ساختار به مراتب عمیق تری نسبت به دو ساختار سه لایه ای الگوریتم های قدیمی برخوردار است. در برخی از موارد، تعداد لایه ها به بیش از یکصد میرسد که این موضوع یادگیری عمیق را قادر به پردازش حجم زیادی از داده در طبقه بندی های پیچیده میسازد. یادگیری عمیق بسیار مشابه فرآیند یادگیری انسان عمل میکند و دارای فرآیند تشخیص ویژگی لایه لایه است. یادگیری عمیق به ما کمک میکند تا فهم جزئی (سطحی) به یک تشخیص کلی (عمیق) تبدیل شده و بدین شکل سوژه موردنظر شناسایی شود.

دوم، از “ویژگی های مصنوعی” به “یادگیری ویژگی”

یادگیری عمیق نیازی به مداخله دستی ندارد، ولی در عوض برای استخراج ویژگی ها وابسته به یک کامپیوتر است. بدین شکل یادگیری عمیق میتواند بیشترین تعداد ویژگی های ممکن را از سوژه موردنظر استخراج کند؛ ویژگی های غیرشهودی که برای توصیف دشوار یا غیرممکن هستند از جمله این ویژگی ها محسوب میشوند. هر چه تعداد ویژگی ها بیشتر باشد، امر شناسایی و تشخیص دقیقتر خواهد بود.

فاکتورهای اصلی یادگیری عمیق

به صورت کلی سه دلیل عمده برای شهرت یافتن یادگیری عمیق در سالهای اخیر (چرا زودتر از آن این اتفاق نیافتاده است!) وجود دارد: مقیاس داده های موردنیاز، قدرت محاسبه و ساختار شبکه.

پیشرفتهای صورت گرفته در عملکرد الگوریتم های داده-محور در یک بازه ی زمانی بسیار کوتاه باعث تسریع نفوذ یادگیری عمیق در کاربری های هوشمند مختلف شده است. مخصوصا که با افزایش در مقیاس داده ها، عملکرد الگوریتمی نیز بهبود یافته است. از این رو تجربه ی کاربر بهبود یافته و کاربران بیشتری درگیر این موضوع شده اند که این کار خود باعث تسهیل بیشتر در مقیاس بزرگتری از داده ها شده است.

پلتفرم های سخت افزاری با عملکرد بالا باعث فعالسازی قدرت محاسباتی بیشتر میشوند. مدل یادگیری عمیق نیازمند تعداد نمونه های زیادی است که این موضوع انجام حجم زیادی از محاسبات را اجتناب ناپذیر میسازد. پیشرفت سریع واحدهای پردازش گرافیکی ﴿GPU﴾، سوپرکامپیوترها، محاسبات ابری و سایر پلتفرم های سخت افزاری با عملکرد بالا شرایط را برای ممکن شدن یادگیری عمیق فراهم نموده اند.

در آخر، ساختار شبکه نقش خود را در پیشرفت یادگیری عمیق ایفا میکند. با کمک بهینه سازی مداوم الگوریتم های یادگیری عمیق، تشخیص سوژه ی بهتری صورت میگیرد. برای کاربری های پیچیده تری چون تشخیص چهره و یا در سناریوهایی با نورپردازی، زوایا، حالت ها و عوامل متفاوت دیگر، ساختار شبکه دقت تشخیص را تحت تاثیر قرار خواهد داد.

موارد بکارگیری محصولات یادگیری عمیق

در دو سال گذشته، تکنولوژی یادگیری عمیق در زمینه هایی چون تشخیص صدا، بینایی رایانه ای یا کامپیوتر، ترجمه صوتی و بسیاری موارد دیگر به خوبی ظاهر شده است. این تکنولوژی در زمینه هایی چون تایید چهره و طبقه بندی تصاویر از قابلیت های انسانی نیز پیشی گرفته است؛ از این رو برای صنعت امنیت در زمینه هایی چون نظارت ویدئویی که کاربری هایی چون تشخیص چهره، تشخیص خودرو، تشخیص ویژگی بدن انسانی، دنباله روی چندین سوژه مختلف و سایر موارد را شامل میشود، به یادگیری عمیق توجه زیادی میشود.

این نوع از عملکردهای هوشمند به یک سری دوربین های نظارتی جلویی، سرورهای پشتی و دیگر محصولاتی نیازمندند که از الگوریتم های یادگیری عمیق پشتیبانی کنند. در کاربردهای با مقیاس کوچک، دوربین های جلویی میتوانند مستقیما کار استخراج ویژگی از یک انسان ساختارمند و وسیله نقلیه را انجام دهند و هزاران تصویر از چهره ی افراد را میتوان در دستگاه های جلویی ذخیره سازی کرد تا چهره ها به صورت مستقیم با یکدیگر مقایسه شوند و بدین شکل هزینه های برقراری ارتباط با سرور کاهش یابد. در کاربردهای با مقیاس بزرگ، دوربین های جلویی میتوانند با سرورهای پشتی کار کنند. مخصوصا اینکه کار ویدئویی ساختارمند به وسیله ی دستگاه های جلویی صورت میگیرد و بدینوسیله بار کاری دستگاه های پشتی کاهش می یابد؛ همچنین کارآمدی تطابق و جستجوی سرورهای پشتی ارتقاء پیدا میکند.

یادگیری عمیق سطح بعدی پیشرفت هوش مصنوعی است. این تکنولوژی بسیار فراتر از یادگیری ماشین عمل میکند؛ در یادگیری ماشین، کار طبقه بندی نظارت شده ی ویژگی ها و الگوها با کمک الگوریتم ها صورت میگیرد. دقت بهبودیافته نتیجه ی یادگیری چندلایه ای و جمع آوری گسترده داده ها است. بکارگیری این الگوریتم در تشخیص چهره، تشخیص وسیله نقلیه، تشخیص افراد و سایر پلتفرم ها باعث پیشرفت قابل توجه عملکردآنالیتیک ها خواهد شد.

منبع: مجله a&s

http://www.didarc.com/fa/news/how-deep-learning-benefits-the-security-industry