گوگل اقدام به انتشار پایگاه داده بصری عظیمی برای یادگیری ماشینی نمود
همه روزه شاهد اخبار جدید و پیشرفت های غیرمنتظره ای در حوزه یادگیری ماشینی هستیم، اما این کار چندان ساده هم نمی باشد و به منظور سازگاری بهتر الگوریتم هایی که به تشخیص و پیش بینی الگوهایی در داده ها می پردازند، لازم است تا حجم عظیمی از اطلاعات را در اختیار داشته باشید تا این الگوریتم ها به عنوان منبع یادگیری از آنها استفاده کنند. اما خبر خوشحال کننده انتشار دو آرشیو از سوی گوگل است که در این راه به کمک محققین خواهند آمد. این منبع در کنار high-quality datasets ،Open Images و YouTube8-M ارائه دهنده میلیون ها لینک تشریحی است و محققین می توانند اقدام به آموزش عملیات مبنی بر این اطلاعات نمایند.
مجموعه Open Images نتیجه یک همکاری بین گوگل و Carnegie Mellon and Cornell بوده و شامل 9 میلیون ورودی است که ابتدا با استفاده از کامپیوترها تگ گذاری شده و سپس توسط افراد اعتبارسنجی و اصلاح شده اند. تیم تحقیقاتی گوگل بیان می دارد که آنها از تصاویر کافی جهت آموزش شبکه عصبی از پایه برخوردارند، در نتیجه چنانچه مایل به کار بر روی پروژه ای مشابه DeepDream، نسخه بهتری از Google Photos و یا Prisma بعدی هستید، اساس کار برای شما مهیا شده است.
از طرفی YouTube8-M دربرگیرنده 8 میلیون ویدیو است و به بیان گروه سازنده، در مقایسه با مجموعه داده های کنونی ارائه دهنده افزایش چشمگیری در مقیاس و تنوع می باشد. ایده اصلی ساخت یک کتابخانه برای تجزیه و تحلیل ویدیو است که عملکرد بهتری نسبت به آنهایی که برای تصاویر ثابت وجود دارند، به نمایش گذاشته و در دسترس افرادی که فاقد کلان داده اند نیز قرار گیرد. گوگل بخشی از تصاویر ثابت را از ویدیوها استخراج و تگ گذاری کرده و محققین قادر به دانلود آنها می باشند. چنانچه شما نیز در این زمینه علاقه مندی هایی دارید می توانید از طریق این لینک اقدام به دانلود پایگاه داده مذکور نمایید.