954
Програма самозахисту від Disney Research для розпізнавання шаблонів
Група дослідників з підрозділу Пітсбургів Disney Research розробила комп'ютерну систему зору, яка використовує деякі принципи людського бачення (pdf). Зокрема, містить алгоритми самооцінки та можуть покращити розпізнавання об’єктів за часом.
Як і більшість комп'ютерних систем зору, Дісней дослідний будує концептуальну модель для кожного об'єкта, чи є літаком або милом дозатором. Цей алгоритм аналізує багато фотографій об'єкта.
Відмінною особливістю алгоритму дослідження Дісней є те, що він згодом використовує цю модель для розпізнавання об'єктів у відео, при цьому вилучення нової інформації про ці об'єкти і доповнення моделі спочатку укладено вниз. Це дозволяє розпізнати об'єкти в більш широкому діапазоні, навіть якщо вони відрізняються від попередніх зразків.
Ілюстрації (застібка) показують результат розпізнавання шаблонів. У верхньому рядку є тестові зображення з бази даних ImageNet, які були використані для тренування оригінальної моделі. У нижньому рядку є приклади визначення об'єкта IDE-LME програми. Дослідники відзначають, що визнані предмети у фотографіях значно відрізняються за зовнішнім виглядом від тих, хто використовується для тренування системи.
«Продовжується процес [самперед], потенційно невизначений, протягом усього життя системи розпізнавання», - розповідає Леонід Сігал, провідний науковий співробітник компанії Disney Research Пітсбург. Це система самозахисту, яка безперервно розвивається через неконтрольований досвід, складаючи все більш повну і складну модель світу.
Концептуальна модель для кожного об'єкта поступово розширюється і рафінована як система зустрічається з новою інформацією. Теоретично, цей метод може привести до того, що, вчинивши без нагляду, система охарактеризується об'єктом незвичайних характеристик для нього, що призведе до помилки розпізнавання. Але автори програми говорять, що така проблема ще не помітила.
Крім Сігалу, серед авторів наукової роботи Аліна Кузнецова (Alina Kuznetsova), Бод Розенгань (Bodo Rosenhahn) з університету Вільгельм Лейбніз (Гановер, Німеччина) та колишнього працівника Дісней Сен Хван Ю (Сунг Ю Хванг), тепер працює в Національному інституті науки і техніки Ульсан (Південна Корея).
У статті представлено на конференції з питань комп’ютерного бачення та розпізнавання шаблонів у Бостоні (Червень 7-12, 2015).
Джерело: geektimes.ru/post/251720/