کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6864585 | 1439545 | 2018 | 37 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Watch fashion shows to tell clothing attributes
ترجمه فارسی عنوان
سازمان دیده بان نشان می دهد مد به ویژگی های لباس
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
یادگیری بی نظیر، ویژگی لباس، شبکه عصبی سه گانه، نیمه نظارت، نمایش مد،
ترجمه چکیده
در این مقاله، ما یک روش نیمه نظارت جدید برای پیش بینی ویژگی های لباس با کمک داده های بدون برچسب، مانند نمایش مد، پیشنهاد می کنیم. برای این منظور، یک چارچوب دو مرحلهای ساخته شده است، یعنی مرحله قبل از آموزش شبکه سه گانه بدون نظارت، که کادرها را در همان ویدیو با داشتن نمایههای یکپارچه تضمین میکند، در حالی که فریمهایی از فیلمهای مختلف دارای فاصلههای بزرگتر از ویژگیها و مرحله پیشبینی صفات نظارت شده به تخمین ارزش مشخصه ها. به طور خاص، ابتدا لباس فریم ها را در جمع آوری 18،737 مد نشان می دهد که زنان و 21،224 مد نشان می دهد که حاوی برچسب اضافی نیستند. سپس یک شبکه عصبی سه گانه ساخته می شود که از طریق تعبیه سازگاری ظاهری بین فریم ها در همان ویدئو و شکاف نمایندگی در ویدیوهای مختلف ساخته شده است. در نهایت، ما پارامترهای مدل سه گانه را به مدل پیش بینی ویژگی های لباس چند منظوره انتقال می دهیم و آن را با تصاویر لباس هایی که دارای برچسب های صفت هستند، تنظیم می کنیم. آزمایش های گسترده نشان می دهد مزایای روش پیشنهادی در دو مجموعه داده های لباس.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
In this paper, we propose a novel semi-supervised method to predict clothing attributes with the assistance of unlabeled data like fashion shows. To this end, a two-stage framework is built, i.e., the unsupervised triplet network pre-training stage that ensures frames in the same video having coherent representations while frames from different videos having larger feature distances, and a supervised clothing attribute prediction stage to estimate the value of attributes. Specifically, we first detect the clothes of frames in the collected 18,737 female fashion shows and 21,224 male fashion shows which contain no extra labels. Then a triplet neural network is constructed via embedding the temporal appearance consistency between frames in the same video and the representation gap in different videos. Finally, we transfer the triplet model parameters to multi-task clothing attribute prediction model, and fine-tune it with clothing images holding attribute labels. Extensive experiments demonstrate the advantages of the proposed method on two clothing datasets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 282, 22 March 2018, Pages 98-110
Journal: Neurocomputing - Volume 282, 22 March 2018, Pages 98-110
نویسندگان
Sanyi Zhang, Si Liu, Xiaochun Cao, Zhanjie Song, Jie Zhou,