You are currently viewing راه حلی انعطاف پذیر که به هنرمندان کمک می کند انیمیشن را بهبود بخشند |  اخبار MIT

راه حلی انعطاف پذیر که به هنرمندان کمک می کند انیمیشن را بهبود بخشند | اخبار MIT


هنرمندانی که قهرمانان و تبهکاران را در کارتون ها و بازی های ویدیویی زنده می کنند، به لطف تکنیک جدیدی که توسط محققان MIT پیشگام شده است، می توانند کنترل بیشتری بر انیمیشن های خود داشته باشند.

روش آنها توابع ریاضی معروف به مختصات باری مرکزی را تولید می کند که تعیین می کند چگونه اشکال دو بعدی و سه بعدی می توانند در فضا خم شوند، کشیده شوند و حرکت کنند. به عنوان مثال، یک هنرمند با استفاده از ابزار خود می‌تواند ویژگی‌هایی را انتخاب کند که باعث می‌شود حرکات دم یک گربه سه بعدی با دید او نسبت به «نگاه» گربه متحرک مطابقت داشته باشد.

انیمیشن یک گربه آبی که در توری به دام افتاده است در حالی که دمش به پهلو می پیچد.
این گیف نشان می‌دهد که چگونه محققان از تکنیک خود برای ایجاد نرمی بیشتر دم گربه استفاده کردند.

تصویر: با حسن نیت از محققین

بسیاری از تکنیک‌های دیگر برای این مشکل انعطاف‌ناپذیر هستند و تنها یک گزینه برای توابع مختصات باریسنتریک برای یک شخصیت متحرک معین فراهم می‌کنند. هر ویژگی ممکن است برای یک انیمیشن خاص بهترین باشد یا نباشد. هنرمند باید هر بار که می خواهد ظاهر کمی متفاوت را امتحان کند، از ابتدا با رویکردی جدید شروع کند.

«به عنوان محقق، گاهی اوقات می‌توانیم در چرخه حل مشکلات هنری بدون مشورت با هنرمندان گیر کنیم. چیزی که هنرمندان به آن اهمیت می دهند تطبیق پذیری و “ظاهر” محصول نهایی خود است. آنها به معادلات دیفرانسیل جزئی که الگوریتم شما در پشت صحنه حل می کند اهمیتی نمی دهند.

فراتر از کاربردهای هنری، این تکنیک می تواند در زمینه هایی مانند تصویربرداری پزشکی، معماری، واقعیت مجازی و حتی در بینایی کامپیوتری به عنوان ابزاری برای کمک به ربات ها در درک نحوه حرکت اشیا در دنیای واقعی استفاده شود.

دودیک، یک دانشجوی فارغ التحصیل در رشته مهندسی برق و علوم کامپیوتر (EECS)، این مقاله را با اودد استاین، استادیار دانشکده مهندسی ویتربی در دانشگاه کالیفرنیای جنوبی نوشت. وینسنت سیتزمن، استادیار EECS، که رهبری گروه نمایش صحنه در آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) را بر عهده دارد. و نویسنده ارشد جاستین سولومون، دانشیار EECS و رهبر گروه پردازش داده هندسی CSAIL. این تحقیق اخیرا در SIGGRAPH آسیا ارائه شده است.

یک رویکرد کلی

هنگامی که یک هنرمند در حال انیمیشن یک شخصیت دو بعدی یا سه بعدی است، یک تکنیک رایج این است که شکل پیچیده شخصیت را با مجموعه ساده‌تری از نقاط که توسط بخش‌های خط یا مثلثی به نام سلول به هم متصل شده‌اند، احاطه کند. انیماتور این نقاط را می کشد تا شخصیت را به داخل قفس حرکت دهد و تغییر شکل دهد. مسئله فنی کلیدی تعیین نحوه حرکت شخصیت در هنگام تغییر قفس است. این حرکت با طراحی یک تابع مختصات باری مرکزی مشخص می شود.

روش‌های سنتی از معادلات پیچیده برای یافتن حرکات مبتنی بر سلول استفاده می‌کنند که بسیار نرم هستند، و از پیچ خوردگی‌هایی که ممکن است در صورت کشیده شدن یا خم شدن تا حد زیاد به شکلی ایجاد شوند، اجتناب می‌کنند. اما ایده های زیادی برای اینکه چگونه ایده هنری “صافی” به ریاضیات ترجمه می شود وجود دارد که هر کدام به مجموعه متفاوتی از توابع مختصات باری مرکزی منجر می شوند.

محققان MIT به دنبال یک رویکرد مشترک بودند که به هنرمندان اجازه می دهد در طراحی یا انتخاب بین انرژی های صاف برای هر شکل نظر داشته باشند. سپس هنرمند می‌تواند تار را بررسی کند و انرژی صافی را انتخاب کند که به سلیقه او بهترین است.

اگرچه طراحی انعطاف پذیر مختصات باریسنتریک یک ایده مدرن است، ساخت ریاضی پایه مختصات باری مرکزی به قرن ها قبل برمی گردد. مختصات باریسنتریک که توسط ریاضیدان آلمانی آگوست موبیوس در سال 1827 معرفی شد، چگونگی تأثیر هر گوشه یک شکل را بر درون شکل دیکته می کند.

در یک مثلث، که شکلی است که موبیوس در محاسبات خود استفاده می‌کند، مختصات باریسنتریک به راحتی قابل نمایش است – اما وقتی سلول مثلث نباشد، محاسبات به هم می‌ریزد. ایجاد مختصات باریسنتریک برای یک سلول پیچیده به ویژه دشوار است زیرا برای اشکال پیچیده، هر مختصات باریسنتریک باید مجموعه ای از محدودیت ها را برآورده کند در حالی که تا حد امکان صاف باشد.

با خروج از کار قبلی، تیم از نوع خاصی از شبکه عصبی برای مدل‌سازی توابع مختصات باریسنتریک ناشناخته استفاده کرد. یک شبکه عصبی مبتنی بر مغز انسان ورودی را با استفاده از لایه‌های زیادی از گره‌های به هم پیوسته پردازش می‌کند.

در حالی که شبکه های عصبی اغلب در برنامه های کاربردی هوش مصنوعی پیاده سازی می شوند که تفکر انسان را تقلید می کنند، در این پروژه از شبکه های عصبی به دلایل ریاضی استفاده می شود. معماری شبکه محققین می داند که چگونه توابع مختصات باریسنتریک را که دقیقاً با همه محدودیت ها مطابقت دارند استخراج کند. آنها محدودیت‌ها را مستقیماً در شبکه جاسازی می‌کنند تا وقتی راه‌حل‌هایی تولید می‌کند، همیشه معتبر باشند. این ساختار به هنرمندان کمک می کند تا بدون نگرانی در مورد جنبه های ریاضی مسئله، مختصات باریسنتریک جالبی را طراحی کنند.

بخش دشوار، ایجاد محدودیت‌ها بود. دودیک می‌گوید ابزارهای استاندارد ما را به آنجا نمی‌رساند، بنابراین ما واقعاً باید خارج از چارچوب فکر می‌کردیم.

مثلث های مجازی

محققان بر روی مختصات باری مرکزی مثلثی که توسط موبیوس تقریباً 200 سال پیش معرفی شد، تکیه کردند. محاسبه این مختصات مثلثی آسان است و تمام محدودیت های لازم را برآورده می کند، اما سلول های مدرن بسیار پیچیده تر از مثلث ها هستند.

روش محققین برای پر کردن شکاف، شکلی را با مثلث‌های مجازی همپوشانی می‌پوشاند که نقاط سه‌گانه را در بیرون سلول به هم متصل می‌کنند.

هر مثلث مجازی یک تابع مختصات باری مرکزی معتبر را تعریف می کند. ما فقط به راهی برای ترکیب آنها نیاز داریم.”

اینجاست که شبکه عصبی وارد می شود. این پیش‌بینی می‌کند که چگونه مختصات باری‌مرکزی مثلث‌های مجازی را برای ایجاد یک تابع پیچیده‌تر اما صاف ترکیب کنیم.

با استفاده از روش خود، یک هنرمند می تواند یک ویژگی را امتحان کند، به انیمیشن نهایی نگاه کند، و سپس مختصات را برای ایجاد حرکات مختلف تغییر دهد تا زمانی که به انیمیشنی برسد که آن طور که می خواهد به نظر برسد.

دودیک می‌گوید: «از نقطه‌نظر عملی، من فکر می‌کنم بیشترین تأثیر این است که شبکه‌های عصبی به شما انعطاف‌پذیری زیادی می‌دهند که قبلاً نداشتید».

محققان نشان دادند که چگونه روش آن‌ها می‌تواند انیمیشن‌های طبیعی‌تری نسبت به سایر روش‌ها ایجاد کند، مانند دم گربه که هنگام حرکت به‌آرامی پیچیده می‌شود، نه اینکه به‌طور صلب در نزدیکی رئوس سلول پیچیده شود.

در آینده، آنها می خواهند استراتژی های مختلفی را برای افزایش سرعت شبکه عصبی امتحان کنند. آنها همچنین می خواهند این روش را در یک رابط تعاملی بسازند که به هنرمند اجازه می دهد انیمیشن ها را به راحتی در زمان واقعی تکرار کند.

این تحقیق تا حدی توسط دفتر تحقیقات ارتش ایالات متحده، دفتر تحقیقات نیروی هوایی ایالات متحده، بنیاد ملی علوم ایالات متحده، CSAIL Systems that Learn Program، MIT-IBM Watson AI Lab، Toyota-CSAIL Joint Research Center، Adobe Systems، یک تحقیق گوگل تامین شده است. جایزه، آژانس علوم و فناوری دفاع سنگاپور و مرکز علمی آمازون.



Source link