هنرمندانی که قهرمانان و تبهکاران را در کارتون ها و بازی های ویدیویی زنده می کنند، به لطف تکنیک جدیدی که توسط محققان MIT پیشگام شده است، می توانند کنترل بیشتری بر انیمیشن های خود داشته باشند.
روش آنها توابع ریاضی معروف به مختصات باری مرکزی را تولید می کند که تعیین می کند چگونه اشکال دو بعدی و سه بعدی می توانند در فضا خم شوند، کشیده شوند و حرکت کنند. به عنوان مثال، یک هنرمند با استفاده از ابزار خود میتواند ویژگیهایی را انتخاب کند که باعث میشود حرکات دم یک گربه سه بعدی با دید او نسبت به «نگاه» گربه متحرک مطابقت داشته باشد.
![انیمیشن یک گربه آبی که در توری به دام افتاده است در حالی که دمش به پهلو می پیچد.](https://news.mit.edu/sites/default/files/images/inline/MIT-Barycentric-Coordinates-cat.gif)
تصویر: با حسن نیت از محققین
بسیاری از تکنیکهای دیگر برای این مشکل انعطافناپذیر هستند و تنها یک گزینه برای توابع مختصات باریسنتریک برای یک شخصیت متحرک معین فراهم میکنند. هر ویژگی ممکن است برای یک انیمیشن خاص بهترین باشد یا نباشد. هنرمند باید هر بار که می خواهد ظاهر کمی متفاوت را امتحان کند، از ابتدا با رویکردی جدید شروع کند.
«به عنوان محقق، گاهی اوقات میتوانیم در چرخه حل مشکلات هنری بدون مشورت با هنرمندان گیر کنیم. چیزی که هنرمندان به آن اهمیت می دهند تطبیق پذیری و “ظاهر” محصول نهایی خود است. آنها به معادلات دیفرانسیل جزئی که الگوریتم شما در پشت صحنه حل می کند اهمیتی نمی دهند.
فراتر از کاربردهای هنری، این تکنیک می تواند در زمینه هایی مانند تصویربرداری پزشکی، معماری، واقعیت مجازی و حتی در بینایی کامپیوتری به عنوان ابزاری برای کمک به ربات ها در درک نحوه حرکت اشیا در دنیای واقعی استفاده شود.
دودیک، یک دانشجوی فارغ التحصیل در رشته مهندسی برق و علوم کامپیوتر (EECS)، این مقاله را با اودد استاین، استادیار دانشکده مهندسی ویتربی در دانشگاه کالیفرنیای جنوبی نوشت. وینسنت سیتزمن، استادیار EECS، که رهبری گروه نمایش صحنه در آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) را بر عهده دارد. و نویسنده ارشد جاستین سولومون، دانشیار EECS و رهبر گروه پردازش داده هندسی CSAIL. این تحقیق اخیرا در SIGGRAPH آسیا ارائه شده است.
یک رویکرد کلی
هنگامی که یک هنرمند در حال انیمیشن یک شخصیت دو بعدی یا سه بعدی است، یک تکنیک رایج این است که شکل پیچیده شخصیت را با مجموعه سادهتری از نقاط که توسط بخشهای خط یا مثلثی به نام سلول به هم متصل شدهاند، احاطه کند. انیماتور این نقاط را می کشد تا شخصیت را به داخل قفس حرکت دهد و تغییر شکل دهد. مسئله فنی کلیدی تعیین نحوه حرکت شخصیت در هنگام تغییر قفس است. این حرکت با طراحی یک تابع مختصات باری مرکزی مشخص می شود.
روشهای سنتی از معادلات پیچیده برای یافتن حرکات مبتنی بر سلول استفاده میکنند که بسیار نرم هستند، و از پیچ خوردگیهایی که ممکن است در صورت کشیده شدن یا خم شدن تا حد زیاد به شکلی ایجاد شوند، اجتناب میکنند. اما ایده های زیادی برای اینکه چگونه ایده هنری “صافی” به ریاضیات ترجمه می شود وجود دارد که هر کدام به مجموعه متفاوتی از توابع مختصات باری مرکزی منجر می شوند.
محققان MIT به دنبال یک رویکرد مشترک بودند که به هنرمندان اجازه می دهد در طراحی یا انتخاب بین انرژی های صاف برای هر شکل نظر داشته باشند. سپس هنرمند میتواند تار را بررسی کند و انرژی صافی را انتخاب کند که به سلیقه او بهترین است.
اگرچه طراحی انعطاف پذیر مختصات باریسنتریک یک ایده مدرن است، ساخت ریاضی پایه مختصات باری مرکزی به قرن ها قبل برمی گردد. مختصات باریسنتریک که توسط ریاضیدان آلمانی آگوست موبیوس در سال 1827 معرفی شد، چگونگی تأثیر هر گوشه یک شکل را بر درون شکل دیکته می کند.
در یک مثلث، که شکلی است که موبیوس در محاسبات خود استفاده میکند، مختصات باریسنتریک به راحتی قابل نمایش است – اما وقتی سلول مثلث نباشد، محاسبات به هم میریزد. ایجاد مختصات باریسنتریک برای یک سلول پیچیده به ویژه دشوار است زیرا برای اشکال پیچیده، هر مختصات باریسنتریک باید مجموعه ای از محدودیت ها را برآورده کند در حالی که تا حد امکان صاف باشد.
با خروج از کار قبلی، تیم از نوع خاصی از شبکه عصبی برای مدلسازی توابع مختصات باریسنتریک ناشناخته استفاده کرد. یک شبکه عصبی مبتنی بر مغز انسان ورودی را با استفاده از لایههای زیادی از گرههای به هم پیوسته پردازش میکند.
در حالی که شبکه های عصبی اغلب در برنامه های کاربردی هوش مصنوعی پیاده سازی می شوند که تفکر انسان را تقلید می کنند، در این پروژه از شبکه های عصبی به دلایل ریاضی استفاده می شود. معماری شبکه محققین می داند که چگونه توابع مختصات باریسنتریک را که دقیقاً با همه محدودیت ها مطابقت دارند استخراج کند. آنها محدودیتها را مستقیماً در شبکه جاسازی میکنند تا وقتی راهحلهایی تولید میکند، همیشه معتبر باشند. این ساختار به هنرمندان کمک می کند تا بدون نگرانی در مورد جنبه های ریاضی مسئله، مختصات باریسنتریک جالبی را طراحی کنند.
بخش دشوار، ایجاد محدودیتها بود. دودیک میگوید ابزارهای استاندارد ما را به آنجا نمیرساند، بنابراین ما واقعاً باید خارج از چارچوب فکر میکردیم.
مثلث های مجازی
محققان بر روی مختصات باری مرکزی مثلثی که توسط موبیوس تقریباً 200 سال پیش معرفی شد، تکیه کردند. محاسبه این مختصات مثلثی آسان است و تمام محدودیت های لازم را برآورده می کند، اما سلول های مدرن بسیار پیچیده تر از مثلث ها هستند.
روش محققین برای پر کردن شکاف، شکلی را با مثلثهای مجازی همپوشانی میپوشاند که نقاط سهگانه را در بیرون سلول به هم متصل میکنند.
هر مثلث مجازی یک تابع مختصات باری مرکزی معتبر را تعریف می کند. ما فقط به راهی برای ترکیب آنها نیاز داریم.”
اینجاست که شبکه عصبی وارد می شود. این پیشبینی میکند که چگونه مختصات باریمرکزی مثلثهای مجازی را برای ایجاد یک تابع پیچیدهتر اما صاف ترکیب کنیم.
با استفاده از روش خود، یک هنرمند می تواند یک ویژگی را امتحان کند، به انیمیشن نهایی نگاه کند، و سپس مختصات را برای ایجاد حرکات مختلف تغییر دهد تا زمانی که به انیمیشنی برسد که آن طور که می خواهد به نظر برسد.
دودیک میگوید: «از نقطهنظر عملی، من فکر میکنم بیشترین تأثیر این است که شبکههای عصبی به شما انعطافپذیری زیادی میدهند که قبلاً نداشتید».
محققان نشان دادند که چگونه روش آنها میتواند انیمیشنهای طبیعیتری نسبت به سایر روشها ایجاد کند، مانند دم گربه که هنگام حرکت بهآرامی پیچیده میشود، نه اینکه بهطور صلب در نزدیکی رئوس سلول پیچیده شود.
در آینده، آنها می خواهند استراتژی های مختلفی را برای افزایش سرعت شبکه عصبی امتحان کنند. آنها همچنین می خواهند این روش را در یک رابط تعاملی بسازند که به هنرمند اجازه می دهد انیمیشن ها را به راحتی در زمان واقعی تکرار کند.
این تحقیق تا حدی توسط دفتر تحقیقات ارتش ایالات متحده، دفتر تحقیقات نیروی هوایی ایالات متحده، بنیاد ملی علوم ایالات متحده، CSAIL Systems that Learn Program، MIT-IBM Watson AI Lab، Toyota-CSAIL Joint Research Center، Adobe Systems، یک تحقیق گوگل تامین شده است. جایزه، آژانس علوم و فناوری دفاع سنگاپور و مرکز علمی آمازون.