»ó¼¼Á¤º¸
¸ðµÎ¸¦ À§ÇÑ ¸ÞŸ·¯´×
- ÀúÀÚ
- Á¤Ã¢ÈÆ, À̽ÂÇö, À̵¿¹Î, À强Àº, À̽ÂÀç, À±½ÂÁ¦
- ÃâÆÇ»ç
- À§Å°ºÏ½º
- ÃâÆÇÀÏ
- 2023-01-31
- µî·ÏÀÏ
- 2023-04-19
- ÆÄÀÏÆ÷¸Ë
- AUDIO
- ÆÄÀÏÅ©±â
- 0
- °ø±Þ»ç
- ºÏÅ¥ºê
- Áö¿ø±â±â
-
PC
PHONE
TABLET
ÇÁ·Î±×·¥ ¼öµ¿¼³Ä¡
ºä¾îÇÁ·Î±×·¥ ¼³Ä¡ ¾È³»
Ã¥¼Ò°³
ÁöµµÇнÀ°ú °ÈÇнÀÀ» À§ÇÑ ÃֽŠ±â¼ú ¸ÞŸ·¯´×À» ÀÌÇØÇÏÀÚ!
ÀÌ Ã¥Àº ÃÖ±Ù ÀΰøÁö´É°ú ¸Ó½Å·¯´× ºÐ¾ß¿¡¼ °¢±¤¹Þ°í ÀÖ´Â ¸ÞŸ·¯´×¿¡ ´ëÇÑ ÀÔ¹® ¼ÀûÀÔ´Ï´Ù. µ¶ÀÚ ¿©·¯ºÐ²²¼ ´Ù¼Ò »ý¼ÒÇÒ ¼ö ÀÖ´Â ¸ÞŸ·¯´×¿¡ ´ëÇÑ °³³äÀ» ÀÌÇØÇÏ°í ½ÇÁ¦·Î ¼¼ºÎ ¾Ë°í¸®Áòµé±îÁö ±¸ÇöÇغ¸´Â ±âȸ¸¦ Á¦°øÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÕ´Ï´Ù. ƯÈ÷ ¸ÞŸ·¯´×¿¡¼ ȸ±Í ¹®Á¦, ºÐ·ù ¹®Á¦¸¦ ´Ù·ç´Â ¸ÞŸ ÁöµµÇнÀ»Ó ¾Æ´Ï¶ó, °ÈÇнÀÀ» ¼Ò°³ÇÏ°í ÀÌ¿¡ ´ëÇØ ¸ÞŸ·¯´×À» Àû¿ëÇÑ ¸ÞŸ °ÈÇнÀ±îÁö ½Éµµ ÀÖ°Ô ´Ù·ç´Â °ÍÀÌ ÀÌ Ã¥ÀÇ Å« ÀåÁ¡ÀÔ´Ï´Ù. óÀ½¿¡´Â ´Ù¼Ò »ý¼ÒÇÒ ¼ö ÀÖÁö¸¸, ²ÙÁØÈ÷ ÀÌ Ã¥À» ¹Ýº¹Çؼ ÀÐ°í ½Ç½ÀÇÏ¸é ¸ÚÁø ÃֽŠ¸Ó½Å·¯´× ±â¼úÀÎ ¸ÞŸ·¯´×À» ÇÑÃþ ±íÀÌ ÀÌÇØÇÒ ¼ö ÀÖÀ» °ÍÀÔ´Ï´Ù.
¡Ú ÀÌ Ã¥¿¡¼ ¹è¿ì´Â ³»¿ë ¡Ú
¡Ý ¾Æ³ªÄÜ´Ù ¼³Ä¡¿Í È°¿ë, PyTorch ¹× Torchmeta ¶óÀ̺귯¸® È°¿ë
¡Ý ¸Ó½Å·¯´×¿¡¼ÀÇ ¸ÞŸ·¯´×ÀÇ °³³ä
¡Ý ¸ÞŸ ÁöµµÇнÀÀÇ °³³ä ¹× ¿©·¯ ¾Ë°í¸®Áò ¼Ò°³
¡Ý ±âº» °ÈÇнÀ °³¿ä
¡Ý ¸ÞŸ °ÈÇнÀÀÇ °³³ä ¹× ¿©·¯ ¾Ë°í¸®Áò ¼Ò°³
¡Ý ¿ÀÇÂ縰Áö¿Í ¸ÞŸ·¯´× ¾ÖÇø®ÄÉÀ̼Ç
ÀúÀÚ¼Ò°³
Á¤Ã¢ÈÆ
µ¿±¹´ëÇб³¿¡¼ ÄÄÇ»ÅÍ°øÇÐÀ» Àü°øÇÏ°í ¼¿ï´ëÇб³ ÄÄÇ»ÅÍ°øÇкο¡¼ ¹Ú»ç°úÁ¤ Áß¿¡ ÀÖ½À´Ï´Ù. ¸ÞŸ·¯´×À» ¿¬±¸ÇÏ°í, ÃÖ±Ù¿¡´Â ¸ÞŸ °ÈÇнÀ, ¿ÀÇÁ¶óÀÎ °ÈÇнÀ¿¡ °ü½ÉÀ» °¡Áö°í ¿¬±¸ÇÏ°í ÀÖ½À´Ï´Ù.
À̽ÂÇö
Çö´ëÁß°ø¾÷¿¡¼ ¼³°è ¿£Áö´Ï¾î·Î ÀÏÇßÀ¸¸ç ÇöÀç Æ÷Ç×°ø°ú´ëÇб³ ITÀ¶ÇÕ°øÇп¡¼ ¹Ú»ç°úÁ¤ Áß¿¡ ÀÖ½À´Ï´Ù. ÇÐÀ§ÁÖÁ¦·Î ÀÇ·áºÐ¾ß¿¡¼ÀÇ È¯ÀÚ °³ÀÎÈ ¹× Ä¡·á ÀÚµ¿È ÀΰøÁö´ÉÀ» ¿¬±¸ÇØ¿ÔÀ¸¸ç, ÃÖ±Ù¿¡´Â ÆÄ¿îµ¥ÀÌ¼Ç ¸ðµ¨ÀÇ ÀÓ»óÀû Àû¿ë¿¡ °ü½ÉÀ» °¡Áö°í ¿¬±¸ ÁßÀÔ´Ï´Ù.
À̵¿¹Î
ÇѾç´ëÇб³¿¡¼ ÄÄÇ»ÅÍ°øÇÐÀ» Àü°øÇßÀ¸¸ç, ÀÌÈÄ¿¡ ¼¿ï´ëÇб³ ·Îº¿ ÇнÀ ¿¬±¸½Ç, ¹ÙÀÌ¿ÀÁö´É ¿¬±¸½Ç¿¡¼ ¸Ó½Å·¯´×¿¡ °üÇÑ ´Ù¾çÇÑ ¿¬±¸ °æÇèÀ» ½×¾Ò½À´Ï´Ù. ÇöÀç´Â ¸¶Å°³ª¶ô½º¿¡¼ ¸Ó½Å·¯´× ¿£Áö´Ï¾î·Î¼ ½ÇÁ¦ ¹®Á¦¿¡ ML ±â¼ú°ú MLOps ±â¼úÀ» Àû¿ëÇÏ´Â µ¥¿¡ ¸¹Àº °ü½ÉÀ» °¡Áö°í ÀÖ½À´Ï´Ù.
À强Àº
µ¿±¹´ëÇб³¿¡¼ ÀÇ»ý¸í°øÇÐ Çлç, ÄÄÇ»ÅÍ°øÇÐ Çлç/¼®»ç ÇÐÀ§¸¦ ¹Þ¾Ò½À´Ï´Ù. ÇöÀç´Â ¼¿ï´ëÇб³ Çùµ¿°úÁ¤ »ý¹°Á¤º¸ÇÐÀü°ø ¹Ú»ç°úÁ¤¿¡¼ ¸ÞŸ·¯´×À» Æ÷ÇÔÇÑ ´Ù¾çÇÑ ¸Ó½Å·¯´× ±â¼úÀ» ÅëÇØ »ý¹°ÇÐ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ´Â ¿¬±¸¸¦ ¼öÇàÇÏ°í ÀÖ½À´Ï´Ù. ÀÌ Ã¥ÀÇ ±Û ¹× ÄÚµå °³¹ß°ú ÇÔ²² »ðÈ ÀÛ¾÷À» µµ¸Ã¾Æ ÁøÇàÇß½À´Ï´Ù.
À̽ÂÀç
ÇÁ¸°½ºÅÏ ´ëÇб³¿¡¼ ¼öÇÐÀ» Àü°øÇß½À´Ï´Ù. ÇöÀç ºí·ë¹ö±×¿¡¼ ¾ð¾î¸ðµ¨ °³¹ß ¹× »ó¿ëÈ ¾÷¹«¸¦ ¸Ã°í ÀÖ½À´Ï´Ù.
À±½ÂÁ¦
¾ÆÁÖ´ëÇб³¿¡¼ ±â°è°øÇÐÀ» Àü°øÇß°í, KAIST Á¶Ãµ½Ä ¸ðºô¸®Æ¼ ´ëÇпø¿¡¼ ¼®»ç°úÁ¤ µ¿¾È Â÷·® °Åµ¿ ¿¹Ãø°ú ¸ðµ¨ ¿¹Ãø Á¦¾î(model predictive control) µîÀ» ¿¬±¸Çß½À´Ï´Ù. ¸ð¶óÀÌ¿¡¼ ÀνÄ(perception) ÆÄÆ®¸¦ ¸Ã¾ÒÀ¸¸ç, ÇöÀç ´ººô¸®Æ¼ ÀÚÀ²ÁÖÇà ÆÀ¿¡ ¼Ò¼ÓµÇ¾î ÀÖ½À´Ï´Ù.
¡´°¨¼öÀÚ ¼Ò°³¡µ
ÃÖ¼ºÁØ
¼¿ï´ëÇб³ Àü±âÄÄÇ»ÅÍ°øÇаú¿¡¼ Çлç/¹Ú»ç ÇÐÀ§¸¦ ¹Þ¾Ò½À´Ï´Ù. Ä«Ä«¿Àºê·¹Àΰú µðÁî´Ï ¸®¼Ä¡¸¦ °ÅÃÄ °í·Á´ëÇб³ ÀΰøÁö´ÉÇаú Á¶±³¼ö·Î ÀÏÇÏ°í ÀÖ½À´Ï´Ù.
¸ñÂ÷
¢Ã 1Àå: ¸ÞŸ·¯´× °³¿ä
1.1 ¸Ó½Å·¯´×°ú µö·¯´×
1.2 ¸ÞŸ·¯´×À̶õ?
1.3 ¸ÞŸ·¯´× ÇнÀ ȯ°æ ±¸Ãà
___1.3.1 ¾Æ³ªÄÜ´Ù ¼³Ä¡¿Í »ç¿ë
___1.3.2 ¾Æ³ªÄÜ´Ù ¼³Ä¡
___1.3.3 ±êÇãºê ÀúÀå¼Ò Ŭ·Ð ¹× ȯ°æ ±¸Ãà
¢Ã 2Àå: ¸ÞŸ ÁöµµÇнÀ
2.1 ¸ÞŸ·¯´× ¹®Á¦ Á¤ÀÇ
___2.1.1 ŽºÅ© Á¤ÀÇ
___2.1.2 ¸ÞŸ·¯´× µ¥ÀÌÅͼÂ
___2.1.3 ¸ÞŸ·¯´×
___2.1.4 ½Ç½À: Torchmeta ¶óÀ̺귯¸® ¼Ò°³
2.2 ¸ðµ¨ ±â¹Ý ¸ÞŸ·¯´×
___2.2.1 ¸ðµ¨ ±â¹Ý ¸ÞŸ·¯´×ÀÇ ÇÙ½É °³³ä
___2.2.2 NTM(Neural Turing Machines)
___2.2.3 MANN(Memory-Augmented Neural Networks)
___2.2.4 ½Ç½À: MANN ±¸Çö
___2.2.5 SNAIL(Simple Neural Attentive Meta-Learner)
___2.2.6 ½Ç½À: SNAIL ±¸Çö
2.3 ÃÖÀûÈ ±â¹Ý ¸ÞŸ·¯´×
___2.3.1 ÀüÀÌÇнÀ°ú ÃÖÀûÈ ±â¹Ý ¸ÞŸ·¯´×
___2.3.2 MAML°ú FOMAML
___2.3.3 ½Ç½À: MAML-Regression
___2.3.4 ½Ç½À: MAML-Classification
2.4 ¸ÞÆ®¸¯ ±â¹Ý ¸ÞŸ·¯´×
___2.4.1 KNN°ú ¸ÞÆ®¸¯ ±â¹Ý ¸ÞŸ·¯´×
___2.4.2 Matching ³×Æ®¿öÅ©
___2.4.3 ½Ç½À: Matching ³×Æ®¿öÅ© ±¸Çö
___2.4.4 Prototypical ³×Æ®¿öÅ©
___2.4.5 ½Ç½À: Prototypical ³×Æ®¿öÅ© ±¸Çö
2.5 ¸ÞŸ·¯´× ¾Ë°í¸®Áò ¼Ó¼º°ú Àå´ÜÁ¡
___2.5.1 ¸ÞŸ·¯´× ¾Ë°í¸®ÁòÀÇ ¼¼ °¡Áö ¼Ó¼º
___2.5.2 ¸ÞŸ·¯´× ¾Ë°í¸®Áò ºñ±³
¢Ã 3Àå: °ÈÇнÀ °³¿ä
3.1 ¸¶¸£ÄÚÇÁ °áÁ¤ °úÁ¤, Á¤Ã¥, °¡Ä¡ÇÔ¼ö
___3.1.1 ¸¶¸£ÄÚÇÁ °áÁ¤ °úÁ¤
___3.1.2 Á¤Ã¥°ú °ÈÇнÀÀÇ ¸ñÇ¥
___3.1.3 °¡Ä¡ ÇÔ¼ö
3.2 ŽÇè°ú È°¿ë
3.3 °ÈÇнÀ ¾Ë°í¸®ÁòÀÇ Á¾·ù
___3.3.1 On-policy¿Í Off-policy
___3.3.2 Á¤Ã¥ ±â¹Ý ¾Ë°í¸®Áò
___3.3.3 °¡Ä¡ ±â¹Ý ¾Ë°í¸®Áò
___3.3.4 ¾×ÅÍ Å©¸®Æ½ ¾Ë°í¸®Áò
3.4 TRPO(Trust Region Policy Optimization)
___3.4.1 TRPO ¾ÆÀ̵ð¾î
___3.4.2 Surrogate ¸ñÀû ÇÔ¼ö¿Í Á¦¾à Á¶°Ç
___3.4.3 ÄÓ·¹ ±×¶óµð¾ðÆ®¹ý ±â¹Ý ÃÖÀûÈ
3.5 PPO(Proximal Policy Optimzation)
___3.5.1 PPO ¾ÆÀ̵ð¾î
___3.5.2 Clipped Surrogate ¸ñÀûÇÔ¼ö
___3.5.3 PPO ¾Ë°í¸®Áò
3.6 SAC(Soft Actor Critic)
___3.6.1 ¿£Æ®·ÎÇÇ
___3.6.2 ÃÖ´ë ¿£Æ®·ÎÇÇ °ÈÇнÀ
___3.6.3 °¡Ä¡ÇÔ¼ö ¹× Á¤Ã¥ ÇнÀ
___3.6.4 SAC ¾Ë°í¸®Áò
¢Ã 4Àå: ¸ÞŸ °ÈÇнÀ
4.1 ¸ÞŸ °ÈÇнÀ
___4.1.1 ŽºÅ© °³³ä ¼Ò°³
___4.1.2 ¸ÞŸ °ÈÇнÀ ¹®Á¦ Á¤ÀÇ
___4.1.3 MuJoCo ¹× Half-Cheetah ȯ°æ °³³ä ¼Ò°³
4.2 ¼øȯ Á¤Ã¥ ¸ÞŸ °ÈÇнÀ
___4.2.1 GRU
___4.2.2 ¼øȯ Á¤Ã¥ ¸ÞŸ °ÈÇнÀ
___4.2.3 RL2
___4.2.4 ½Ç½À: RL2 ±¸Çö
4.3 ÃÖÀûÈ ±â¹Ý ¸ÞŸ °ÈÇнÀ
___4.3.1 MAML-RL
___4.3.2 ½Ç½À: MAML-RL ±¸Çö
4.4 ÄÁÅؽºÆ® ±â¹Ý ¸ÞŸ °ÈÇнÀ
___4.4.1 ŽºÅ© Ãß·Ð °üÁ¡¿¡¼ÀÇ ¸ÞŸ °ÈÇнÀ
___4.4.2 ÄÁÅؽºÆ® ±â¹Ý Á¤Ã¥
___4.4.3 º¯ºÐÀû Ãß·Ð
___4.4.4 PEARL(Probabilistic Embeddings for Actor critic RL)
___4.4.5 ½Ç½À: PEARL ±¸Çö
¢Ã 5Àå: ¿ÀǠ縰Áö¿Í ¸ÞŸ·¯´× ¾ÖÇø®ÄÉÀ̼Ç
5.1 ¿ÀǠ縰Áö(Open Chanllenges)
___5.1.1 ¸ÞŸ °úÀûÇÕ
___5.1.2 Ä¡¸íÀû ¸Á°¢°ú Áö¼Ó ÇнÀ
___5.1.3 ºÎÁ·ÇÑ º¥Ä¡¸¶Å©
___5.1.4 ºÎÁ·ÇÑ ·¹À̺íµÈ µ¥ÀÌÅÍ¿Í ¸ÞŸ ºñÁöµµ ÇнÀ
5.2 ¸ÞŸ·¯´× ¾ÖÇø®ÄÉÀ̼Ç
___5.2.1 ÄÄÇ»ÅÍ ºñÀü
___5.2.2 °ÈÇнÀ
___5.2.3 ÀÚ¿¬¾î ó¸®
___5.2.4 ÀÇ·á
___5.2.5 ¸¶Ä¡¸ç