انسانها گونه اي هستند كه ميتوانند خود را با چالشهاي محيطي وفق دهند، و در طول سالها اين ما را قادر به تكامل بيولوژيكي كرده است - يك ويژگي اساسي كه در حيوانات يافت ميشود اما در هوش مصنوعي تربيت كودك وجود ندارد. اگرچه يادگيري ماشين در بازي هاي پيچيدهاي مانند Go و Dota 2 پيشرفت چشمگيري داشته است، مهارتهاي تسلط بر اين عرصهها لزوماً به كاربردهاي عملي در سناريوهاي دنياي واقعي تعميم نمييابند. هدف تعداد فزايندهاي از محققين ساختن هوش ماشيني است كه بيشتر شبيه انسانها رفتار ميكند، ياد ميگيرد و تكامل مييابد. مقاله ايي جديد من باب تربيت اصولي مقاله جديدي از OpenAI مستقر در سانفرانسيسكو پيشنهاد پكيج آموزش تربيت كودك ميكند كه آموزش مدلها در بازي پنهان كردن كودكان و قرار دادن آنها در مقابل يكديگر در دهها ميليون مسابقه، منجر به اين ميشود كه مدلها به طور خودكار رفتارهاي انسانمانندي را ايجاد كنند كه هوش آنها را افزايش ميدهد و پس از آن بهبود مييابد. كارايي. پنهان كاري كودكان چرا پنهان كاري؟ بوئن بيكر، محقق OpenAI، اولين نويسنده مقاله ميگويد كه پنهان كاري به عنوان يك نقطه شروع سرگرم كننده بيشتر به دليل قوانين ساده آن انتخاب شد. قوانين بازي: همه عوامل به عنوان اشياء كروي شبيه سازي شده اند كه مي توانند سه نوع عمل انجام دهند: پيمايش. چنگ زدن و حركت دادن اشيا؛ و اشياء را قفل كنيد كه فقط توسط هم تيمي هاي آن عامل باز مي شود. دلايل پنهان كاري كودكان محققان يك تا سه «پنهانگر» و يك تا سه «جستجو» را در محيطهاي شبيهسازيشده و زمينبنديشده فيزيكي با اتاقهايي كه با ديوارهاي ساكن مرزبندي شده بودند، قرار دادند. محيط ها همچنين شامل جعبه هاي متحرك با اندازه هاي مختلف و رمپ هاي متحرك بودند. محققان از يادگيري تقويتي براي آموزش عواملي استفاده كردند كه سيگنال پاداش آنها - مكانيسم تشويقي براي تحريك عوامل براي دستيابي به اهدافشان - از قوانين ساده پنهانكاري پيروي مي كرد: پنهان كاران وقتي از ديد جويندگان پنهان مي مانند، پاداش دريافت مي كنند و جويندگان پاداش دريافت مي كنند. وقتي مخفي گاه ها را پيدا مي كنند. چگونه هوش مصنوعي مخفي كاري مي كند در طول فرايند آموزش، عوامل هوش مصنوعي در چندين مرحله از استراتژي ها تكامل يافتند. در آغاز پنهان كاران (آبي) فقط فرار از جويندگان (قرمز) را آموختند. با پيشرفت گيم پلي، پنهان كنندگان شروع به استفاده از ابزارهايي به نفع خود كردند، به عنوان مثال، جعبه ها را براي مسدود كردن درها حركت دادند تا جويندگان نتوانند وارد اتاق آنها شوند. سپس جويندگان استراتژي هاي مقابله اي مربوطه را توسعه دادند، به عنوان مثال از رمپ ها براي بالا رفتن از ديوارها استفاده كردند. در پاسخ، مخفي كاران ياد گرفتند كه سطح شيب دار را به داخل اتاق خود ببرند تا جويندگان نتوانند از آن براي عبور از ديوارها استفاده كنند. با پيچيدهتر شدن محيطها، پنهانكاران ياد گرفتند كه با استفاده از جعبههاي دراز «قلعههاي» مستحكمتري بسازند. اگرچه OpenAI بر اين باور بود كه اين استراتژي نهايي خواهد بود، اما جويندگان بار ديگر با موفقيت مقابله كردند - راهي را براي پريدن روي جعبه و استفاده از حركت براي «موجسواري» در بالاي آن، از روي ديوار و داخل قلعه پنهانسازان پيدا كردند. در مرحله آخر، پنهانكاران ياد گرفتند كه با قفل كردن تمام جعبهها قبل از ساختن قلعه خود، در برابر «موجسواري باكس» دفاع كنند. محققان از تكامل اين استراتژيهاي مختلف به عنوان «پيشرفت مهارتهاي نوظهور از برنامههاي آموزشي چند عاملي» ياد ميكنند. اصطلاح "خودكار آموزشي" امسال توسط DeepMind ابداع شد و براي چندين عامل به كار مي رود كه به تدريج وظايف جديدي را براي به چالش كشيدن يكديگر در يك محيط خاص ايجاد مي كنند. محققان OpenAI بر اين باورند كه اين فرآيند مشابهاتي در انتخاب طبيعي دارد. "چرا ما واقعاً در مورد اين موضوع هيجان زده هستيم اين است كه به نوعي پويايي هاي مشابهي را مي بينيم كه روي زمين با تكامل ديده ايم. بنابراين شما همه اين نوع موجودات را روي زمين داريد كه در حال رقابت و تكامل با هم بودند. و در نهايت از آن انسان هايي به دست آمد كه به نوعي AGI جهان طبيعي هستند. چرا اين تحقيق اهميت دارد: با توجه به هدف نسبتاً ساده پنهانكاري، چندين عامل آموزش ديده از طريق خودبازي رقابتي ياد گرفتند كه از ابزارها استفاده كنند و مهارت هاي مربوط به انسان را براي پيروزي به كار گرفتند. OpenAI معتقد است كه اين يك جهت تحقيقاتي اميدواركننده براي توسعه و استقرار عامل هوشمند آينده است. OpenAI به منظور تشويق تحقيقات بيشتر در اين زمينه، كدها و محيط هاي خود را منبع باز مي كند. يكي از نويسندگان مقاله، محقق OpenAI، يي وو، به Synced گفت: «جامعه دانشگاهي واقعاً به محيطها و مشكلات خوب و جالب براي مطالعه نياز دارد. اين محيط كمي پيچيدهتر از دنياي ذرات دو بعدي است و مانند StarCraft فوقالعاده پيچيده نيست. چرا OpenAI علاقه مند است هدف نهايي OpenAI ايجاد يك هوش عمومي مصنوعي (AGI) است كه قادر به انجام بسياري از وظايف در يك سيستم عمومي است. در حالي كه ممكن است مسيرهاي متفاوتي براي رسيدن به اين هدف وجود داشته باشد، OpenAI در حال دو برابر كردن تحقيقات يادگيري تقويتي است كه توسط قدرت محاسباتي عظيم فعال مي شود. OpenAI اخيرا يك قرارداد محاسباتي 10 ساله با مايكروسافت به ارزش يك ميليارد دلار امضا كرده است. تحقيقات تربيتي اين تحقيق پنهانكاري OpenAI را نيز هيجانزده ميكند زيرا با افزايش پيچيدگي محيط، عوامل به طور مداوم با استراتژيهاي جديد خود را با چالشهاي جديد سازگار ميكنند. بيكر ميگويد: «اگر فرآيندي مانند اين بتواند بزرگتر شود و در محيط بسيار پيچيدهتري قرار گيرد، ممكن است عواملي بهقدري پيچيدهتر دريافت كنيد كه بتوانند وظايف واقعي را براي ما حل كنند. الگوريتم تربيت و پرورش كودك الگوريتم اصلي: عوامل هستند تربيت كودكان از دو شبكه تشكيل شده است: يك شبكه سياست براي توليد توزيع كنش و يك شبكه انتقادي براي پيش بيني بازده هاي مربوطه در آينده. محققان OpenAI از Proximal Policy Optimization (PPO)، تكنيكي كه در آموزش برنامه هاي كامپيوتري Dota2 استفاده كرده اند، براي بهينه سازي خط مشي استفاده كردند. معماري در زير نشان داده شده است. آموزش كودك براي بازي كامپيوتري عوامل هوش مصنوعي ميليون ها بار به طور موازي آموزش ديده اند. آموزش به سمت مرحله نهايي (دفاع موج سواري) در پيچيده ترين محيط سه تا چهار روز بر روي 16 GPU و 4000 CPU طول كشيد. نتايج آزمايش در مقايسه با الگوريتمهاي قبلي تربيت كودكان مانند انگيزه دروني، سياست پنهانكاري بسيار بيشتر قابل تفسير توسط انسان است. محققان همچنين روش پنهان و جستجوي چند عاملي را در شمارش اشيا، قفل و بازگشت، قفل متوالي، ساخت طرح اوليه و وظايف هوشمندي ساخت سرپناه ارزيابي كردند. عوامل در سه كار از پنج كار بهتر از مدل هاي پايه عمل كردند. چالش هاي تربيت كودك بيكر به Synced گفت كه عوامل تربيت كودكان گاهي اوقات رفتارهاي شگفت انگيزي از خود نشان مي دهند. براي مثال، مخفي كنندگان سعي كردند به طور كلي از منطقه بازي فرار كنند تا زماني كه محققان براي آن جريمه اعمال كردند. چالش هاي ديگر را مي توان به اشكالات موجود در فيزيك تماس محيط شبيه سازي شده نسبت داد. براي مثال، مخفيكاران آموختند كه اگر يك سطح شيبدار را در گوشهها به ديوارها فشار دهند، به دلايلي سطح شيبدار از ديوارها عبور ميكند و سپس ناپديد ميشود. چنين «تقلبهايي» نشان ميدهد كه چگونه ايمني الگوريتمها ميتواند نقش مهمي در يادگيري ماشين بازي كند. قبل از اينكه اين اتفاق بيفتد، هرگز نمي دانيد. اين نوع سيستم ها هميشه ايراداتي دارند. آنچه ما انجام داديم اساساً مشاهده و تجسم سياست است تا بتوانيم اين اتفاق عجيب را ببينيم. وو ميگويد سپس سعي ميكنيم فيزيك را درست كنيم. منبع:
اين كتابخانه فقط سه ماه است كه باز شده است و دانش آموزان نمي توانند منتظر رفتن باشند. هر چهارشنبه، آنها را براي «دوره كتابخانه» به اتاق روشن و پر از كتاب ميبرد. آنها از گوش دادن به خواندن او از داستانهاي رنگارنگ لذت ميبرند – اين يك تجربه كاملاً جديد براي آنها است.
نامكس كه 28 سال در كلاس اول در مدرسه تدريس كرده است و تربيت كودكان در جامعه امروزي، گفت: «آنها كتاب هاي زيادي را به امانت مي گيرند، به خصوص بعد از دوره كتابخانه، آنقدر زياد كه من به سختي موفق مي شوم همه آنها را در دفترچه يادداشت كنم!» او با لذت قهقهه زد. همه اينها براي معلمان مدرسه ابتدايي كامپونگ تام نيز تازگي داشت. تا همين اواخر، آنها نمي دانستند چگونه به دانش آموزان خود نشان دهند كه خواندن چقدر مي تواند سرگرم كننده باشد.
فراتر رفتن از چهار ديواري يك كتابخانه
كوچك فقط كتاب مورد علاقه خود را براي كل كلاس خواند و معلمش خانم قلم با غرور مي درخشد. آموزش تربيت كودك همين چند ماه پيش اين امكان پذير نبود. "ساعت من كجاست؟؟" گفت و صفحه رنگارنگ را برگرداند. وقتي صدايش را پايين آورد تا صداي تيك تاك ساعت در بيايد، چهره اش متحرك شد: «تيك! تيك! تيك!» هر دانش آموز كلاس اولي در كتابخانه نزديك بود از انتظار منفجر شود.
حتي با وجود اينكه نامكس قلم قبلاً بارها در كلاس داستانهايي را با دانشآموزانش به اشتراك گذاشته بود، روش او اين بود كه از روي يك كتاب درسي كه توسط دولت منتشر شده بود، با تصاوير بينظير بخواند، سپس از آنها بخواهد داستان را خلاصه كنند. آنها قبلاً هرگز كتابخانه اي نداشتند. خواندن مثل يك كار طاقت فرسا به نظر مي رسيد و دانش آموزانش به راحتي حواسشان پرت مي شد.
يك معلم كلاس اول در كامبوج به مدت 28 سال از تفاوت يادگيري نحوه خواندن براي دانش آموزانش شگفت زده شد.
گروهي از معلمان كامپونگ در طول دوره آموزشي Room to Read ما ياد گرفتند كه چگونه براي كودكان خردسال بخوانند. ما همچنين با مدرسه همكاري كرديم تا كتابخانه اي را ايجاد كنيم كه با كتاب هاي كودكان چاپ محلي پر كرديم. مجموعه، كتابخانه جديد، كتاب و فعاليتهاي خواندن - همه بخشي از برنامه جامع سوادآموزي ما هستند - در كودكان خردسال عادت به خواندن را تشويق ميكنند.
در اين دوره آموزشي، متوجه شد كه آموزش خواندن براي سرگرمي به دانش آموزان جوان مهارتي است كه او مي تواند بياموزد. و او متوجه شد كه عادت به خواندن مي تواند تأثيري اساسي بر كودك بگذارد - عادتي كه بسيار فراتر از چهار ديواري كتابخانه است.
«تكنيكهايي كه Room to Read به من آموخت بسيار مفيد هستند. «من حتي دانشآموزانم را به نويسنده و تصويرگر معرفي ميكنم» - كه به نظر ميرسد يك كار سرگرمكننده است زيرا تيم انتشارات Room to Read فقط از استعدادهاي محلي استفاده ميكند.
تنها پس از سه ماه، ريكساي كوچك در حال خواندن كتاب مورد علاقهاش براي همكلاسيهايش در اتاق كتابخواني مدرسهاش است.
"من مي توانم پيشرفت بزرگي را ببينم"
قبل از دوره آموزشي، معلم كامپونگ، سوكمول كيت، فقط از يك فعاليت خواندن اطلاع داشت - بلند خواندن. اكنون او مي داند كه چگونه فعاليت هاي خواندن را با نمره مناسب جفت كند. او فعاليت مشترك خواندن را براي مهدكودك ها دوست دارد زيرا آنها مي توانند در حين خواندن در مورد صدا و لحن بياموزند.
براي اطمينان از اينكه معلمان با رويكرد جديد راحت هستند، سال بعد دوره هاي آموزشي تكميلي برگزار مي كنيم. علاوه بر اين، تسهيلكننده مديريت كتابخانه محلي ما دو بار در ماه از كتابخانه بازديد ميكند تا دوره كتابخانه معلم را نظارت كند - ساعت هفتگي كه هر كلاس براي يك فعاليت خواندن به كتابخانه ميرود.
سوكمول مي گويد: «قبلاً فقط كتابداران آموزش مي ديدند. اكنون كه هر معلم در مدرسه در ترويج خواندن نقش دارد، مي توانم شاهد پيشرفت بزرگي باشم.
ايجاد هيجان در كودكان براي مطالعه
تصميم ما براي آموزش معلمان در تمام كشورهاي محل كارمان زماني شكل گرفت كه متوجه شديم در تعدادي از كشورهايي كه كتابخانههايي تأسيس كردهايم، بچهها آنطور كه ما انتظار داشتيم كتاب نميخوانند.
كلر وايات، مدير برنامه سوادآموزي، توضيح داد: «ما احساس ميكرديم كه داشتن معلم در هدايت فعاليتهاي خواندن به دانشآموزان كمك ميكند تا جذابيت كتابها را ببينند و آنها را براي خواندن هيجانزده كنند.
و اين دقيقاً همان چيزي است كه مطالعه ترويج خواندن ما به اين نتيجه رسيد كه اخيراً در 106 مدرسه در آفريقا و آسيا اجرا كرديم: عادت دانشآموز به مطالعه به طور قابل توجهي تشويق ميشود وقتي معلمي كه در اتاق خواندن آموزش ديده فعاليتهاي خواندن را انجام ميدهد.
سوك اينگ چان، مدير برنامه سوادآموزي كامبوج، گفت: «در سرتاسر كامبوج، ما متوجه شدهايم كه اين رويكرد جديد معلمان را در تشويق كودكان به خواندن فعالتر كرده است».
كتاب مورد علاقه او در دست، به جلوي اتاق دويد. او روي صندلي تكان خورد، پاهاي كوچكش تاب ميخورد و شروع به خواندن كتاب چك چك ميخواهد ازدواج كند، كتابي برنده جايزه، براي كل كلاس كرد. معلمش خانم قلم اولين كسي بود كه براي او كتاب داستان خواند. او احساس غرور مي كرد - حالا او هم مي توانست!
منبع: