رفتارهای مرموز هوش مصنوعی که علم برای آن پاسخی ندارد!
تاریخ انتشار: ۱۷ اسفند ۱۴۰۲ | کد خبر: ۳۹۹۰۲۴۸۶
آیا تا به حال فکر کردهاید که یک دستگاه مجهز به هوش مصنوعی مانند سیری یا الکسا چگونه میتواند صدای شما را درک کند و وظایفی را انجام دهد؟ پاسخ در چیزی به نام «یادگیری عمیق» نهفته است، فناوریای که قدرت بیشتر سیستمهای هوش مصنوعی امروزی وابسته به آن است. اما نکته اینجاست که حتی کارشناسان هم مطمئن نیستند که یادگیری عمیق دقیقاً چگونه یا چرا اینقدر خوب کار میکند!
اخیراً محققان شرکت اُپن ای آی، مستقر در سانفرانسیسکو، هنگام آزمایش مدلهای زبانی بزرگ، به پدیدهاس گیجکننده برخورد کردند.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
وقتی محققان شگفتزده شدند
دو سال پیش، یوری بوردا (Yuri Burda) و هری ادواردز (Harri Edwards)، محققان شرکت اُپنای آی در تلاش بودند تا دریابند که برای دستیابی به یک مدل بزرگ زبانی برای انجام محاسبات پایه چه چیزی لازم است. آنها دریافتند که این مدلها باید چند نمونه از جمع اعداد را ببینند تا بتوانند هر عددی را که به آنها داده میشود جمع کنند. آنها میخواستند ببینند آیا این مدل میتواند محاسبات اولیه را انجام دهد یا خیر. در ابتدا، خیلی چیزها خوب پیش نمیرفت. مدلها، اعدادی را که میدیدند حفظ میکردند، اما نمیتوانستند موارد جدید را حل کنند.
بوردا و ادواردز برای برخی از آزمایشهای خود زمان بسیار طولانیتری صرف کردند، روزها به جای ساعتها. محققان بارها و بارها محاسبات نمونه را به مدلها نشان دادند تا زمانی که از موفقیتآمیز بودن آزمایش مطمئن شدند. آنها یک مدل بزرگ زبانی را آموزش داده بودند تا دو عدد را جمع کند که خیلی بیشتر از آن چیزی که فکرش را میکردند زمان برده بود.
کشف یک پدیده جدید
این دو محقق و همکارانشان در مورد پدیدهای جالب تحقیق کردند. آنها متوجه شدند که گاهی اوقات، مدلها یک کار را اصلاً یاد نمیگیرند و بعد از مدتی ناگهان در یک لحظه شروع به یادگیری میکردند. آنها این پدیده را «گروکینگ» (Grokking) نامیدند که یک کلمه سرواژهسازیشده از مفهوم «تعمیم و انطباق در مجموعه دادههای الگوریتمی کوچک» است. این پدیده نشان میدهد که چگونه کامپیوترها میتوانند از گروههای کوچک اعداد و الگوها یاد بگیرند. این روش یادگیری آن چیزی نبود که قرار بود یادگیری عمیق باشد.
مدلهای زبانی بزرگ، مانند چتجیپیتی-۴ و جِمنای دیپمایند گوگل توانایی انجام کارهایی شگفتانگیز دارند، اما جامعه علمی هنوز تلاش میکند بفهمد این مدلها چگونه این کار را انجام میدهند. درک این فرایند بسیار مهم است، زیرا به کنترل مدلهای آینده که قدرتمندتر هستند، کمک میکند.
گروکینگ تنها یکی از چندین پدیده غیرمنتظرهای است که محققان هوش مصنوعی را به حیرت انداخته است. این رفتار یک واقعیت مهم را در مورد یادگیری عمیق نشان میدهد: با وجود موفقیت بینظیر، هیچکس دقیقاً نمیداند که این فناوری چگونه کار میکند!
تعمیم غیرمنتظره در الگوها
بیشتر شگفتیها ناشی از این است که مدلهای هوش مصنوعی میتوانند پس از آموزشهای جدید و یادگیری مجموعهای از مثالها آنها را به مثالهایی که قبلاً ندیدهاند تعمیم دهند و در الگوهای جدید اعمال کنند. حتی گاهی اوقات، تعمیم زمانی اتفاق میافتد که انتظارش را نداریم. برای مثال، این مدلها میتوانند حل مسائل ریاضی را به زبان انگلیسی بیاموزند و سپس به حل مسائل ریاضی به زبان فرانسوی تعمیم دهند، که فراتر از آن چیزی است که فکرش را میکردیم.
فهمیدن اینکه چرا یادگیری عمیق اینقدر خوب کار میکند، فقط یک معمای علمی جذاب نیست بلکه کلیدی باشد برای باز کردن قفل نسل بعدی این فناوری و همچنین برای کنترل خطرات هولناک آن مهم است.
هوش مصنوعی در حال متحول کردن دنیایی است که در آن زندگی میکنیم، اما هنوز چیزهای زیادی برای یادگیری در مورد نحوه کارکرد و بهبود آن وجود دارد.
این مطالعه در وبسایت تکنولوژی ریویو توسط ویل داگلاس هِوِن، نویسنده ارشد دانشگاه ام آی تی در حوزه هوش مصنوعی منتشر شده است.
انتهای پیام/
نازنین احسانی طباطباییمنبع: آنا
کلیدواژه: هوش مصنوعی مدل زبانی اپن ای آی یادگیری عمیق یادگیری عمیق هوش مصنوعی مدل ها
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت ana.press دریافت کردهاست، لذا منبع این خبر، وبسایت «آنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۹۰۲۴۸۶ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
آزمونهای نهایی مبتنی بر ارزشیابی از یادگیری است
رئیس مرکز ارزشیابی و تضمین کیفیت نظام آموزشی وزارت آموزش و پرورش گفت: در طراحی سوالات امتحانات نهایی ارزشیابی از یادگیری مورد توجه است به طوری که دانشآموزان از حفظیات دور باشند.
به گزارش گروه اجتماعی خبرگزاری دانشجو محسن زارعی، معاون وزیر آموزش و پرورش درباره افت تحصیلی دانشآموزان در امتحانات نهایی اظهار داشت: این موضوع را نباید به صورت مقطعی و برشی بررسی کرد، شاید برداشت جامعه و آنچه که اتفاق افتاد، پس از اعلام میانگین نمرات آزمون نهایی پایه دوازدهم به این بود که این میانگین نشانگر افت تحصیلی است.
وی افزود: آموزش و پرورش بر این موضوع اصرار دارد که مبتنی بر شفافیت، وضعیت کنونی و نمای واقعی آموزش و پرورش را به نمایش بگذارد تا برای جبران کاستیها برنامهریزی کند.
رئیس مرکز ارزشیابی و تضمین کیفیت نظام آموزشی وزارت آموزش وپرورش اضافه کرد: شرایط مبتنی بر کیفیت آموزشی اینگونه است که وضعیت فعلی را به خوبی بشناسیم و با اعلام به جامعه برای رسیدن به وضعیت مطلوب برنامهریزی لازم و جبران صورت گیرد.
زارعی ادامه داد: آموزش و پرورش در این موضوع نمرات را شفاف اعلام کرد تا برنامهریزی مناسبی انجام شود و معلمان دست به دست هم دهند و شاهد ارتقای کیفیت آموزشی باشیم.
معاون وزیر آموزش و پرورش افزود: در موضوع افت تحصیلی دانشآموزان باید عوامل سهیم را در نظر بگیریم که بخشی به انگیزه دانشآموزان و بخشی هم به دورههای آموزشی گذشته مربوط میشود، زیرا این موضوع در یک دوره اتفاق نیفتاده است.
وی یادآور شد: اشکالی هم که وجود دارد این است که در دورههای مختلف تحصیلی، بازخوردی از وضعیت آموزش نداریم و یکباره این بازخورد را در پایان دوران تحصیل انجام میدهیم. این موضوع باید در دورههای مختلف بررسی شود که در زمان خود مداخلات لازم صورت گیرد.
زارعی درباره تاثیر دشواری سوالات در امتحانات نهایی بر افت تحصیلی دانشآموزان اظهار داشت: سوالات سخت شاخص دارد و شاخص هم ضریب دشواری است که در تحلیل آزمونها، شاهد دشواری سوالات نبودیم.
معاون وزیر آموزش و پرورش ادامه داد: آنچه در طراحی سوالات مبنا قرار دادیم این است که توجه و ارزشیابی از یادگیری صورت گیرد و توجه به مفاهیم باشد و دانش آموزان و کل فرایند آموزش جهتدهی به سمت یادگیری داشته و از حفظیات و محفوظات دور باشند.
زارعی یادآور شد: در نوبتهای قبل هم درصدی از سوالات مربوط به همین ارزشیابی از یادگیری متناسب با سطوح شناختی مختلف در سوالات امتحانات نهایی بوده است؛ بنابراین جمعبندی این نیست که سوالات سخت بوده است.