Web Analytics Made Easy - Statcounter
به نقل از «آنا»
2024-04-29@09:37:34 GMT

رفتارهای مرموز هوش مصنوعی که علم برای آن پاسخی ندارد!

تاریخ انتشار: ۱۷ اسفند ۱۴۰۲ | کد خبر: ۳۹۹۰۲۴۸۶

آیا تا به حال فکر کرده‌اید که یک دستگاه مجهز به هوش مصنوعی مانند سیری یا الکسا چگونه می‌تواند صدای شما را درک کند و وظایفی را انجام دهد؟ پاسخ در چیزی به نام «یادگیری عمیق» نهفته است، فناوری‌ای که قدرت بیشتر سیستم‌های هوش مصنوعی امروزی وابسته به آن است. اما نکته اینجاست که حتی کارشناسان هم مطمئن نیستند که یادگیری عمیق دقیقاً چگونه یا چرا اینقدر خوب کار می‌کند!

اخیراً محققان شرکت اُپن ای آی، مستقر در سانفرانسیسکو،  هنگام آزمایش مدل‌های زبانی بزرگ، به پدیده‌اس گیج‌کننده برخورد کردند.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

آن‌ها دریافتند که در مواردی خاص، این مدل‌ها می‌توانند تا مدت‌های طولانی یک کار را یاد نگیرند و «ناگهان» آن را در یک لحظه بیاموزند!

وقتی محققان شگفت‌زده شدند

دو سال پیش، یوری بوردا (Yuri Burda) و هری ادواردز (Harri Edwards)، محققان شرکت اُپن‌ای آی در تلاش بودند تا دریابند که برای دستیابی به یک مدل بزرگ زبانی برای انجام محاسبات پایه چه چیزی لازم است. آنها دریافتند که این مدل‌ها باید چند نمونه از جمع اعداد را ببینند تا بتوانند هر عددی را که به آنها داده می‌شود جمع کنند. آنها می‌خواستند ببینند آیا این مدل می‌تواند محاسبات اولیه را انجام دهد یا خیر. در ابتدا، خیلی چیز‌ها خوب پیش نمی‌رفت. مدل‌ها، اعدادی را که می‌دیدند حفظ می‌کردند، اما نمی‌توانستند موارد جدید را حل کنند.

بوردا و ادواردز برای برخی از آزمایش‌های خود زمان بسیار طولانی‌تری صرف کردند، روز‌ها به جای ساعت‌ها. محققان بار‌ها و بار‌ها محاسبات نمونه را به مدل‌ها نشان دادند تا زمانی که از موفقیت‌آمیز بودن آزمایش مطمئن شدند. آنها یک مدل بزرگ زبانی را آموزش داده بودند تا دو عدد را جمع کند که خیلی بیشتر از آن چیزی که فکرش را می‌کردند زمان برده بود.

کشف یک پدیده جدید

این دو محقق و همکارانشان در مورد پدیده‌ای جالب تحقیق کردند. آنها متوجه شدند که گاهی اوقات، مدل‌ها یک کار را اصلاً یاد نمی‌گیرند و بعد از مدتی ناگهان در یک لحظه شروع به یادگیری می‌کردند. آنها این پدیده را «گروکینگ» (Grokking) نامیدند که یک کلمه سرواژه‌سازی‌شده از مفهوم «تعمیم و انطباق در مجموعه داده‌های الگوریتمی کوچک» است. این پدیده نشان میدهد که چگونه کامپیوتر‌ها می‌توانند از گروه‌های کوچک اعداد و الگو‌ها یاد بگیرند. این روش یادگیری آن چیزی نبود که قرار بود یادگیری عمیق باشد.

مدل‌های زبانی بزرگ، مانند چت‌جی‌پی‌تی-۴ و جِمنای دیپ‌مایند گوگل توانایی انجام کار‌هایی شگفت‌انگیز دارند، اما جامعه علمی هنوز تلاش می‌کند بفهمد این مدل‌ها چگونه این کار را انجام می‌دهند. درک این فرایند بسیار مهم است، زیرا به کنترل مدل‌های آینده که قدرتمندتر هستند، کمک می‌کند. 
گروکینگ تنها یکی از چندین پدیده غیرمنتظره‌ای است که محققان هوش مصنوعی را به حیرت انداخته است. این رفتار یک واقعیت مهم را در مورد یادگیری عمیق نشان می‌دهد: با وجود موفقیت بی‌نظیر، هیچ‌کس دقیقاً نمی‌داند که این فناوری چگونه کار می‌کند!

تعمیم غیرمنتظره در الگوها

بیشتر شگفتی‌ها ناشی از این است که مدل‌های هوش مصنوعی میتوانند پس از آموزش‌های جدید و یادگیری مجموعه‌ای از مثال‌ها آنها را به مثال‌هایی که قبلاً ندیدهاند تعمیم دهند و در الگو‌های جدید اعمال کنند. حتی گاهی اوقات، تعمیم زمانی اتفاق می‌افتد که انتظارش را نداریم. برای مثال، این مدل‌ها می‌توانند حل مسائل ریاضی را به زبان انگلیسی بیاموزند و سپس به حل مسائل ریاضی به زبان فرانسوی تعمیم دهند، که فراتر از آن چیزی است که فکرش را می‌کردیم.

فهمیدن اینکه چرا یادگیری عمیق اینقدر خوب کار می‌کند، فقط یک معمای علمی جذاب نیست بلکه کلیدی باشد برای باز کردن قفل نسل بعدی این فناوری و همچنین برای کنترل خطرات هولناک آن مهم است.

هوش مصنوعی در حال متحول کردن دنیایی است که در آن زندگی می‌کنیم، اما هنوز چیز‌های زیادی برای یادگیری در مورد نحوه کارکرد و بهبود آن وجود دارد.

این مطالعه در وبسایت تکنولوژی ریویو توسط ویل داگلاس هِوِن، نویسنده ارشد دانشگاه ام آی تی در حوزه هوش مصنوعی منتشر شده است.

انتهای پیام/

نازنین احسانی طباطبایی

منبع: آنا

کلیدواژه: هوش مصنوعی مدل زبانی اپن ای آی یادگیری عمیق یادگیری عمیق هوش مصنوعی مدل ها

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت ana.press دریافت کرده‌است، لذا منبع این خبر، وبسایت «آنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۹۰۲۴۸۶ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

آزمون‌های نهایی مبتنی بر ارزشیابی از یادگیری است

رئیس مرکز ارزشیابی و تضمین کیفیت نظام آموزشی وزارت آموزش و پرورش گفت: در طراحی سوالات امتحانات نهایی ارزشیابی از یادگیری مورد توجه است به طوری که دانش‌آموزان از حفظیات دور باشند.

به گزارش گروه اجتماعی خبرگزاری دانشجو محسن زارعی، معاون وزیر آموزش و پرورش درباره افت تحصیلی دانش‌آموزان در امتحانات نهایی اظهار داشت: این موضوع را نباید به صورت مقطعی و برشی بررسی کرد، شاید برداشت جامعه و آنچه که اتفاق افتاد، پس از اعلام میانگین نمرات آزمون نهایی پایه دوازدهم به این بود که این میانگین نشانگر افت تحصیلی است.

وی افزود: آموزش و پرورش بر این موضوع اصرار دارد که مبتنی بر شفافیت، وضعیت کنونی و نمای واقعی آموزش و پرورش را به نمایش بگذارد تا برای جبران کاستی‌ها برنامه‌ریزی کند.

رئیس مرکز ارزشیابی و تضمین کیفیت نظام آموزشی وزارت آموزش وپرورش اضافه کرد: شرایط مبتنی بر کیفیت آموزشی این‌گونه است که وضعیت فعلی را به خوبی بشناسیم و با اعلام به جامعه برای رسیدن به وضعیت مطلوب برنامه‌ریزی لازم و جبران صورت گیرد.

زارعی ادامه داد: آموزش و پرورش در این موضوع نمرات را شفاف اعلام کرد تا برنامه‌ریزی مناسبی انجام شود و معلمان دست به دست هم دهند و شاهد ارتقای کیفیت آموزشی باشیم.

معاون وزیر آموزش و پرورش افزود: در موضوع افت تحصیلی دانش‌آموزان باید عوامل سهیم را در نظر بگیریم که بخشی به انگیزه دانش‌آموزان و بخشی هم به دوره‌های آموزشی گذشته مربوط می‌شود، زیرا این موضوع در یک دوره اتفاق نیفتاده است.

وی یادآور شد: اشکالی هم که وجود دارد این است که در دوره‌های مختلف تحصیلی، بازخوردی از وضعیت آموزش نداریم و یکباره این بازخورد را در پایان دوران تحصیل انجام می‌دهیم. این موضوع باید در دوره‌های مختلف بررسی شود که در زمان خود مداخلات لازم صورت گیرد.

زارعی درباره تاثیر دشواری سوالات در امتحانات نهایی بر افت تحصیلی دانش‌آموزان اظهار داشت: سوالات سخت شاخص دارد و شاخص هم ضریب دشواری است که در تحلیل آزمون‌ها، شاهد دشواری سوالات نبودیم.

معاون وزیر آموزش و پرورش ادامه داد: آنچه در طراحی سوالات مبنا قرار دادیم این است که توجه و ارزشیابی از یادگیری صورت گیرد و توجه به مفاهیم باشد و دانش آموزان و کل فرایند آموزش جهت‌دهی به سمت یادگیری داشته و از حفظیات و محفوظات دور باشند.

زارعی یادآور شد: در نوبت‌های قبل هم درصدی از سوالات مربوط به همین ارزشیابی از یادگیری متناسب با سطوح شناختی مختلف در سوالات امتحانات نهایی بوده است؛ بنابراین جمع‌بندی این نیست که سوالات سخت بوده است.

دیگر خبرها

  • رفتارهای غیرمنطقی انسان الگوی جدید هوش مصنوعی شد
  • صفر تا صد آرایشگری مردانه را در کمترین زمان ممکن یاد بگیرید /درآمد و مزیت
  • دانشگاه جای رفتارهای وحشیانه با دانشجویان و اعضای هیات علمی نیست
  • رفتارهای متناقض در زمینه عرضه زمین و پرداخت وام ساخت مسکن، مردم را سردرگم کرده است
  • آموزش اتوماسیون صنعتی به صورتی تخصصی و عملی
  • درباره بیماری مرموز ترانه علیدوستی؛ چه کسانی در معرض آن هستند؟ | فیلم
  • آزمون‌های نهایی مبتنی بر ارزشیابی از یادگیری است
  • خواهرکشی ناموسی در مشهد | قتل زن ۲۳ ساله به دست برادر ۱۷ ساله
  • سایه یک زن مرموز بر تیم سپاهان؛ شیدا مقصودلو کیست و چه نسبتی با ژوزه مورایس دارد؟
  • واکنش متفاوت دستیار رئیسی به رفتارهای تند پلیسی با بی‌حجابی | فیلم