ضریب هوشی انسان از هوش مصنوعی ساخته خودش کمتر است؟
تاریخ انتشار: ۱۵ فروردین ۱۴۰۲ | کد خبر: ۳۷۴۵۰۲۰۲
یک محقق در یک آزمایش جالب توجه، از ربات ChatGPT تست IQ گرفت و این آزمایش نتیجه جالبتوجهی را به همراه داشت. عملکرد ربات چت در این امتحان، عالی بود؛ چرا که اثری از اضطراب امتحان، عدم تمرکز یا عدم تلاش در آن دیده نشد. اما نتیجه تست IQ چه بود؟
به گزارش خبرآنلاین، این محقق گفته که ChatGPT اولین سوژه غیرانسانی بود که تابهحال از او تست گرفته شده است.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
نویسنده مقاله میگوید: «من در کار خود به عنوان یک روانشناس بالینی، مهارتهای شناختی بیماران انسانی را با استفاده از تستهای هوش استاندارد ارزیابی میکنم؛ بنابراین بلافاصله پس از خواندن مقالات زیادی که اخیرا در مورد ChatGPT منتشر شده و مهارتهای انسانی چشمگیر آن را توصیف میکردند، مجذوب آن شدم. ChatGPT همه کار انجام میدهد، از نوشتن مقالات دانشگاهی و داستانهای پریان گرفته، تا تعریف کردن جوک و توضیح مفاهیم علمی و نوشتن و رفع اشکال کدهای کامپیوتری. دانستن همه اینها مرا کنجکاو کرد تا ببینم ChatGPT تا چه اندازه براساس استانداردهای انسانی، هوشمند است و در نتیجه شروع به آزمایش ربات ChatGPT کردم.»
نتایج اولیه بسیار مطلوب بود. ChatGPT برای آزمون دادن بسیار ایدهآل بود و رفتار و نگرشی عالی داشت. نشانهای از اضطراب امتحان، تمرکز پایین یا عدم تلاش دیده نمیشد و و نظرات عجیب و مشکوکی در باره تست هوش و محققی مثل من ارائه نشد.
من بدون نیاز به هیچ گونه آمادگی یا توضیح شفاهی در مورد پروتکلهای تست، سوالات خاصی از تست هوش را کپی کردم و آنها را به ChatGP دادم. سوالات انتخاب شده، متداولترین تست هوش IQ و مربوط به "تست هوش بزرگسالان وکسلر (WAIS) " بود. من از ویرایش سوم تست WAIS استفاده کردم که شامل شش خرده آزمون کلامی و پنج خرده آزمون غیرکلامی است که به ترتیب مؤلفههای هوش کلامی و ضریب هوشی عملکردی را شامل میشوند. معیار سنجش هوش کامل در مقیاس جهانی براساس مجموع نمرات بهدست آمده از این یازده خرده آزمون است. میانگین ضریب هوشی ۱۰۰ امتیاز و میزان انحراف استاندارد نمرات در مقیاس تست ۱۵ است، یعنی که باهوشترین افراد که شامل ۱۰ درصد جمعیت دنیا میشوند، ضریب هوشی در حدود ۱۲۰ دارند و تنها ۱ درصد جمعیت، از IQ ۱۳۳ برخوردارند.
از آنجا که پنج خرده آزمون در محدوده هوش کلامی (شامل واژگان، شباهتها، درک مطلب، اطلاعات و حساب و کتاب) را میتوان به صورت نوشتاری ارائه کرد، امکان سنجش IQ برای ChatGPT فراهم بود. ششمین خرده آزمون سنجش هوش کلامی، گستره حافظه عددی است که حافظه کوتاهمدت را اندازهگیری میکند و نمیتوان آن را روی رباتچت اجرا کرد، چرا که ChatGPT فاقد مدار عصبی مرتبطی است که به طور خلاصه اطلاعاتی مانند نام یا شماره را ذخیره کند.
تست را با زیر آزمون سنجش لغات شروع کردم و همانطور که توقع داشتم، این بخش از آزمون برای ChatGPT ساده بود؛ چرا که این ابزار با متون آنلاین فراوانی آموزش دیده است. این خرده آزمون، اطلاعات مربوط به دانش کلمات و شکلگیری مفاهیم کلامی بود و مثلا یکی از سوالات رایج آن این است: «معنی کلمه "ابزار" چیست؟»
ChatGPT این تست را پشت سرگذاشت و جوابهایش اکثرا بسیار دقیق و جامع بودند و از معیار پاسخهای صحیح که در دفترچه راهنمای آزمون نشان داده شده بود، نمره بالاتری گرفت. برای امتیازدهی به سوال بالا، به جوابی مثل: «چیزی مانند گوشی من»، یک امتیاز تعلق میگیرد و اگر جواب جزئیات بیشتر داشته باشد، مثل: «یک دستگاه کوچک یا ابزار برای یک کار خاص.» دو امتیاز تعلق خواهد گرفت. پاسخهای ChatGPT دو امتیاز کامل را دریافت کردند.
ربات چت در خرده آزمونهای تشابه و اطلاعات هم عملکرد خوبی داشت و حداکثر امتیازات را بدست آورد. خرده آزمون اطلاعات، تستی از دانش عمومی، کنجکاوی فکری، سطح تحصیلات و توانایی یادگیری و به خاطر سپردن حقایق است که یکی از سوالات مرسوم این آزمون چنین سوالی است: «پایتخت اوکراین کجاست؟»
خرده آزمون شباهتها، مهارتهای استدلال انتزاعی و شکلگیری مفاهیم را میسنجد. یکی از سوالات ممکن است اینگونه باشد: «هری پاتر و باگز بانی از چه نظر شبیه به هم هستند؟» پاسخهای رباتچت در این آزمون فرعی، با جزئیات فراوان و انگار به قصد خودنمایی و به رخ کشیدن اطلاعاتش بود؛ تا حدی که عصبی شدم و دکمه "توقف ارائه پاسخ" را فشار دادم. در اینجا هدف این نبود که ربات اطلاعات خودش را به رخ بکشد، بلکه جواب سوال خیلی ساده بود: شباهت اساسی هری پاتر و باگز بانی این است که هر دو شخصیتهای خیالی هستند و واقعاً نیازی نبود که ChatGPT برای پاسخ به این سوال، به مقایسه تاریخچه کامل ماجراهای آنها و دوستان و دشمنانشان بپردازد.
در بخش درک مطلب، ChatGPT به سؤالاتی مثل: «اگر تلویزیون شما آتش بگیرد، چه کاری باید انجام دهید؟» به درستی پاسخ داد. همانطور که انتظار میرفت، رباتچت تمام سوالات مربوط به علم ریاضی را حل کرد، سوالاتی مثل محاسبه میانگین سه عدد.
اما نتیجه نهایی تست هوش ChatGPT چه بود؟ براساس پاسخهای این خردهآزمونها، ضریب هوشی کلامی ChatGPT ۱۵۵ بود که بالاتر از ۹۹.۹درصد آمریکاییها است که در آزمون استاندارد سازی WAIS III شرکت کرده بودند.
از آنجایی که چت بات فاقد چشم، گوش و دست برای انجام آزمونهای غیرکلامی WAIS است، بنابراین نمیتوانست در این بخش از آزمون شرکت کند. اما در زمینه هوش کلامی و ضریب هوشی کامل، نمره بالایی را کسب کرد و همین موضوع ChatGPT را در رده بالاتری از استاندارهای مربوط به هوش انسانی قرار میدهد.
در نمونه استانداردسازی WAIS، میانگین هوش کلامی در میان آمریکاییهای تحصیلکرده دانشگاهی، ۱۱۳ بود و ۵ درصد، امتیاز ۱۳۲ و بالاتر را کسب کردند. من خودم توسط یکی از دوستانم در کالج این تست را انجام دادم و نتیجه به دست آمده، در سطح نمره کسب شده توسط ChatGPT نبود (این نتیجه عمدتاً بخاطر جوابهای بسیار کوتاه و بدون جزئیات من بودند)؛ بنابراین آیا هوش مصنوعی تهدیدی برای مشاغل روانشناسان بالینی و سایر متخصصان خواهد بود؟ خوشحالم که بگویم هنوز به طور کامل این اتفاق نیفتاده است. در کارهایی که به استدلال واقعی انسانی یا درک دنیای فیزیکی و اجتماعی نیاز است، ChatGPT عملکرد ناموفقی دارد.
ChatGPT گاهی در پاسخگویی به راحتترین معماها ناکام میماند؛ مثلا روز ۲۱ مارس، در پاسخ به این معمای ساده: «نام کوچک پدر فرزندان سباستین چیست؟» پاسخ داد: «متأسفم، من نمیتوانم به این سؤال پاسخ دهم؛ چون اطلاعات کافی در مورد اینکه منظورتان کدام سباستین است، ندارم.»
به نظر میرسد که ChatGPT توانایی استدلال منطقی را ندارد و سعی میکند به پایگاه وسیع دادههای خود در مورد اسم "سباستین" که در متون آنلاین آمده، تکیه کند.
عبارت "هوش آن چیزی است که تستهای هوش اندازهگیری میکنند"، یک تعریف کلاسیک و بسیار بدیهی از هوش است که از مقالهای که در سال۱۹۲۳ توسط ادوین بورینگ (یکی از پیشگامان روانشناسی شناختی) نوشته شده، نشات میگیرد.
این تعریف برپایه مشاهدات مهارتهایی برای انجام کارهای به ظاهر متنوع، مثل حل کردن پازل، توصیف کلمات، به خاطر سپردن ارقام و تشخیص موارد گمشده در تصاویر، ارائه شده است. چارلز اسپیرمن که یک روش آماری به نام «تحلیل عاملی» را ایجاد کرد، در سال ۱۹۰۴ به این نتیجه رسید که یک عامل کلی هوش، به نام عامل g، باید زمینه ساز تطابق اندازهگیریها برای مهارتهای مختلف شناختی انسان باشد. تستهای هوش مثل تست WAIS بر اساس این فرضیه هستند. با این حال، ضریب هوشی کلامی بسیار بالای ChatGPT در کنار ناکامیهای عجیبش، تعریف بورینگ را زیر سوال میبرد و نشان میدهد که جنبههایی از هوش را نمیتوان به تنهایی و فقط با تستهای IQ اندازهگیری کرد. پس شاید حق با بیمارانی باشد که در تمام طول این مدت به این تستها شک داشتهاند.
منبع: scientificamerican
منبع: فرارو
کلیدواژه: چت جی پی تی اندازه گیری ضریب هوشی هوش کلامی ربات چت تست هوش تست ها
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت fararu.com دریافت کردهاست، لذا منبع این خبر، وبسایت «فرارو» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۷۴۵۰۲۰۲ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
تداوم پیشتازی همراه اول در جذب مشترکان
آیتی آنالیز نوشت: جزییات گزارش آماری سازمان رگولاتوری نشان میدهد، در فصل بهار سال قبل همراه اول با مجموع نزدیک به 78.5 میلیون مشترک فعال و افزایش نزدیک به 25 هزار مشترک فعال، توانست ضریب نفوذ خود را به 92.59 درصد رسانده و در مجموع سهم بازار خود را به 53.093 درصد برساند.
در همین مقطع یعنی فصل بهار 1402 اما اپراتور دوم کشور ایرانسل با مجموع نزدیک به 64میلیون کاربر، در اتفاقی عجیب که دلیل آن روشن نیست با کاهش بیش از 540هزار مشترک فعال مواجه شد و در نهایت با ضریب نفوذ 75درصدی، (17درصد کمتر از همراه اول) در مجموع 43.129 درصد از سهم بازار مشترکان موبایل را به خود اختصاص داد.
در همین حال اما اپراتور سوم یعنی رایتل نیز سیر نزولی و معمول خود را طی کرد و با مجموع بیش از 5.5 میلیون مشترک، 6.59 درصد ضریب نفوذ، ریزش بیش از 19 هزار مشترک و بیش از 3 درصد از سهم بازار، فصل بهار سال قبل را پشت سر گذاشت.
با ورود به فصل تابستان اما پیشتازی همراه اول در تمامی شاخصهای مشترکان، ضریب نفوذ و سهم بازار ادامه یافت و به این ترتیب تعداد مشترکان فعال همراه اول به بیش از 79 میلیون و 300 هزار مشترک رسید. نکته قابل توجه آن است که در این مقطع همراه اول با رکوردی جهشی توانسته بیش از 895 هزار مشترک فعال را به شبکه خود اضافه کند و به این ترتیب ضریب نفوذ خود را به 93.64 درصد و سهم بازارش را نیز به 53.146 درصد افزایش دهد.
ایرانسل نیز در تابستان سال قبل ریزش عجیب کاربران خود را جبران کرد و با بیش از 768 هزار مشترک فعال، مجموع مشترکان خود را به نزدیک 75 میلیون مشترک رساند و در نهایت ضریب نفوذ بیش از 76 درصدی و سهم بازار 43.200 درصدی را از آن خود کند. به این ترتیب میانگین سهم بازار فصلهای بهار و تابستان سال 1402 نشان میدهد که نه تنها پیشتازی همراه اول در سهم بازار از ایرانسل ادامه یافته بلکه از نظر تعداد مشترکان فعال نیز همراه اول فاصله بیشتری از ایرانسل پیدا کرده است.
رایتل نیز در قیاس فصل بهار و تابستان سال 1402 کماکان سیر نزولی خود را در تمامی شاخصها ادامه داده و با افت مشترکان، ضریب نفوذ و سهم بازار مواجه شده است.