مطالعهای تازه منتشر شده نشان میدهد جذابیت ظاهری محتوای تولیدشده توسط هوش مصنوعی، توهمی ناشی از مقایسه با میانگین عملکرد انسانی است؛ در حالی که این فناوری از رسیدن به سطح خلاقیت متخصصان ناتوان است.
یک تحلیل نظری جدید که در (Journal of Creative Behaviour) منتشر شده، روایت رایجی را که میگوید هوش مصنوعی در آستانه پشتسر گذاشتن تواناییهای هنری و فکری انسان است، به چالش میکشد. این مطالعه نشان میدهد مدلهای زبانی عظیم مانند ChatGPT از نظر ریاضی در سطحی از خلاقیت محدود شدهاند که با یک انسان آماتور قابل مقایسه است.
این پژوهش توسط دیوید اچ. کروپلی، استاد نوآوری مهندسی در دانشگاه استرالیای جنوبی انجام شده است. کروپلی این تحقیق را با هدف ایجاد معیاری عینی در بحث دوقطبی پیرامون هوش مصنوعی مولد آغاز کرد. در حالی که برخی طرفداران ادعا میکنند هوش مصنوعی در بسیاری از وظایف خلاقانه از انسان پیشی گرفته، عدهای دیگر معتقدند این سیستمها فقط دادههای موجود را تقلید میکنند و فاقد درک واقعی هستند.
کروپلی برای عبور از نظرات شخصی، تعریف استاندارد «خلاقیت» را بر سازوکار احتمالاتی مدلهای زبانی اعمال کرد تا مشخص کند آیا شیوه کار این مدلها، محدودیتی ذاتی بر کیفیت خروجی آنها اعمال میکند یا نه.
برای ارزیابی توان خلاقانه هوش مصنوعی، او ابتدا تعریف مشخصی از «محصول خلاق» ارائه داد. براساس تعریف استاندارد، یک خروجی زمانی خلاق محسوب میشود که دو معیار را همزمان داشته باشد: اثربخشی و اصالت.
اثربخشی به این معناست که خروجی باید مفید، مناسب یا متناسب با هدف موردنظر باشد. اصالت یعنی خروجی جدید، غیرمنتظره یا شگفتآور باشد. در خلاقیت سطح بالای انسانی، این دو ویژگی همزمان وجود دارند؛ یک شاهکار، هم کاملاً تازه است و هم کاملاً مناسب.
کروپلی تحلیل خود را بر «محصول» متمرکز کرد، نه فرایندهای روانشناختی یا عوامل محیطی مؤثر بر انسان؛ زیرا هوش مصنوعی نه ویژگی شخصیتی دارد و نه از فرهنگ محیط کار تأثیر میپذیرد. او سازوکار «پیشبینی توکن بعدی» را که مبنای کار مدلهای زبانی است، بررسی کرد.
این سیستمها متن را به واحدهای کوچکی به نام توکن تقسیم میکنند و براساس دادههای آموزشدیده، احتمال منطقی بودن هر توکن بعدی را محاسبه میکنند. این فرآیند شفاف و قابل اندازهگیری است و برخلاف مغز انسان، امکان تحلیل ریاضی خلاقیت را فراهم میکند.
نتایج نشان داد در معماری مدلهای زبانی یک مبادله بنیادین وجود دارد:برای اینکه پاسخ هوش مصنوعی اثربخش باشد، باید واژههایی انتخاب کند که احتمال بالایی برای تناسب با متن دارند. مثلاً در جمله «The cat sat on the…» کلمهی «mat» مناسب و مؤثر است، اما، چون محتملترین گزینه است، کمترین اصالت را هم دارد.
برعکس، اگر مدل برای افزایش اصالت، واژههای کماحتمال انتخاب کند، اثربخشی کاهش مییابد. مثلاً «red wrench» یا «growling cloud» جدیدند، اما بیمعنا و نامناسب. بنابراین، در سیستمهای زبانی، اصالت و اثربخشی، رابطه معکوس دارند.
کروپلی با بیان ریاضی این رابطه نشان داد که خلاقیت در مدلهای زبانی سقف مشخصی دارد. او خلاقیت را حاصلضرب اثربخشی و اصالت تعریف کرد. از آنجا که این دو ویژگی یکدیگر را محدود میکنند، حداکثر خلاقیت ممکن برای هوش مصنوعی ۰.۲۵ (در مقیاس صفر تا یک) است؛ آن هم فقط زمانی که هر دو معیار در سطح متوسط قرار گیرند. این بدان معناست که مدلهای زبانی، از نظر ساختاری، قادر نیستند همزمان به اصالت و اثربخشی بالا برسند.
برای درک بهتر این موضوع، کروپلی این حد ۰.۲۵ را با «مدل چهارگانه خلاقیت» مقایسه کرد که شامل سطوحی از «خلاقیت کوچک» (عملکرد روزمره) تا «خلاقیت بزرگ» (آثار ماندگار) است. نتیجه نشان داد سقف خلاقیت هوش مصنوعی معادل مرزی میان «LittleC» و «ProC» است؛ یعنی بین سطح خلاقیت یک فرد عادی و یک حرفهای ماهر.
این یافته نشان میدهد هوش مصنوعی میتواند کار یک فرد معمولی را تقلید کند، اما قادر به رسیدن به سطح نویسندگان، هنرمندان یا نوآوران حرفهای نیست. در پژوهشهای تجربی نیز ثابت شده که داستانها یا راهحلهای تولیدشده توسط هوش مصنوعی معمولاً در چهل تا پنجاهمین صدک در مقایسه با انسان قرار میگیرند؛ یعنی کاملاً متوسط.
کروپلی در یک بیانیه خبری گفت: «هوش مصنوعی میتواند رفتار خلاقانه را تقلید کند ــ گاهی بسیار قانعکننده، اما ظرفیت خلاقانه واقعی آن در سطح انسان متوسط محدود میماند و هرگز به استاندارد حرفهای نمیرسد. بسیاری تصور میکنند، چون ChatGPT میتواند داستان یا شعر تولید کند، پس خلاق است. اما تولید چیزی با خلاق بودن یکسان نیست.»
مطالعه توضیح میدهد که بیشتر انسانها سطح خلاقیت متوسطی دارند، به همین دلیل خروجی هوش مصنوعی برای عموم مردم چشمگیر به نظر میرسد. اما متخصصان خلاق بهسرعت ماهیت فرمولی و قابل پیشبینی محتوای هوش مصنوعی را تشخیص میدهند.
این سقف ریاضی تضمین میکند که هوش مصنوعی میتواند ابزار مفیدی برای کارهای روتین باشد، اما هرگز نمیتواند بهطور مستقل ایدههایی تحولآفرین خلق کند.
کروپلی افزود: «یک نویسنده یا طراح ماهر ممکن است گاهی اثری واقعاً اصیل و مؤثر خلق کند، اما یک مدل زبانی هرگز چنین نخواهد کرد. خروجی آن همیشه در حد متوسط میماند و اگر صنایع بیش از حد به آن تکیه کنند، کارهای تکراری و کلیشهای تولید خواهد شد.»
البته این نظریه محدودیتهایی هم دارد. مدل ارائهشده از یک تقریب خطی استفاده میکند که اصالت را معکوس اثربخشی در نظر میگیرد؛ درحالیکه مفهوم اصالت در نظریه اطلاعات پیچیدهتر است. همچنین، فرض پژوهش بر روشهای استاندارد تولید متن (مانند greedy decoding) است و تمام حالات مختلف تنظیمات مدل، دخالت انسان یا شیوههای پیچیدهتر نمونهبرداری را لحاظ نمیکند.
پژوهشهای آینده ممکن است بررسی کنند که آیا تغییر دما (temperature) که میزان تصادفیبودن خروجی را کنترل میکند میتواند باعث تغییر در سقف خلاقیت شود یا خیر. همچنین شاید بتوان با استفاده از یادگیری تقویتی، وزنی بیشتر به اصالت داد بدون آنکه انسجام متن از بین برود. مطالعات چندزبانه نیز میتواند نشان دهد آیا این محدودیت ریاضی در زبانها و فرهنگهای مختلف ثابت است یا نه.
به گزارش (psypost) کروپلی در پایان نتیجهگیری میکند: «برای اینکه هوش مصنوعی به سطح خلاقیت حرفهای برسد، باید معماریهای کاملاً جدیدی طراحی شود که بتواند ایدههایی فراتر از الگوهای آماری گذشته تولید کند. تا زمانی که چنین تحول بنیادی رخ ندهد، شواهد نشان میدهد انسان همچنان تنها منبع خلاقیت سطح بالا باقی میماند.»
source