سقف خلاقیت هوش مصنوعی لو رفت

مطالعه‌ای تازه منتشر شده نشان می‌دهد جذابیت ظاهری محتوای تولیدشده توسط هوش مصنوعی، توهمی ناشی از مقایسه با میانگین عملکرد انسانی است؛ در حالی که این فناوری از رسیدن به سطح خلاقیت متخصصان ناتوان است.

یک تحلیل نظری جدید که در (Journal of Creative Behaviour) منتشر شده، روایت رایجی را که می‌گوید هوش مصنوعی در آستانه پشت‌سر گذاشتن توانایی‌های هنری و فکری انسان است، به چالش می‌کشد. این مطالعه نشان می‌دهد مدل‌های زبانی عظیم مانند ChatGPT از نظر ریاضی در سطحی از خلاقیت محدود شده‌اند که با یک انسان آماتور قابل مقایسه است.

این پژوهش توسط دیوید اچ. کروپلی، استاد نوآوری مهندسی در دانشگاه استرالیای جنوبی انجام شده است. کروپلی این تحقیق را با هدف ایجاد معیاری عینی در بحث دوقطبی پیرامون هوش مصنوعی مولد آغاز کرد. در حالی که برخی طرفداران ادعا می‌کنند هوش مصنوعی در بسیاری از وظایف خلاقانه از انسان پیشی گرفته، عده‌ای دیگر معتقدند این سیستم‌ها فقط داده‌های موجود را تقلید می‌کنند و فاقد درک واقعی هستند.

کروپلی برای عبور از نظرات شخصی، تعریف استاندارد «خلاقیت» را بر سازوکار احتمالاتی مدل‌های زبانی اعمال کرد تا مشخص کند آیا شیوه کار این مدل‌ها، محدودیتی ذاتی بر کیفیت خروجی آنها اعمال می‌کند یا نه.

برای ارزیابی توان خلاقانه هوش مصنوعی، او ابتدا تعریف مشخصی از «محصول خلاق» ارائه داد. براساس تعریف استاندارد، یک خروجی زمانی خلاق محسوب می‌شود که دو معیار را هم‌زمان داشته باشد: اثربخشی و اصالت.

اثربخشی به این معناست که خروجی باید مفید، مناسب یا متناسب با هدف موردنظر باشد. اصالت یعنی خروجی جدید، غیرمنتظره یا شگفت‌آور باشد. در خلاقیت سطح بالای انسانی، این دو ویژگی هم‌زمان وجود دارند؛ یک شاهکار، هم کاملاً تازه است و هم کاملاً مناسب.

کروپلی تحلیل خود را بر «محصول» متمرکز کرد، نه فرایند‌های روان‌شناختی یا عوامل محیطی مؤثر بر انسان؛ زیرا هوش مصنوعی نه ویژگی شخصیتی دارد و نه از فرهنگ محیط کار تأثیر می‌پذیرد. او سازوکار «پیش‌بینی توکن بعدی» را که مبنای کار مدل‌های زبانی است، بررسی کرد.

این سیستم‌ها متن را به واحد‌های کوچکی به نام توکن تقسیم می‌کنند و براساس داده‌های آموزش‌دیده، احتمال منطقی بودن هر توکن بعدی را محاسبه می‌کنند. این فرآیند شفاف و قابل اندازه‌گیری است و برخلاف مغز انسان، امکان تحلیل ریاضی خلاقیت را فراهم می‌کند.

نتایج نشان داد در معماری مدل‌های زبانی یک مبادله بنیادین وجود دارد:برای اینکه پاسخ هوش مصنوعی اثربخش باشد، باید واژه‌هایی انتخاب کند که احتمال بالایی برای تناسب با متن دارند. مثلاً در جمله «The cat sat on the…» کلمه‌ی «mat» مناسب و مؤثر است، اما، چون محتمل‌ترین گزینه است، کمترین اصالت را هم دارد.

برعکس، اگر مدل برای افزایش اصالت، واژه‌های کم‌احتمال انتخاب کند، اثربخشی کاهش می‌یابد. مثلاً «red wrench» یا «growling cloud» جدیدند، اما بی‌معنا و نامناسب. بنابراین، در سیستم‌های زبانی، اصالت و اثربخشی، رابطه معکوس دارند.

کروپلی با بیان ریاضی این رابطه نشان داد که خلاقیت در مدل‌های زبانی سقف مشخصی دارد. او خلاقیت را حاصل‌ضرب اثربخشی و اصالت تعریف کرد. از آنجا که این دو ویژگی یکدیگر را محدود می‌کنند، حداکثر خلاقیت ممکن برای هوش مصنوعی ۰.۲۵ (در مقیاس صفر تا یک) است؛ آن هم فقط زمانی که هر دو معیار در سطح متوسط قرار گیرند. این بدان معناست که مدل‌های زبانی، از نظر ساختاری، قادر نیستند هم‌زمان به اصالت و اثربخشی بالا برسند.

برای درک بهتر این موضوع، کروپلی این حد ۰.۲۵ را با «مدل چهارگانه خلاقیت» مقایسه کرد که شامل سطوحی از «خلاقیت کوچک» (عملکرد روزمره) تا «خلاقیت بزرگ» (آثار ماندگار) است. نتیجه نشان داد سقف خلاقیت هوش مصنوعی معادل مرزی میان «LittleC» و «ProC» است؛ یعنی بین سطح خلاقیت یک فرد عادی و یک حرفه‌ای ماهر.

این یافته نشان می‌دهد هوش مصنوعی می‌تواند کار یک فرد معمولی را تقلید کند، اما قادر به رسیدن به سطح نویسندگان، هنرمندان یا نوآوران حرفه‌ای نیست. در پژوهش‌های تجربی نیز ثابت شده که داستان‌ها یا راه‌حل‌های تولیدشده توسط هوش مصنوعی معمولاً در چهل تا پنجاهمین صدک در مقایسه با انسان قرار می‌گیرند؛ یعنی کاملاً متوسط.

کروپلی در یک بیانیه خبری گفت: «هوش مصنوعی می‌تواند رفتار خلاقانه را تقلید کند ــ گاهی بسیار قانع‌کننده، اما ظرفیت خلاقانه واقعی آن در سطح انسان متوسط محدود می‌ماند و هرگز به استاندارد حرفه‌ای نمی‌رسد. بسیاری تصور می‌کنند، چون ChatGPT می‌تواند داستان یا شعر تولید کند، پس خلاق است. اما تولید چیزی با خلاق بودن یکسان نیست.»

مطالعه توضیح می‌دهد که بیشتر انسان‌ها سطح خلاقیت متوسطی دارند، به همین دلیل خروجی هوش مصنوعی برای عموم مردم چشمگیر به نظر می‌رسد. اما متخصصان خلاق به‌سرعت ماهیت فرمولی و قابل پیش‌بینی محتوای هوش مصنوعی را تشخیص می‌دهند.

این سقف ریاضی تضمین می‌کند که هوش مصنوعی می‌تواند ابزار مفیدی برای کار‌های روتین باشد، اما هرگز نمی‌تواند به‌طور مستقل ایده‌هایی تحول‌آفرین خلق کند.

کروپلی افزود: «یک نویسنده یا طراح ماهر ممکن است گاهی اثری واقعاً اصیل و مؤثر خلق کند، اما یک مدل زبانی هرگز چنین نخواهد کرد. خروجی آن همیشه در حد متوسط می‌ماند و اگر صنایع بیش از حد به آن تکیه کنند، کار‌های تکراری و کلیشه‌ای تولید خواهد شد.»

البته این نظریه محدودیت‌هایی هم دارد. مدل ارائه‌شده از یک تقریب خطی استفاده می‌کند که اصالت را معکوس اثربخشی در نظر می‌گیرد؛ درحالی‌که مفهوم اصالت در نظریه اطلاعات پیچیده‌تر است. همچنین، فرض پژوهش بر روش‌های استاندارد تولید متن (مانند greedy decoding) است و تمام حالات مختلف تنظیمات مدل، دخالت انسان یا شیوه‌های پیچیده‌تر نمونه‌برداری را لحاظ نمی‌کند.

پژوهش‌های آینده ممکن است بررسی کنند که آیا تغییر دما (temperature) که میزان تصادفی‌بودن خروجی را کنترل می‌کند می‌تواند باعث تغییر در سقف خلاقیت شود یا خیر. همچنین شاید بتوان با استفاده از یادگیری تقویتی، وزنی بیشتر به اصالت داد بدون آنکه انسجام متن از بین برود. مطالعات چندزبانه نیز می‌تواند نشان دهد آیا این محدودیت ریاضی در زبان‌ها و فرهنگ‌های مختلف ثابت است یا نه.

به گزارش (psypost) کروپلی در پایان نتیجه‌گیری می‌کند: «برای اینکه هوش مصنوعی به سطح خلاقیت حرفه‌ای برسد، باید معماری‌های کاملاً جدیدی طراحی شود که بتواند ایده‌هایی فراتر از الگو‌های آماری گذشته تولید کند. تا زمانی که چنین تحول بنیادی رخ ندهد، شواهد نشان می‌دهد انسان همچنان تنها منبع خلاقیت سطح بالا باقی می‌ماند.»

source

توسط argbod.ir

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *