• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

مدل‌های استدلالی هوش مصنوعی به آن هوشمندی تبلیغ‌شده نیستند

نرگس چالوک نوشته شده توسط نرگس چالوک
سه‌شنبه 20 خرداد 1404 - 13:15
در اخبار هوش مصنوعی, فناوری
مدل‌های استدلالی هوش مصنوعی به آن هوشمندی تبلیغ‌شده نیستند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران شرکت اپل اعلام کرده‌اند که مدل‌های استدلالی هوش مصنوعی (Reasoning Models) به اندازه‌ای که تبلیغ می‌شود، «هوشمند» نیستند.

به گزارش تک‌ناک، مدل‌های استدلالی، مانند Claude متعلق به شرکت Anthropic، o3 از OpenAI و R1 از DeepSeek، نسل پیشرفته‌تری از مدل‌های زبانی بزرگ (LLMs) هستند که برای دستیابی به دقت بالاتر، از توان محاسباتی و زمان بیشتری استفاده می‌کنند.

رشد این مدل‌ها باعث شد شرکت‌های بزرگ فناوری مجدد ادعا کنند که ممکن است در آستانه توسعه هوش عمومی مصنوعی (AGI) باشند؛ سیستم‌هایی که از انسان در اغلب وظایف پیشی می‌گیرند. اما مطالعه جدیدی که در تاریخ ۷ ژوئن در وب‌سایت تحقیقاتی اپل منتشر شده، ضربه‌ای جدی به این ادعاها وارد کرده است. پژوهشگران می‌گویند که مدل‌های استدلالی نه‌تنها توانایی استدلال عمومی را نشان نمی‌دهند، بلکه با پیچیده‌تر شدن وظایف، دقت آنها به‌طور کامل فرو می‌ریزد.

محققان اپل در این زمینه گفتند:

«از طریق آزمایش‌های گسترده روی معماهای متنوع، نشان دادیم که مدل‌های پیشرفته استدلالی در برابر پیچیدگی‌های بالا دچار فروپاشی کامل در دقت می‌شوند. همچنین آنها یک محدودیت مقیاسی متناقض از خود نشان می‌دهند: تلاش برای استدلال با افزایش پیچیدگی مسائل تا حدی افزایش می‌یابد، سپس کاهش پیدا می‌کند؛ این موضوع حتی با وجود تخصیص مناسب از توکن‌ها دیده می‌شود.»

مدل‌های استدلالی هوش مصنوعی به آن هوشمندی که تصور می شد نیستند

مدل‌های زبانی بزرگ از طریق جذب حجم انبوهی از داده‌های انسانی آموزش می‌بینند و با استخراج الگوهای آماری از این داده‌ها، به تولید پاسخ می‌پردازند. در مدل‌های استدلالی، از روش «زنجیره‌ فکر» (Chain-of-Thought) برای بهبود دقت استفاده می‌شود؛ یعنی مدل گام‌به‌گام منطق خود را بیان می‌کند تا مانند انسان به نتیجه برسد.

اما این روند، برخلاف تصور، مبتنی بر «درک واقعی» نیست، بلکه صرفاً بر پایه حدس‌های آماری است. همین مسئله باعث می‌شود که این مدل‌ها دچار پدیده‌ای موسوم به «توهم‌زایی» شوند؛ یعنی پاسخ‌های اشتباه، گمراه‌کننده یا حتی خطرناک تولید کنند.

گزارشی فنی از OpenAI نشان می‌دهد که مدل‌های استدلالی هوش مصنوعی نسبت به مدل‌های عمومی، بیشتر مستعد توهم‌زایی هستند. به‌ عنوان مثال، مدل‌های o3 و o4-mini هنگام خلاصه‌سازی اطلاعات درباره‌ افراد، به ترتیب در ۳۳ و ۴۸ درصد مواقع دچار خطا شدند، در حالی‌ که این نرخ در مدل o1 تنها ۱۶ درصد بود. خود OpenAI نیز اذعان دارد که دلیل این مسئله روشن نیست و «نیاز به تحقیقات بیشتر» دارد.

در ادامه مطالعه اپل آمده است: «ما معتقد هستیم که فقدان تحلیل‌های سیستماتیک درباره‌ این پرسش‌ها، به محدودیت‌های الگوهای ارزیابی فعلی بازمی‌گردد. آزمون‌های موجود عمدتاً بر سنجه‌های ریاضی و کدنویسی متمرکز هستند، که علاوه‌ بر آلودگی‌های داده‌ای، امکان کنترل شرایط تجربی را فراهم نمی‌کنند.»

پژوهشگران اپل برای بررسی دقیق‌تر، مجموعه‌ای از مدل‌های عمومی و استدلالی (از جمله o1، o3، Claude 3.7، R1، Gemini) را روی چهار معمای کلاسیک آزمایش کردند، که شامل عبور از رودخانه، پرش مهره‌ها، چیدن بلوک‌ها و برج هانوی بود. سطح پیچیدگی این معماها نیز در سه سطح تنظیم شده بود.

مدل‌های عمومی در سطح پایین، عملکرد بهتری داشتند، چرا که زنجیره‌های استدلالی مدل‌های پیشرفته، هزینه محاسباتی بیشتری داشتند. با افزایش پیچیدگی، مدل‌های استدلالی برای مدتی برتری پیدا کردند، اما در نهایت، در مواجهه با مسائل بسیار پیچیده، عملکرد هر دو گروه «به صفر رسید».

پژوهشگران مشاهده کردند که پس از عبور از یک آستانه مشخص، مدل‌های استدلالی هوش مصنوعی حتی تعداد توکن‌های اختصاص‌داده‌شده را کاهش دادند و زنجیره استدلال را رها کردند؛ حتی در حالتی که پاسخ صحیح در اختیار آنها قرار گرفت. برای مثال، مدل‌ها در معمای برج هانوی توانستند تا ۱۰۰ حرکت درست انجام دهند، اما در معمای عبور از رودخانه، بیش از ۵ حرکت صحیح نداشتند.

نتایج نشان می‌دهد که این مدل‌ها بیشتر به شناسایی الگو متکی هستند. با وجود این، پژوهشگران اپل نیز به محدودیت‌های پژوهش خود اذعان دارند و تأکید کرده‌اند که دامنه معماها، نماینده‌ کامل تمام وظایف ممکن نیست.

شرکت اپل نیز در رقابت هوش مصنوعی از رقبا عقب افتاده است. طبق یک بررسی، سیری، دستیار صوتی اپل، ۲۵ درصد کم‌دقت‌تر از ChatGPT گزارش شده و اپل به جای تمرکز بر مدل‌های عظیم، بر توسعه‌ هوش مصنوعی کارآمد و مبتنی بر پردازش درون‌دستگاهی متمرکز شده است.

برخی این رویکرد را به دیده‌ طعنه نگریسته‌اند. پدروس دومینگوس، استاد بازنشسته دانشگاه واشنگتن، در پستی در X نوشت: «استراتژی جدید و درخشان اپل برای هوش مصنوعی این است که ثابت کند اصلاً وجود ندارد!»

با وجود این، برخی پژوهشگران این مطالعه را به‌ عنوان زنگ هشدار مهمی در برابر ادعاهای اغراق‌آمیز در مورد هوش مصنوعی ارزیابی کرده‌اند. آندری بوروکوف، کارشناس هوش مصنوعی و رهبر پیشین تیم یادگیری ماشین در شرکت گارتنر در X نوشت: «اپل با انتشار مقاله‌ای داوری‌شده نشان داد که مدل‌های زبانی بزرگ، صرفاً شبکه‌های عصبی هستند و تمام محدودیت‌های همین شبکه‌ها را دارند. شاید حالا دوباره به مسیر علم واقعی بازگردیم؛ مدل‌ها را نه مانند یک روان‌شناس بلکه مانند ریاضی‌دان مطالعه کنیم.»

نرگس چالوک

نرگس چالوک

مطالب مرتبط

مدل جدید DLSS مبتنی بر Transformer از حالت آزمایشی خارج شد؛ جهش بزرگ انویدیا در بهبود کیفیت تصویر و عملکرد
فناوری

DLSS 4 مبتنی‌بر Transformer؛ جهش بزرگ انویدیا در پردازش تصویر بازی‌ها

نوشته شده توسط امیرحسین یونس
4 تیر 1404
گوگل مدل جدید Imagen 4 را معرفی کرد؛ بهبود قابل توجه در تولید تصاویر متنی با نسخه Ultra
اخبار هوش مصنوعی

گوگل Imagen 4 را معرفی کرد؛ تولید تصویر با متن دقیق‌تر از همیشه

نوشته شده توسط امیرحسین یونس
4 تیر 1404
استاندارد جدید HDMI 2.2 با پشتیبانی از ویدئوی 16K و پهنای باند ۹۶ گیگابیت معرفی شد
فناوری

استاندارد HDMI 2.2 با پهنای باند ۹۶ گیگابیت‌برثانیه و پشتیبانی از 16K از راه رسید

نوشته شده توسط امیرحسین یونس
4 تیر 1404
گوگل ابزار هوش مصنوعی ترمینالی «Gemini CLI» را با قابلیت متن‌باز معرفی کرد
اخبار هوش مصنوعی

Gemini CLI؛ ابزار تازه گوگل برای فتح بازار ابزارهای کدنویسی هوش مصنوعی

نوشته شده توسط امیرحسین یونس
4 تیر 1404
دستگاه متن‌باز Dream Recorder رؤیاهای بازگو شده را به فیلم‌های خیال‌انگیز هوش مصنوعی تبدیل می‌کند. این ابزار مستقل و آفلاین، پلی میان ذهن ناخودآگاه و فناوری نوین می‌سازد.
اخبار هوش مصنوعی

این دستگاه رؤیاهای شما را به فیلم‌های هوش مصنوعی تبدیل می‌کند

نوشته شده توسط سید محمد برازنده
4 تیر 1404
خبر بعدی
اتریوم از مرز ۲٬۷۰۰ دلار عبور کرد؛ آیا مقصد بعدی ۳٬۰۰۰ دلار خواهد بود؟

اتریوم از مرز ۲٬۷۰۰ دلار عبور کرد؛ آیا مقصد بعدی ۳٬۰۰۰ دلار خواهد بود؟

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

khordad1404 khordad1404 khordad1404

پیشنهادی

سندیا از ابررایانه‌ای با طراحی الهام‌گرفته از مغز انسان رونمایی کرد

این ابرکامپیوتر با الهام‌ از مغز انسان ساخته شده است

17 خرداد 1404
«دروازه جهنم» ترکمنستان پس از نیم‌قرن خاموش می‌ شود

«دروازه جهنم» ترکمنستان پس از نیم‌قرن خاموش می‌ شود

19 خرداد 1404

داغ‌ترین‌های روز

جنگنده‌های مدرن چین ؛ گزینه‌ بالقوه نوسازی ناوگان هوایی ایران

جنگنده‌های مدرن چین ؛ گزینه‌ بالقوه نوسازی ناوگان هوایی ایران

4 تیر 1404
پوکو C65

پوکو C65 ؛ پایین رده‌ای خوش‌قیمت با دوربین 50 مگاپیکسلی

1 تیر 1404
اینترنت استارلینک، ایران و واقعیت ماجرا

اینترنت استارلینک، ایران و واقعیت ماجرا

26 خرداد 1404
گوشی پوکو F7 با تراشه اسنپدراگون 8s نسل ۴ و باتری ۷۵۵۰ میلی‌آمپرساعتی رونمایی شد

رونمایی گوشی قاتل پرچم‌دار جدید شیائومی با تراشه اسنپدراگون 8s نسل 4

3 تیر 1404
بهترین گوشی های بازار متناسب با هر بودجه

بهترین گوشی های بازار متناسب با هر بودجه

23 خرداد 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بررسی کامل رونمایی‌ها و افشاهای موبایلی در ژوئن ۲۰۲۵ – پرچمداران، تاشوها و گوشی‌های گیمینگ

گوشی‌های مطرح معرفی‌شده در ژوئن ۲۰۲۵؛ از پرچمداران هواوی تا شاسی‌بلند شیائومی

4 تیر 1404
افشای Spigen از نمایشگر بزرگ‌تر آیفون ۱۷؛ احتمال طراحی جدید و ارتقاء سخت‌افزاری

آیفون ۱۷ احتمالاً با نمایشگر ۶/۳ اینچی و نرخ نوسازی ۱۲۰ هرتز عرضه می‌شود

4 تیر 1404
آمازفیت Balance 2؛ ساعت هوشمند جدید با قابلیت غواصی، نمایشگر AMOLED و عمر باتری ۲۱ روزه معرفی شد

ساعت هوشمند امیزفیت Balance 2 با قابلیت غواصی و عمر باتری ۲۱ روزه معرفی شد

4 تیر 1404
مصالحه‌ای دیگر در پیکسل ۱۰ گوگل؛ خبری از سیستم خنک‌کننده محفظه بخار نیست

پیکسل ۱۰ گوگل بدون سیستم خنک‌کننده بخار عرضه می‌شود؟

4 تیر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir