به گزارش فردای خبر به نقل از خبرنگار علم و فناوری ایسکانیوز؛ این تیم تحقیقاتی نه تنها خواستار مجموعهای از اقدامات برای کاهش سیل مقالات «کمکیفیت» و «علمی تخیلی» شده، بلکه اعلام کرده از این به بعد باید از فرآیندهای قویتر بررسی همتا و استفاده از داوران آماری برای مجموعه دادههای پیچیده استفاده کرد.
محققان در مطالعهای که در PLOS Biology منتشر شد، مقالاتی را بررسی کردند که با استفاده از یک مجموعه داده دولتی آمریکا به نام «بررسی ملی سلامت و تغذیه» که بین سالهای ۲۰۱۴ تا ۲۰۲۴ منتشر شده است، ارتباطی بین یک پیشبینیکننده و یک وضعیت سلامتی را پیشنهاد میکردند.
این مجموعه داده یک مجموعه داده بزرگ و در دسترس عموم است که توسط محققان در سراسر جهان برای مطالعه ارتباط بین شرایط سلامتی، سبک زندگی و پیامدهای بالینی استفاده میشود. این تیم دریافت که بین سالهای ۲۰۱۴ تا ۲۰۲۱، هر ساله فقط چهار مطالعه مبتنی بر انجمن سلامتی، سبک زندگی و پیامدهای بالینی منتشر میشد، اما این تعداد در سال ۲۰۲۲ به ۳۳، در سال ۲۰۲۳ به ۸۲ و در سال ۲۰۲۴ به ۱۹۰ افزایش یافت.
دکتر «مت اسپیک»، یکی از نویسندگان این مطالعه از دانشگاه ساری، میگوید: در حالی که هوش مصنوعی پتانسیل واضحی برای کمک به جامعه علمی در دستیابی به پیشرفتهایی دارد که به نفع جامعه است، مطالعه ما نشان میدهد که این فناوری همچنین بخشی از یک طوفان کامل است که میتواند به پایههای دقت علمی آسیب برساند.
او میافزاید: ما شاهد افزایش مقالاتی بودهایم که علمی به نظر میرسند، اما در بررسیهای دقیق دوام نمیآورند و بیشتر داستانهای علمی تخیلی هستند که از مجموعه دادههای ملی سلامت برای پنهان کردن خود به عنوان واقعیت علمی استفاده میکنند. استفاده از این مجموعه دادههای به راحتی در دسترس از طریق APIها (رابط کاربری اپلیکیشن) همراه با مدلهای زبانی بزرگ، برخی از مجلات و داوران همکار را تحتالشعاع قرار میدهد و توانایی آنها را برای ارزیابی تحقیقات معنادارتر کاهش میدهد. و در نهایت کیفیت کلی علم را تضعیف میکند.
این مطالعه نشان داد که بسیاری از مقالات پس از سال ۲۰۲۱ از رویکردی سطحی و بیش از حد ساده برای تجزیه و تحلیل استفاده کردهاند که اغلب بر متغیرهای منفرد تمرکز میکنند؛ در حالی که توضیحات واقعبینانهتر و چند عاملیتر از ارتباط بین شرایط سلامتی و علل بالقوه را نادیده میگیرند.
برخی از مقالات بدون توجیه، زیرمجموعههای محدودی از دادهها را گلچین کردهاند و نگرانیهایی را در مورد عملکرد ضعیف تحقیق، از جمله لایروبی دادهها یا تغییر سوالات تحقیق پس از مشاهده نتایج، ایجاد کردهاند.
«تولسی سوچاک»، محقق تحصیلات تکمیلی در دانشگاه ساری و نویسنده اصلی این مطالعه، میگوید: ما سعی نداریم دسترسی به دادهها را مسدود کنیم یا افراد را از استفاده از هوش مصنوعی در تحقیقات خود بازداریم. ما خواستار بررسیهای عقل سلیم هستیم. این شامل مواردی مانند شفاف بودن در مورد نحوه استفاده از دادهها، اطمینان از مشارکت داوران با تخصص مناسب و علامتگذاری زمانی است که یک مطالعه فقط به یک قطعه از پازل نگاه میکند.
این تغییرات لزوماً پیچیده نیستند، اما میتوانند به مجلات کمک کنند تا آثار کمکیفیت را زودتر تشخیص دهند و از یکپارچگی انتشارات علمی محافظت کنند.
این تیم برای کمک به مقابله با این مشکل، چندین گام عملی برای مجلات، محققان و ارائهدهندگان دادهها تعیین کرده است. آنها توصیه میکنند که محققان از کل مجموعه دادههای موجود استفاده کنند، مگر اینکه دلیل روشن و واضحی برای انجام کار دیگری وجود داشته باشد و در مورد اینکه کدام بخش از دادهها، در چه دورههای زمانی و برای کدام گروهها استفاده شده است، شفاف باشند.
محققان برای مجلات پیشنهاد میکنند که با مشارکت داوران با تخصص آماری و استفاده بیشتر از رد اولیه مقالات توسط میز تحریر، بررسی همتا را تقویت کنند تا تعداد مقالات فرمولی یا کمارزش وارد شده به سیستم کاهش یابد. در نهایت، آنها پیشنهاد میکنند که ارائهدهندگان دادهها شمارههای درخواست یا شناسههای منحصر به فردی را برای ردیابی نحوه استفاده از مجموعه دادههای باز اختصاص دهند - سیستمی که در حال حاضر برای برخی از پلتفرمهای دادههای سلامت بریتانیا وجود دارد.
«آنیتی ای. آلیو»، یکی از نویسندگان این مطالعه و دانشجوی کارشناسی ارشد دانشگاه ساری، میگوید: ما معتقدیم که در عصر هوش مصنوعی، انتشار علمی به محافظهای بهتری نیاز دارد. پیشنهادات ما موارد سادهای هستند که میتوانند به جلوگیری از نادیده گرفته شدن مطالعات ضعیف یا گمراهکننده کمک کنند، بدون اینکه مزایای هوش مصنوعی و دادههای باز را مسدود کنند.
او میافزاید: این ابزارها اینجا هستند که بمانند، بنابراین باید همین حالا برای محافظت از اعتماد به تحقیقات اقدام کنیم.