На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Пронедра

320 подписчиков

Свежие комментарии

  • Сергей Карабухин
    ...Уголовные дела надо открывать...Все фашисты-националисты-бандеровцы – должны быть либо уничтожены – либо седеть за...Зеленский готов в...
  • Лидия Курзаева
    Спасибо! Будем внимательны к своему организму.Прогноз магнитных...
  • Вовладар Даров
    Ненадо создавать панику, ведь этого так хотят враги России!!!!Готовьтесь к подо...

Профессора университетов не замечают ответов Chet-GPT на тестах

Профессора университетов не замечают ответов Chet-GPT на тестах Максим Морозов

94 процента ответов на университетские экзамены, созданных с помощью Chat-GPT, не были обнаружены как сгенерированные искусственным интеллектом, и обычно они получали более высокие баллы, чем работы, отправленные реальными студентами.

Питер Скарф из Университета Рединга в Великобритании и его коллеги использовали Chat-GPT, чтобы дать ответы на 63 вопроса по пяти модулям университетского курса психологии. Студенты сдавали эти экзамены дома, поэтому им разрешалось просматривать конспекты и ссылки, а также потенциально можно было использовать искусственный интеллект, хотя это было запрещено.

Ответы, сгенерированные искусственным интеллектом, были представлены вместе с реальными ответами студентов и составили в среднем 5 процентов от общего числа сценариев, отмеченных учеными. Маркерам не сообщили, что они проверяют работы 33 фейковых студентов, чьи имена также были сгенерированы Chet-GPT.

Оценки включали два типа вопросов: короткие ответы и длинные эссе. Инструкции, данные «Чату-GPT», начинались со слов «Включая ссылки на научную литературу, но не в отдельный справочный раздел», а затем копировали экзаменационный вопрос. Во всех модулях только 6 процентов ответов были помечены как потенциально неучеденческие работы, хотя в некоторых модулях ни одна работа, созданная ИИ, не была помечена как подозрительная.

— В среднем ответы ИИ получили более высокие баллы, чем реальные ответы учащихся. Современный ИИ имеет тенденцию бороться с более абстрактными рассуждениями и интеграцией информации. Но во всех 63 ответах от искусственного интеллекта была вероятность 83,4 процента, что работа искусственного интеллекта превзойдет работу студентов, — рассказал Скарф.

Исследователи утверждают, что их работа является крупнейшим и наиболее надежным исследованием такого рода на сегодняшний день. Хотя в исследовании рассматривалась только работа выпускников психологических факультетов Университета Рединга, Скарф считает, что это беспокоит весь академический сектор.

— Результаты показывают именно то, что я ожидал увидеть. Мы знаем, что искусственный интеллект может дать разумные ответы на простые, ограниченные по тексту вопросы, — сказал Томас Ланкастер из Королевского колледжа Лондона.

Он отметил, что неконтролируемые оценки, в том числе короткие ответы, всегда чреваты мошенничеством.

— Справиться с источником этой проблемы будет практически невозможно. Поэтому вместо этого сектор должен переосмыслить то, что он оценивает. Я думаю, что сектору в целом потребуется признать тот факт, что нам нужно будет встроить искусственный интеллект в оценки, которые мы даем нашим студентам, — заключил Скарфф.

 

Ссылка на первоисточник

Картина дня

наверх