Головна » Технології / Новини » Наскільки розумний ChatGPT?

Мовна модель ChatGPT, розроблена OpenAI, останнім часом стала неймовірно популярною завдяки своїй здатності генерувати людські відповіді в широкому діапазоні обставин. Насправді ChatGPT став настільки компетентним, що студенти та учні тепер використовують його, щоб допомогти собі із домашнім завданням. Це спонукало кілька шкільних округів США заблокувати пристроям доступ до моделі штучного інтелекту під час підключення до інтернету.




Отже, наскільки розумний ChatGPT? У технічному звіті, опублікованому 27 березня 2023 року, OpenAI надала вичерпну інформацію про свою останню модель, відому як GPT-4. У цей звіт додано набір результатів іспитів, які були візуалізувані Visual Capitalist.

ChatGPT-4 проти ChatGPT-3.5

Щоб перевірити можливості ChatGPT, OpenAI змоделював тести для різних професійних і академічних іспитів. Сюди входять cхоластичні тести оцінювання, адвокатські та різноманітні іспити.

Ефективність вимірювалася в процентилях, які базувалися на останніх доступних розподілах балів для учасників кожного типу іспиту. Процентильна оцінка — це спосіб оцінки власної продуктивності відносно продуктивності інших. Наприклад, якщо Ви потрапили в 60-й процентиль на тесті, це означає, що ви набрали більше ніж 60% учасників цього тесту.

Категорія Екзамен GPT-4
(процентиль)
GPT-3.5
(процентиль)
Закон Єдиний адвокатський іспит 90 10
Закон Вступний тест на юридичний факультет 88 40
Схоластичний тест оцінювання Читання та письмо на основі доказів 93 87
Схоластичний тест оцінювання Математика 89 70
Випускний іспит Кількісний 80 25
Випускний іспит Вербальний 99 63
Випускний іспит Письмо 54 54
Різноманітні іспити Біологія 85 62
Різноманітні іспити Обчислення 43 0
Різноманітні іспити Хімія 71 22
Різноманітні іспити Фізика 66 30
Різноманітні іспити Психологія 83 83
Різноманітні іспити Статистика 85 40
Різноманітні іспити Англійська мова 14 14
Різноманітні іспити Англійська література 8 8
Конкурсне програмування Рейтинг Codeforces
(змагання зі спортивного програмування)
<5 <5

GPT-4 (випущений у березні 2023 року) набагато ефективніший за GPT-3.5 (випущений у березні 2022 року) у більшості цих іспитів. Однак, він не зміг покращити свої знання з англійської мови та програмування.

ChatGPT-4 проти ChatGPT-3.5 (Visual Capitalist)

Поділитися:
Правила коментування

Вітаємо Вас на сайті Pingvin Pro. Ми докладаємо всіх зусиль, аби переконатися, що коментарі наших статей вільні від тролінгу, спаму та образ. Саме тому, на нашому сайті включена премодерація коментарів. Будь ласка, ознайомтеся з кількома правилами коментування.

  1. Перш за все, коментування відбувається через сторонній сервіс Disqus. Модератори сайту не несуть відповідальність за дії сервісу.
  2. На сайті ввімкнена премодерація. Тому ваш коментар може з’явитися не одразу. Нам теж інколи треба спати.
  3. Будьте ввічливими – ми не заохочуємо на сайті грубість та образи. Пам’ятайте, що слова мають вплив на людей! Саме тому, модератори сайту залишають за собою право не публікувати той чи інший коментар.
  4. Будь-які образи, відкриті чи завуальовані, у бік команди сайту, конкретного автора чи інших коментаторів, одразу видаляються. Агресивний коментатор може бути забанений без попереджень і пояснень з боку адміністрації сайту.
  5. Якщо вас забанили – на це були причини. Ми не пояснюємо причин ані тут, ані через інші канали зв’язку з редакторами сайту.
  6. Коментарі, які містять посилання на сторонні сайти чи ресурси можуть бути видалені без попереджень. Ми не рекламний майданчик для інших ресурсів.
  7. Якщо Ви виявили коментар, який порушує правила нашого сайту, обов’язково позначте його як спам – модератори цінують Вашу підтримку.

Схожі новини

Джефф Безос
💬
📰 Новини

Оренда ПК: Безос про майбутнє ШІ та хмарні ПК

Джефф Безос припускає, що розвиток ШІ може змусити користувачів орендувати потужності компʼютера в хмарі. Tom’s Guide опублікував матеріал. У ньому пояснюється ця думка в контексті зростання апаратних вимог сучасних моделей ШІ та проблеми з доступністю модулів ОЗП. Видання зазначає, що дефіцит ОЗП ускладнює модернізацію локальних ПК. Підвищення цін робить її дорожчою й менш доступною для […]


Гібридне бондування (hybrid bonding)
💬
📰 Новини

Гібридне бондування: Samsung готує технологічний ривок

Гібридне бондування стає ключовою темою в розвитку памʼяті та пакування мікросхем. Цей метод зʼєднує метали і оксиди шарів напряму, що скорочує довжину трас і зменшує паразитні опори. Samsung, SK hynix та Micron уже переходять від лабораторних випробувань до промислових зразків. Samsung планує надати зразки HBM4 у 2025 році і перейти до масового виробництва в 2026 […]


⬆️