ChatGPT та інші моделі ШІ не змогли скласти українське ЗНО: результати дослідження

Українські дослідники протестували найпопулярніші моделі штучного інтелекту (ШІ) за завданнями ЗНО, але набрати понад 70% правильних відповідей не змогла жодна з них. Про це повідомляє медіа dev.ua з посиланням на дослідження.

Розробники представили ZNOVision – це перший багатоформатний тест, який перевіряє можливості штучного інтелекту працювати з українською мовою, освітнім контентом і національною культурою.

ZNOVision складається з понад 4300 завдань, поділених на 13 категорій: від фізики та математики до історії й літератури. Понад половина завдань містить візуальний компонент – схеми, діаграми, карти, малюнки.

Для обробки запитань та розгортання моделей команда використала хмарну інфраструктуру De Novo, яка надала доступ до GPU кластерів у приватній хмарі, сертифікованій за державними вимогами КСЗІ.

Жодна з моделей не набрала 70 % правильних відповідей.

Для порівняння, випадковий вибір дав би 22%. Помилки найчастіше траплялись у складних візуально-текстових завданнях: моделі не розпізнавали українські слова на зображеннях, плутали одиниці виміру, ігнорували частину формулювання.

У наборі VQAUA (візуальні запитання) моделі показали такі результати: Claude – 26,7%, GPT4o – 29%, Qwen2VL – 34,4%. Це значно нижче англомовних результатів (> 60 %) й свідчить про відсутність підтримки української мови на рівні мультимодальних представлень.

Раніше директорка Українського центру оцінювання якості освіти (УЦОЯО) Тетяна Вакуленко повідомила, що у майбутньому ШІ хочуть залучати до перевірки НМТ (ЗНО) як третього екзаменатора.

Джерело

← Попередня стаття

Командувач армії США в Європі заявив про готовність знищити Калінінградську область

Наступна стаття →

Скоро Оля буде бабусею: мережа відреагувала на весілля доньки Полякової

ChatGPT та інші моделі ШІ не змогли скласти українське ЗНО: результати дослідження

ChatGPT та інші моделі ШІ не змогли скласти українське ЗНО: результати дослідження

Осінь 2025: новинки M-Tac у каталозі воєнторгу Militarist

Новий крок до підтримки платників: у Дніпрі з'явився Офіс податкових консультантів

У Дніпропетровській області п’яний чоловік до смерті забив двох пенсіонерів

У Чернівцях замінували ЧНУ та ще декілька навчальних закладів і адмінбудівель

На Буковині затримали заступника голови РВА, який за 500 доларів обіцяв вирішити питання з ТЦК та ВЛК

Гуманітарний штаб організував у Вінниці чергову яскраву акцію для наймолодших вінничан

У Тульчині біля ресторану затримали організатора закордонних подорожей для чоловіків

Карта бойових дій 12 вересня 2025: оперативна інформація з фронту

У Вінницькій громаді проводитимуть безплатну вакцинацію тварин від сказу: дати й локації

Вінничани зареєстрували петицію, щоб зберегти історичний сквер на Стрілецькій

Новина

Оберіть ваше місто

ChatGPT та інші моделі ШІ не змогли скласти українське ЗНО: результати дослідження

ChatGPT та інші моделі ШІ не змогли скласти українське ЗНО: результати дослідження

Рекомендуємо прочитати

Осінь 2025: новинки M-Tac у каталозі воєнторгу Militarist

Новий крок до підтримки платників: у Дніпрі з'явився Офіс податкових консультантів

У Дніпропетровській області п’яний чоловік до смерті забив двох пенсіонерів

У Чернівцях замінували ЧНУ та ще декілька навчальних закладів і адмінбудівель

На Буковині затримали заступника голови РВА, який за 500 доларів обіцяв вирішити питання з ТЦК та ВЛК

Гуманітарний штаб організував у Вінниці чергову яскраву акцію для наймолодших вінничан

У Тульчині біля ресторану затримали організатора закордонних подорожей для чоловіків

Карта бойових дій 12 вересня 2025: оперативна інформація з фронту

У Вінницькій громаді проводитимуть безплатну вакцинацію тварин від сказу: дати й локації

Вінничани зареєстрували петицію, щоб зберегти історичний сквер на Стрілецькій

Новина

Оберіть ваше місто