DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

DeepSeek, китайська компанія, що спеціалізується на розробці великих мовних моделей, випустила оновлення своєї моделі R1 — DeepSeek-R1-0528. Це оновлення спрямоване на покращення здатності моделі до логічного мислення та інференції, завдяки використанню додаткових обчислювальних ресурсів та оптимізації алгоритмів на етапі посттренування. Про це пише TechCrunch.

Модель DeepSeek-R1-0528 демонструє високу продуктивність у задачах, пов’язаних з математикою, програмуванням та загальною логікою. Зокрема, вона перевершує моделі xAI’s Grok 3 mini та Alibaba’s Qwen 3 у генерації коду, поступаючись лише OpenAI’s o4 mini та o3.

DeepSeek-R1-0528 доступна на платформі Hugging Face під ліцензією MIT, що дозволяє її комерційне використання. Це сприяє ширшому впровадженню моделі в дослідницьких та комерційних проєктах. Однак варто зазначити, що модель має значний розмір — 685 мільярдів параметрів, що ускладнює її використання на звичайному споживчому обладнанні.

Початкова версія моделі R1 була представлена DeepSeek у січні 2025 року та відзначилася високою продуктивністю при значно нижчих витратах на тренування порівняно з конкурентами. Це викликало значний інтерес у галузі штучного інтелекту та сприяло зростанню популярності компанії.

Очікується, що в майбутньому DeepSeek представить ще більш потужну модель R2, яка була анонсована раніше, але її реліз поки що не відбувся.

Оновлення моделі DeepSeek-R1 до версії 0528 підкреслює прагнення компанії до постійного вдосконалення своїх технологій та підтримки відкритості в галузі штучного інтелекту. Це створює нові можливості для дослідників та розробників, заохочуючи подальший розвиток інновацій у сфері AI.

1882

Джерело

← Попередня стаття

Манчестер Сіті вступає в гонку за Райана Шеркі

Наступна стаття →

Завод "Галичфарм" у Львові продали за борги. Хто новий власник?

DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

2K Games скасувала ремейк BioShock на тлі проблем із розробкою BioShock 4

Anthropic обмежила OpenAI доступ до моделей Claude через порушення умов

Vogue показав ШІ-модель у рекламі Guess — модна індустрія на межі змін

Microsoft несподівано пропонує оновлення до Windows 11 на несумісних ПК

Український режисер виграв справу проти HBO через незаконне використання відео у серіалі «Чорнобиль»

10 несподіваних способів використовувати порт смартфона: від флешок до телевізорів

Земля може перебувати в гігантській космічній порожнечі, що викривлює уявлення про Всесвіт — нова гіпотеза астрофізиків

Фахівці назвали 10 найпродуктивніших смартфонів 2025 року

THQ анонсували Darksiders 4: повернення вершників Апокаліпсису

Wi-Fi 8 не буде швидшим — зате стане надійнішим: що зміниться у новому стандарті

Новина

Оберіть ваше місто

DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

DeepSeek оновила свою AI-модель R1 та виклала її на Hugging Face

Рекомендуємо прочитати

2K Games скасувала ремейк BioShock на тлі проблем із розробкою BioShock 4

Anthropic обмежила OpenAI доступ до моделей Claude через порушення умов

Vogue показав ШІ-модель у рекламі Guess — модна індустрія на межі змін

Microsoft несподівано пропонує оновлення до Windows 11 на несумісних ПК

Український режисер виграв справу проти HBO через незаконне використання відео у серіалі «Чорнобиль»

10 несподіваних способів використовувати порт смартфона: від флешок до телевізорів

Земля може перебувати в гігантській космічній порожнечі, що викривлює уявлення про Всесвіт — нова гіпотеза астрофізиків

Фахівці назвали 10 найпродуктивніших смартфонів 2025 року

THQ анонсували Darksiders 4: повернення вершників Апокаліпсису

Wi-Fi 8 не буде швидшим — зате стане надійнішим: що зміниться у новому стандарті

Новина

Оберіть ваше місто